داده های بزرگ چیست؟

چگونه می توانیم داده های بزرگ را تعریف کنیم و چه چیزی را به عنوان یک تحلیل بزرگ داده ها محاسبه کنیم؟

در عصرحاضر زمانی که تقریبا همه چیز به عنوان “داده های بزرگ” شناخته می شود، چگونه آنچه را که “داده های بزرگ” می خوانیم، تجزیه و تحلیل کنیم؟ آیا استفاده از فیلتر برای استخراج چند میلیون توییت از  تریلیون داده ها به عنوان «اطلاعات بزرگ» استفاده می شود؟ امروزه چه چیزی را باید دقیقا “داده های بزرگ” در نظر بگیریم؟
آیا یک جستجوی کلیدی از مجموعه داده ها که ۱۰۰،۰۰۰ نتیجه را به دست می دهد و به صورت تصادفی  ۱،۰۰۰ توییت  انتخاب شده است، واقعا به عنوان یک تجزیه و تحلیل داده های بزرگ محسوب می شود؟

در سال ۲۰۱۳ انبار داده های سازمانی داخلی فیس بوک بیش از PB  ۲۵۰(پتا بایت)  داده را نگهداری کرد. با این حال، با توجه به حجم عظیم داده ها، تنها ۳۲۰ TB(ترابایت) از این اطلاعات را مورد استفاده قرار داد. دراین مورد فیس بوک در سال ۲۰۱۳، با داشتن یک انبارPT 250  بسیار چشم گیر بود و هنوز هم تا سال ۲۰۱۹ بسیار مورد توجه است. با این حال، اکثر تحلیل های توییتر احتمالا تنها بر متن این توییت ها تمرکز می کنند که تنها ۱۱۲٫۷ گیگابایت است که تنها ۴ درصد کل مجموعه داده است را شامل می شود. 

 

اطلاعات بزرگ

به طور خلاصه فیسبوک در آن زمان  فقط یک دهم یک درصد از این اطلاعات را در هر روز مورد بررسی قرار می داد و بقیه بدون استفاده باقی می ماند. حال این سوال مطرح می شود که آیا اندازه مجموعه داده های پایه ای مهم است ؟ آیا اندازه داده های موجود با اندازه اطلاعات واقعی مرتبط است؟

این روند ترسناک از دنیای ” داده های بزرگ” است که باعث می شود ما بر اندازه مجموعه داده هایی که تحلیل می کنیم تمرکز کنیم و نه تعدادی از پایگاه داده های مفید که حاوی آنها هستند. شرکت ها به طور مرتب اندازه انبار داده های خود را به جای پایگاه داده های آنها در نظر می گیرند.

از دیدگاه استخراج مجموعه داده های بزرگ، اندازه فایل این مجموعه داده ها کاملا نامناسب است. از دیدگاه عملیاتی مهم است که اندازه های فشرده شده یک مجموعه داده برای برنامه ریزی شبکه و ذخیره سازی و تخصیص منابع را بدانیم، اما برای تجزیه و تحلیل واقعی خود مقدار داده های مربوطه که در واقع مجموعه داده است، اهمیت دارد.

دقیقا چگونه یک تجزیه و تحلیل داده را اندازه گیری می کنیم و تصمیم می گیریم که آیا آن را واقعا به عنوان یک تجزیه و تحلیل “داده های بزرگ” محسوب کنیم؟

همانطور که ذکر شد، پاسخ های آسان وجود ندارد.

در دنیای داده های امروز، اکثر شرکت ها و حتی دانشگاه ها اغلب آنالیز داده ها را به عنوان یک تجزیه و تحلیل چند ترابایت توصیف می کنند، نه تجزیه و تحلیل دقیق تر “صد گیگابایت”.

 

برای کسب و کارهای امروز، اکثر داده های استفاده نشده بیش از شبکه کامپیوتری خود هستند، اما هیچ وقت واقعا برای سرمایه گذاری در استراتژی کسب و کار از نظر تولید درآمد، بهبود تجربه مشتری یا کمک به افزایش بهره وری کاربر استفاده نشده است. در حالی که ضبط اطلاعات ساده است، استفاده  از آن سهل نیست.

خوشبختانه، سه تکنولوژی همگام  برای حل مشکل بزرگ داده ها ارایه شده است که در ذیل معرفی می شوند.

  1. محاسبات ابری
  2. هوش مصنوعی
  3. تجزیه و تحلیل اطلاعات پیچیده.

این موارد به ایجاد یک طوفان کامل برای شرکت هایی که به دنبال استفاده از قدرت داده های بزرگ هستند منجر می شود.

 

  • محاسبات ابری در کلان داده ها:

به طور خلاصه محاسبات ابر شامل تحویل خدمات محاسبات، سرور، ذخیره سازی، پایگاه داده، شبکه، نرم افزار، تجزیه و تحلیل و.. برای ارائه نوآوری سریع تر، منابع انعطاف پذیر و اقتصاد مقیاس است. محاسبات ابری تغییر بزرگی از شیوه های کسب و کار سنتی در مورد منابع فناوری اطلاعات است.

Big data

 

در اینجا به پنج مزیت از خدمات ابر رایانه که منجر به استفاده سازمان ها می شود، اشاره می کنیم.

الف)هزینه:

محاسبات ابر، هزینه های خرید سخت افزار و نرم افزار را کاهش می دهد و مرکزداده در محل سرور، برق تمام وقت برای قدرت و خنک کاری را راه اندازی و اجرا می کند و کارشناسان فناوری اطلاعات را برای مدیریت زیرساخت آن یاری می دهد.  

ب)سرعت:

اکثر محاسبات ابری، خدمات خود را براساس تقاضا ارائه می دهند، بنابراین حتی مقادیر وسیعی از منابع محاسباتی را می توان در عرض چند دقیقه فراهم کرد، به طور معمول فقط با چند کلیک ماوس، برنامه ریزی و انعطاف پذیری در کسب و کار را فراهم می کند.

ج)بهره وری:

مرکز داده ها معمولا نیاز به نصب و راه اندازی سخت افزار، نرم افزار و دیگر کارهای مدیریت زمان IT دارند. رایانش ابری نیاز به بسیاری از این وظایف را برطرف می کند، بنابراین تیم  فناوری اطلاعات می تواند وقت بیشتری را صرف اهداف مهمتر کسب و کار کند.

د)کارایی:

بزرگترین خدمات محاسبات ابری در یک شبکه جهانی از پایگاه داده های ایمن اجرا می شود که به طور مرتب به آخرین نسل از سخت افزار رایانه سریع و کارآمد ارتقا می یابد. این مزیت، کاهش زمان تاخیر شبکه برای برنامه ها و صرفه جویی بیشتر در مقیاس را برای شرکت فراهم می کند.

ه)امنیت:

بسیاری از ارائه دهندگان ابر مجموعه ای گسترده از سیاست ها، فن آوری ها و کنترل هایی را فراهم می کنند که کلیه امنیت خود را تقویت می کنند و به محافظت از داده ها، برنامه ها و زیرساخت های خود از تهدیدات احتمالی کمک می کنند

  • هوش مصنوعی

منظور از هوش مصنوعی (AI) چیست؟ هوش مصنوعی (AI) محدوده ای از علم رایانه که بر ایجاد ماشینهای هوشمند که کار و واکنش مشابه انسان را تأکید می کند گفته می شود. هدف آن ایجاد ماشین های هوشمند است. برخی از فعالیت های کامپیوتر با هوش مصنوعی طراحی شده اند که عبارتند از: تشخیص گفتار یادگیری برنامه ریزی حل مشکل. هوش مصنوعی بخش مهمی از صنعت فناوری است.

تحقیقات مرتبط با هوش مصنوعی بسیار فنی و تخصصی است. مشکلات اصلی هوش مصنوعی شامل رایانه های برنامه نویسی برای ویژگی های خاصی از قبیل: دانش، استدلال، حل مشکل، ادراک، یادگیری، برنامه ریزی، قابلیت دستکاری و حرکت اشیاء است.

  • تجزیه و تحلیل اطلاعات پیچیده

تجزیه و تحلیل پیشرفته یک اصطلاح چتر برای طیف گسترده ای از تکنیک های تجزیه و تحلیل است که استفاده از تکنیک های پیشرفته محاسبات مانند یادگیری ماشین را شامل می شود.

یادگیری ماشین یک میدان است که هوش مصنوعی، برنامه نویسی کامپیوتر، کسب و کار و فلسفه را با هم ترکیب می کند. یادگیری ماشین در مورد کامپیوترهایی است که مقدار زیادی داده را در بر می گیرد و از آن برای بهترین نتیجه گیری استفاده می شود.
یادگیری ماشین راه را برای انسانها برای حل مسائل با یک رویکرد خاص بازمی کند. ماشین آلات می توانند هر انتخاب ممکن را امتحان کنند و آن را بسیار سریع انجام دهند. اگر یک میلیون گزینه وجود داشته باشد، اما فقط یکی از آنها درست باشد، رایانه می تواند تمام رویدادها را شبیه سازی کند و نتایج سیستم را منظم تعیین کند.

علاوه بر این، شرکت ها باید از ابزارهایی استفاده کنند که هوش مصنوعی و یادگیری ماشین را به منابع داده های شبکه ای بسپارند تا سوالات پیچیده ای را که به سادگی می تواند توسط انسان انجام شود، مورد بررسی قرار دهد.

در نهایت، داده های بزرگ مفید هستند، زمانی که آنها می توانند به حل مسائل پیچیده کمک کنند، بینش های فعالانه را ارائه دهند و پاسخ های واقعی ارائه دهند که ارزشی برای زندگی ما به ارمغان آورد.

 داده های بزرگ

عصر اطلاعات

بیایید با آن برخورد کنیم: جهان یک مکان گیج کننده است! جهان هستی وجود دارد و بشریت در حال توسعه ابزارهای فنی برای مقابله با آن است.  بهتر یا بدتر، ما در عصر اطلاعات زندگی می کنیم. هیچکس نمی داند به کجا می رود، اما همه می رویم تا به آنجا برسیم.  

Sending
User Review
5 (1 vote)

Leave A Reply

Your email address will not be published.