big data چیست؟
بیگ دیتا (big data) یا کلان داده چیست و چه کاربردی دارد؟
مقدمه
جهان امروز مملو از دانش و اطلاعات است. همواره در هر زمینه و هرجا اطلاعات مفید، همراهانی وفادار برای ما خواهند بود. اما گاهی عدم دسترسی صحیح به اطلاعات ما را از بهره مندی اصولی باز می دارد. داده های عظیم که در جهان امروز بیگ دیتا نامیده می شود؛ نیازمند پردازش و ذخیره سازی است. پردازشی که سبب استفاده بهتر و مفید تر از این اطلاعات می گردد. در این مقاله قصد داریم با بیان موارد زیر مفهوم و کاربرد big data را مفصلا شرح دهیم.
فهرست مطالب:
- big data یا کلان داده چیست؟
- ویژگیهای کلان داده چیست
- کاربردهای big data یا کلان داده
- کاربرد big data در پزشکی
- کاربرد Big Data در تجارت
- معرفی ابزار تحلیل بیگ دیتا
- کاربرد Big Data در ایران
- آینده big data
big data یا کلان داده چیست؟
Big Data یا کلان داده در تعریف ساده به معنی حجم عظیمی از اطلاعات است. اطلاعاتی که هر روز در حال افزایش است. هر یک از ما در طول فعالیت روزانه خود با نمونه هایی از آن روبه رو خواهیم شد.
در بیان اصولی تر، بیگ دیتا دارایی هایی اطلاعاتی است که مربوط به یک مجموعه یا سازمان است. این داده ها حجم بالایی دارند، با سرعت زیادی تولید می شوند و یا تنوع گسترده ای دارند. بیگ دیتا نیازمند شیوه های پردازش جدید با هزینه مناسب است. شیوه های پردازشی که در نهایت در اتوماسیون فرایند، تصمیم گیری و بهبود بینش در سازمان ها استفاده می شود.
ویژگیهای کلان داده چیست؟
به طور خلاصه اساسی ترین ویژگی ها در big Data: حجم(Volume)، سرعت(Velocity) و تنوع(Variety) است. وقتی در تعریف بیگ دیتا به اصطلاح ۳V اشاره می شود منظور همین سه ویژگی در آن است. ۳Vرایج ترین نوع تعریف برای این واژه است.
ویژگی های ذکر شده تنها مربوط به داده های بیگ دیتا نیست. بلکه به فناوری ذخیره سازی و پردازش اطلاعات نیز گفته می شود. این فناوری شامل ابزارها و فرایندهایی است که باید دادههای بی ساختار و خیلی بزرگ را فراخوانی کنند.
دو ویژگی دیگری که در ادامه به بیگ دیتا ها نسبت داده شد: غیر قابل پیشبینی (Variability) و صداقت و اعتبار (Veracity) درآن ها است.
در ادامه به بررسی هر یک خواهیم پرداخت.
حجم داده (Volume) :
اولین مشخصه بیگ دیتا، حجم عظیم اطلاعات و داده های درون آن است. مقدار مشخصی برای آن تعریف نمی شود اما میزان به قدری است که توسط انسان قابل پردازش(تحلیل و بررسی) نیست.
میزان حجم دادهها در بررسی بیگ دیتا دارای اهمیت بسیاری است. زیرا دادههای بیگ دیتا شامل انواع مختلف داده های صحیح، ناصحیح، پردازش شده، پردازش نشده و… خواهد بود.
سرعت (Velocity):
سرعت جمعآوری و اضافه شدن اطلاعات به بیگ دیتا یکی دیگر از این ویژگی ها است. با توجه به استفاده از اینترنت در ذخیره ی دادهها، سرعت دریافت اطلاعات بسیار بالا است. برای تحلیل و نتیجهگیری صحیح با کمک بیگ دیتا، باید اطلاعات به سرعت مناسبی بهروزرسانی شوند. اطلاعات قدیمی نمیتوانند نتایج درستی را برای ما به ارمقان بیاورند.
تنوع(Variety):
تنوع در داده های بیگ دیتا بسیار زیاد است. این تنوع، درباره ی راه های دستیابی و فرمت های مختلف داده ها صحبت می کند. چرا که بیگ دیتا میتواند انواع مختلفی از اطلاعات مانند صدا، تصویر، ویدیو، اعداد، ایمیل، پی دی اف و… را شامل بشود.
علاوه بر آن اطلاعات باید از روشهای متفاوتی جمعآوری بشوند تا تصمیمهای بهتری را ایجاد کنند.
غیرقابل پیشبینی (Variability):
عدم ثبات یا غیر قابل پیشبینی بودن داده ها اولین ویژگی بود که به کلان داده ها اضافه شد. اطلاعات در کلان داده به دلیل تغییرات زیاد و سریع، میتواند نتایج متفاوتی را در طول زمان از خود نشان بدهد.
صداقت و اعتبار (Veracity):
آخرین ویژگی بیگ دیتا به صحت اطلاعات میپردازد. در روزهایی که شایعه و اطلاعات نادرست، فراوان است؛ بسیار اهمیت دارد که منبع جمعآوری بیگ دیتا قابل اعتماد باشد. در غیر این صورت نتایج بهدست آمده نیز دچار اشتباه خواهند شد.
کاربردهای big data یا کلان داده
کلان داده در دنیای امروز استفاده های گسترده ای دارد. اگر واژه” کاربرد کلان داده” را در گوگل سرچ کنید. کاربرد کلان داده را در پزشکی، تجارت، بانکداری، حسابداری، حسابرسی و… مشاهده خواهید کرد.
در ادامه به بررسی جزئیات در این مقوله می پردازیم.
کاربرد big data در پزشکی
یکی از حوزه هایی که در بحث بیگ دیتا همواره مورد توجه بوده، حوزه پزشکی و درمان است.
علت توجه به این حوزه دلایل بسیاری دارد که به بررسی چند مورد از آن ها می پردازیم.
۱)در حوزه پزشکی اطلاعات عددی بسیار متنوع و گسترده ای وجود دارد. این اطلاعات را می توان از طریق بیماران به راحتی به دست آورد.
۲) افراد میل همکاری بسیاری را در حوزه سلامت دارند. زیرا می دانند این همکاری دست آورد های مفیدی را برای پزشکان و در نتیجه همه ی انسان ها به همراه دارد.
۳)امروزه نرم افزار ها و ابزارهای بسیار متعددی در حوزه بهداشت و سلامت مورد استفاده قرار می گیرد. در نتیجه داده های فراوانی از این راه تولید می شوند. برای مثال سنسور شتاب سنج بر روی تلفن همراه شما در طول روز، بسیاری از حرکت های شما را ثبت می کند.
در بررسی اهمیت بیگ دیتا در حوزه پزشکی لازم است که بخش های مختلف را از هم تفکیک کنیم.
برای مثال شاخه ی پیش بینی از جمله شاخه هایی است که امید بیشتری نسبت به دیگر حوزه ها در آن دیده می شود. این شاخه پیشرفت های قابل توجهی داشته است. برای مثال پروژه “Google Flu” که هدف آن، پیشبینی روند شیوع آنفولانزا و آمار آن در نقاط مختلف، بر اساس میزان جستجوی کاربران در آن مناطق بود.
شاخهی عارضهیابی از دیگر حوزه هایی است که رشد محسوسی داشته است. پردازش حجم زیاد تصاویر از بیماران، در این شاخه اتفاق می افتد. این امر امیدی را ایجاد کرده که بتوان در آینده فرصتهای ارزشمندی برای عارضهیابی ایجاد کرد.
حوزهی درمان و تصمیمات مربوط به آن، دشوارترین شاخه است. هنوز باید منتظر بمانیم تا در زمان های آینده دستاوردهای قابل توجهی را مشاهده و تجربه کنیم.
کاربرد Big Data در تجارت
بیگ دیتا یا کلان داده برای انواع فعالیتها از جمله فعالیت های تجاری کاربرد فراوان دارد.
شرکتهای تجاری از بیگ دیتا جمع شده بر روی سیستمهای خود استفاده های مختلف میکنند. از جمله این موارد می توان به: ارایه خدمات پس از فروش مناسب تر، کمپینهای تبلیغاتی مفیدتر، سود دهی بیشتر و در نهایت بهبود کلیه عملیاتهای مرکز اشاره کرد.
علاوه بر این شرکتهایی که از بیگ دیتا استفاده میکنند مزیت رقابتی بهتری نسبت به دیگران را شامل می شوند. چرا که آن ها میتوانند تصمیمات درست تر و سریع تری براساس اطلاعات کسب شده، اتخاذ کنند.
معرفی ابزار تحلیل بیگ دیتا
انتخاب ابزار مفید برای تحلیل بیگ دیتا دارای اهمیت بسیار بالایی است. در ادامه شناخته شده ترین ابزارها برای تحلیل بیگ دیتا را معرفی خواهیم کرد.
- Xplenty: سرویسی مبتنی بر فضای ابری است. کاربرد آن پاکسازی و یکپارچه سازی دادهها است.
- Improvado: این ابزار به انواع کسب و کارهای کوچک کمک می کند تا دادهها مورد نظر خودرا یافته و مرتب سازی کنند.
- Analytics: داشبوردی است که امکان تجزیه تحلیل نموداری، بصری و همچنین یکپارچه سازی منابع مختلف را ممکن می سازد.
- Skytree : ازجمله بهترین ابزارها جهت ایجاد مدلهای دقیق پیش بینی است.
- Spark: این ابزار برای تحلیل و پردازش دادههای بزرگ استفاده می شود.
- Hadoop: پلتفرمی متن باز (Open source) جهت پردازش دادهها در مقیاس بزرگ است.
کاربرد Big Data در ایران چیست؟
کلان داده یابیگ دیتا در کشور ما تقریبا در تمام صنایع قابل مشاهده است. در حال حاضر از بیگ دیتا در صنایع غذایی و پزشکی جهت بهبود سلامت و همچنین کیفیت زندگی در جامعه استفاده می شود.
برای مثال در صنعت پزشکی، کلان داده توسط پزشکان برای شناسایی عوامل ریسک بیماریها استفاده میشود. داده ها به آن ها کمک میکند تا بیماریها را بشناسند و برای هر بیمار، راهکار مناسبی تجویز کنند. همچنین این اطلاعات با ذخیره و نگهداری در سیستمهای بهداشتی دولت، جامعه پزشکی را قادر میسازد تا در کمترین زمان از شیوع اپیدمیها باخبر شده و در زمان کوتاه تصمیمهای مناسبی بگیرند.
آینده big data
اینده در دست داده هاست! شاید برای شما هم پیش آمده است که وقتی وارد وب سایتی مثل دیجی کالا می شوید در کمال تعجب ببینید که کالاهایی که در گذشته جستجو کردهاید، به شما پیشنهاد داده میشود. این همان تاثیر جالب و شاید ترسناک بیگ دیتا در حال و آینده ماست.
اغلب شرکت های بزرگ علاقه مند هستند که اطلاعات بیشتری در مورد مشتریان خود کسب کنند. این اطلاعات از راه های مختلفی کسب می شود. یکی از این موارد داده های جستجوی سابق در مرور گر شماست. هر آنچه در اینترنت جستجو می کنید نه فقط مختص شما بلکه مورد توجه افراد بسیاری است. زیرا هدف کسب و کار ها کشف نیاز های شما و استفاده بهینه از آن ها است.
شکی نداریم که از بیگ دیتا در آینده بیشتر شنیده و استفاده خواهد شد؛ چرا که حجم اطلاعات بالا رفته و تکنولوژی فشرده و ذخیرهسازی دادهها ارزانتر خواهد شد.
برای اطلاع بیشتر در این زمینه به شما پیشنهاد می کنیم مقاله” آینده بیگ دیتا“را مطالعه کنید.
جمع بندی
بیگ دیتا(Big Data) یا کلان داده به معنی اطلاعات پرحجمی هستند که به سرعت تولید می شوند. این اطلاعات انواع مختلفی دارند که در حوزه های گوناگون مورد استفاده قرار می گیرند. در جهان امروز بیگ دیتا به شدت مورد توجه است. در این مقاله انواع کاربرد های Big Dataبیان شد. امیدواریم که برای شما مفید واقع شده باشیم.
به شما پیشنهاد می کنیم برای مطالعه بیشتر در چنین زمینه هایی مقاله “معرفی IOT” را دنبال کنید.
دیدگاه شما