داده شامل اطلاعات است؛ اما این همهي ماجرا نیست. جزئیات یک حادثه یا اخباری دربارهی سلامت انسان دادهای نیست که ما با آن سروکار داشته باشیم. وقتی ما از داده صحبت میکنیم درواقع منظورمان مجموعهی داده، سازماندهی و ذخیرهسازی آن است.
در عصر اینترنت شرکتها و سازمانها در سراسر جهان دادههای بسیاری جمعآوری کردهاند که در ادامه به مقیاس گستردهی آنها میپردازیم. اکنون که کلان داده وجود دارد تاثیر بسیار بزرگی بر زندگی ما میگذارد.
کلان داده چیست؟
کلان داده مجموعهی بسیار بزرگی از دادهها است که ابزارهای سنتی ما برای مدیریت این اطلاعات به کار نمیآیند. کلان داده میتواند اشکال مختلفی داشته باشد.
نمونههایی از کلان داده:
- توییتهای ذخیرهشده در سرورهای توییتر
- اطلاعاتی که گوگل از ردیابی خودروهای سواری بهدست میآورد
- مجموعهای کامل از نتایج انتخابات محلی و ملی کشور که ابتداییترین رکوردها را نیز در بر دارد
- اطلاعات شرکتهای بیمه درمانی دربارهی افرادی که تحت درمان قرار میگیرند، نوع معالجات آنها و بیمارستان مورد نظر دارند
- اطلاعات لیست خریدها و مکانهای ثبت شده در کارتهای اعتباری
- اطلاعات زمان، مکان و مدت زمان فیلمهایی که افراد در نتفلیکس تماشا میکنند
فناوری کلان داده چیست؟
رایانههای شخصی ما بطور کلی توانایی مدیریت حجم کمی از دادهها را دارند. کل اطلاعاتی را که میتوانید وارد یک کامپیوتر کنید، در نظر بگیرید؛ در عین حال نرمافزارهای پایگاهداده قابلیت مدیریت حجمهای بزرگتری از اطلاعات را دارند. این ابزارها میتوانند روی دادههای یک درایو سخت قرار بگیرند؛ البته ممکن است به قفسههایی شامل نوتبوکها و پوشهها نیاز داشته باشند. اما این ابزارها برای رسیدگی به کل حجم اطلاعاتی که ما بهعنوان کلان داده به آنها اشاره میکنیم کافی نیستند. به همین خاطر روشهای جدیدی توسعه یافتهاند.
محاسبات ابری کارها را از کامپیوترهای ما روی سرورهای راه دور تخلیه میکند. به همین دلیل روشهای زیادی برای دسترسی و استفاده از اطلاعات وجود دارد.
کاربردهای جالب توجه کلان داده
کلان داده به خودیِ خود به وجود نیامده؛ چندین روند، علت وجود آن را تقویت کردهاند.
اینترنت اشیاء
اینترنتی که شما در حال حاضر میشناسید اینترنت افراد است، جایی که در آن مردم از طریق ماشینهایی تسهیلکننده با یکدیگر ارتباط برقرار میکنند. به عنوان نمونهای از این تعاملات، تصور کنید شما سایتی که دیگران طراحی کردهاند را بازدید میکنید و یا متنی که دیگران در سایت تایپ کردهاند میخوانید.اینترنت اشیاءجایی است که در آن اشیاء بدون دخالت بشر مستقیما با یکدیگر ارتباط برقرار میکنند؛ مثلا یک دستگاهی که بر آبوهوا نظارت میکند در نظر بگیرید؛ ترموستاتی هوشمند به این اطلاعات دسترسی پیدا میکند و درجه حرارت منزل شما را تنظیم میکند.
کلان داده و اینترنت اشیاء کاملا به یکدیگر وابستهاند. سازمانها باید بدانند با حجم انبوهی از اطلاعاتی که جمعآوری میشود، چهکاری باید انجام دهند. اشیاء از طریق اینترنت و به لطف دادههایی که در دسترسشان است میتوانند خودشان اقداماتی را صورت بدهند. هرچه دستگاههای بیشتری به این روش عمل میکنند دادههای بیشتری تولید میشود.
یادگیری ماشین
منظور از یادگیری ماشین در واقع توانایی یادگیری کامپیوتر بر مبنای دادهها است؛ همین توانایی اساس شکلگیری وضعیتهای مختلف رادیو اینترنتی پاندورا به سَبک مخصوص شما است. همچنین یادگیری ماشین در پشت پردهی پیشنهادات محتوای یوتیوب و نتفلیکس قرار دارد.
این پیشبینیها مبتنی بر الگوریتمها هستند. الگوریتم جستجوی گوگل و نیز الگوریتمی که تعیین میکند چه چیزی در فید خبری فیسبوک مشاهده کردهاید همگی مبتنی بر توانایی یادگیری ماشین هستند.
اما اینها بخش کوچکی از چگونگی تاثیر یادگیری ماشین بر زندگی روزمرهی ما هستند.
هوش مصنوعی
هوش مصنوعی گام بعدی پس از یادگیری ماشین است. در هوش مصنوعی نه تنها یادگیری کامپیوتر باز دادهها وجود دارد، بلکه کامپیوتر از این اطلاعات در راستای تصمیمگیری متکی به خود و شکلدهی رفتار خودش استفاده میکند. مایکروسافت و گوگل نمونههایی از تلاش برای ساخت رباتهای انسانی هستند؛ فیسبوک نیز هوش مصنوعی را برای کمک به جلوگیری از خودکشی به کار گرفته است. فناوری به سرعت در حال پیشرفت است، تا جایی که نمونههای متعددی وجود دارد که "تفکر کردنِ کامپیوتر" بهتر از نوع بشریِ آن عمل میکند.
علم تجزیه و تحلیل کلان داده چیست؟
منابع کلان داده به خودی خود هیچگونه اطلاعاتی را در اختیار ما نمیگذارند، در واقع شخصی باید باشد که مفهوم این اطلاعات را دریابد. در واقع کل کاری که در تجزیه و تحلیل کلان داده باید انجام شود به این صورت است: بررسی حجم زیادی از اطلاعات غیر قابل فهم و سپس فهمیدن آنچه میتوان از آن استخراج کرد.
و به همین ترتیب کلان دادهها روی زندگی شما تاثیر میگذارند، حتی اگر یک مخالف تکنولوژی دنیای مدرن باشید. اما چرا به کلان دادهها روی آوردهایم؟ به این علت که با بینش صحیح، کلان دادهها مزایای زیادی دارند.
کاربردهای کلان داده
کلان داده همواره در جهت بهبود روند زندگی کاربرد زیادی داشته است؛ در این بخش برخی از موارد کاربرد کلان داده را بررسی خواهیم کرد:
کلان داده در خدمات بهداشتی، درمانی و سلامت
صنعت بیمه سلامت در زمینه اقتباس تکنولوژیهای جدید سرعت خوبی ندارد. برخی از ارائهدهندگان بیمههای بهداشتی، درمانی و سلامت در حال مهاجرت از کاغذ به ابزارهای ذخیرهسازی دیجیتالی هستند. با این وجود کلان داده در برخی زمینهها تفاوتهایی را ایجاد کرده است؛ یکی از این زمینهها یکپارچگی دادهها است. بیمهگذاران و ارائهدهندگان در حال کار روی ترکیب دادههای منابع مختلف هستند، دادههایی مانند مانند مطالبات، اشعه ایکس، یادداشتها و نسخههای پزشکان.
بسیاری معتقدند که اگر دادههای بیمه سلامت بهتر یکپارچهسازی میشدند میتوانستند بیمهی بهتری با هزینهای کمتر ارائه بدهند. در حالی که آمازون، برکشایر هاتاوی و جان پیرپونت مورگان اوایل سال جاری اعلام کردند در زمینه بیمه سلامت با یکدیگر همکاری میکنند، تکنولوژی را به عنوان نقطه تمرکز خود (مانند صفحه اصلی روزنامه گاردیَن) اعلام کردند.
کلان داده در بانکداری و خدمات مالی
صنعت مالی کاملا مصرّ بر تصمیمگیریهای مبتنی بر تحلیلهای کامپیوتری است. سقوط آنی سهام وال استریت به علت معاملات خودکار از طریق ماشینهایی بود که بدون دخالت انسان سهام را به سرعت با قیمتی پایینتر میفروختند و با توجه به آنچه در بازار درحال رخ دادن بود سایر فروشندگان را وادار به فروش کرده و نسبت به فروش تحریک میکردند. این نوع تجارت، تجارت بسامد بالا نامیده میشود.
اکنون دانشمندانِ دادههای مالی، با استفاده از کلان دادهها پیشبینی میکنند که کدام سهام موفق خواهد بود و کدام یک احتمال دارد سقوط کند. همچنین بانکها هم به کلان دادهها به عنوان راهی برای افزایش درآمد نگاه میکنند.
کلان داده در تجارت الکترونیکی و بازاریابی
بازاریابی مدرن به دادهها وابستگی شدیدی دارد و ما هم با هر خریدی که انجام میدهیم اطلاعات زیادی تولید میکنیم. در این رابطه کلان داده وعدههای بسیاری به حوزهی بازاریابی داده است که اصلی ترین آنها پاسخ به دو نیاز اصلی است.
اول به کمک آنها میتوان درباره شخص خریدار، زمان، مکان، نوع و قیمت خرید اطلاعات کسب کرد؛ و مورد دوم به دست آوردن ارتباطی منطقی بین محصولاتی که مشتریان میبینند یا در موردشان میخوانند یا میشنوند و در نهایت چیزی که خریداری میکنند. برخی فروشگاهها با ردیابی کارتهای اعتباری و وفاداری مشتریان از طریق دوربین یا ردیابی تلفنشان میفهمند کدام بخش از فروشگاه بیشتر توجه آنها را جلب کرده است. مشتریان قبل از خرید باید به صورت آنلاین حسابهایی ایجاد کنند که این کار به سایتها اجازه میدهد نه تنها خریدهای آنها بلکه هر قلمی که آنها مشاهده میکنند را نیز ردیابی کنند.
در عوض تکنیکهایی مثل هدفگیری و شناسایی مشتری که نیمی از بودجهی بازاریابی را هدر میدهند و تنها برای کوتاهمدت اثربخش هستند، پاسخ به این دو نیاز بسیار اثربخشتر است.
در واقع فروشگاهها طرحهای خود را بر مبنای علاقه و رفتار مشتریان پایهگذاری میکنند تا شرایط همکاری بهتری را در تجارت پیدا کنند. فروشندگان آنلاین بر مبنای اطلاعات جمعیتشناختی و سایر معیارها دربارهی چیزی که ما میخواهیم ببینیم تصمیم میگیرند. فروشگاههای جدید غیر مجازی آمازون نمونهای از ادغام دو دنیا هستند.
نیازهای بزرگی وجود دارند که از طریق نظارت بر علایق و رفتار آنلاین ما بوجود میآیند. گوگل و فیسبوک غولهای سودآور تکنولوژی هستند که دلیل آن توانایی آنها در فروش تبلیغات است که نسبت به پلتفرمها و روشهای تبلیغاتی دیگر بهتر میتوانند گروه مصرفکنندگان به خصوص را مورد هدف قرار بدهند؛ این قابلیت آنها به لطف اطلاعاتی است که برای استفاده از سرویسهای آنها ارائه میکنیم.
آیا کلان داده خطرناک است؟
همانطور که کلان داده با وعدههایی همراه است ریسکهایی نیز دارد؛
کاهش حریم خصوصی از جمله معایب بزرگ کلان داده است؛ اکثریت مردم بیشتر از هر زمان دیگری در تاریخچهی بشری دربارهی ما اطلاعات دارند. نه تنها پیدا کردن محل زندگی ما، بلکه دانستن در مورد جایی که میرویم، شخصی را که دوست داریم، نحوهی زندگی ما، و تفکرات ما نیز آسان است. این موضوع باعث میشود که مسائل شخصی و اجتماعی بیشتر در معرض دستکاری قرار بگیرند. ممکن است ما فریب بخوریم و رمز و شماره کارت اعتباری خود را از دست بدهیم یا تحت تاثیر قرار بگیریم تا به کاندیداهایی رای بدهیم که تمایلی به حمایت از آنها نداریم. دادههای بیشتر راههای بیشتری برای تبلیغکنندگان و شرکتهای رسانهای فراهم میکند تا میلها و ارزشهای ما را شکل دهند. نسبت به گذشته اطلاعات و دادههای بیشتری دربارهی ما وجود دارد و این دادهها در مکانهای بیشتری نگهداری میشوند و این مسئله باعث میشود اهداف بیشتری در معرض حمله قرار بگیرند. در حال حاضر سرقت دادههای ما به صورت غیر قابل کنترل و بی وقفه رخ میدهد. حتی شرکتهایی که روند درستی برای حفاظت از دادههای ما در مقابل حملات خارجی دارند اغلب خودشان فعالیتهای مشکوکی روی دادههای ما انجام میدهند، همانند چیزی که در فیسبوک شاهد بودیم. مسئلهی ریسک بعدی پیشبینیهایی است که افراد از طریق اطلاعات کلان داده انجام میدهند. مثلا آیا برای بیمهی سلامتی افرادی که عادتهای غذایی ناسالم دارند بیشتر هزینه کنیم؟ آیا باید امنیت و ارامش را در مناطقی که پیشبینی میکنیم افزایش بدهیم؟ آیا قیمت برای خریداران آنلاین که در مناطق فقیر زندگی میکنند افزایش مییابد؟
یافتن راههایی برای حفاظت از داده، احترام به حریم خصوصی و حفظ ارزشهایمان به صورت چالشهایی مداوم با روندی در جهت کلان دادهها ادامه خواهد داشت.
.: Weblog Themes By Pichak :.