ثروت پنهان؛ «کلان داده ها»
- شناسه خبر: 3189
- تاریخ و زمان ارسال: ۱۶ اسفند ۱۴۰۲ ساعت ۹:۰۲
- بازدید : 540
دادههای کاربران در اینترنت گنجینه مخفی سازمان ها، شرکتها و کسب و کارهای بزرگ مبتنی بر فناوری است که با تکیه بر آنها به ثروتهای کلان و جنجالی دست مییابند. افزون بر منافع تجاری و اقتصادی، توان تحلیل و اقدامات کاربردی مبتنی بر آورده های داده کاوی؛ سیاست گذاری های اثربخشی را در سطحوح سیاسی، اجتماعی و بین الملل پدیدار ساخته است.
بیگ دیتا (Big Data) یا کلان داده اقیانوسی است از اطلاعات؛ زتابایتهای عظیمی از داده که از رایانهها، تلفنهای همراه و حسگرها جاری میشوند. این دادهها توسط سازمانها برای تصمیمگیری، بهبود فرایندها و راهکارها، و تولید محصولات، خدمات و تجربیات مشتریمحور استفاده میشوند. بیگدیتا نهتنها به دلیل حجم آن، بلکه به دلیل تنوع و پیچیدگی ماهیت آن با این عنوان تعریف میشود. توان موردنیاز برای پردازش کلاندادهها از ظرفیت پایگاه دادههای سنتی بسیار فراتر است؛ دادههایی که میتوانند از هر نقطه یا هرچیزی روی زمین که ما قادر به نظارت دیجیتالی آنها هستیم، به دست آیند. ماهوارههای آبوهوایی، دستگاههای اینترنت اشیا (IoT)، دوربینهای ترافیکی، رسانههای اجتماعی تنها تعدادی از منابع کلاندادهها هستند که بهمنظور بهبود و رقابت کسبوکارها، استخراج و تجزیهوتحلیل میشوند.
اهمیت تحلیل بیگ دیتا چیست؟
ارزش واقعی بیگ دیتا با میزان توانایی شما برای تجزیه و تحلیل و درک آن، اندازهگیری میشود. هوش مصنوعی، یادگیری ماشین، و فناوریهای مدرن پایگاه داده با مصورسازی و و تحلیل کلاندادهها امکان ارائهی تحلیل ها و سیاست های کاربردی را درلحظه امکانپذیر میکنند. تحلیل کلاندادهها به سازمان ها و سیاستگذاران کمک میکند تا از دادههای خود برای درک فرصتهای جدید و ایجاد مدلهای حکمرانی و یا تجاری استفاده کنند.
بزرگبودن یک مجموعهداده، لزوماً بهمعنی کلانداده بودن آن نیست. برای واجد شرایط بودن بهعنوان کلانداده، دادهها باید حداقل دارای پنج ویژگی زیر باشند:
حجم (Volume): در حالی که حجم بههیچوجه تنها مؤلفهای نیست که مجموعهای از دادهها را بهعنوان کلاندادهها را تعریف میکند، اما مطمئناً یک ویژگی اصلی است. برای مدیریت و استفادهی کامل از بیگدیتا، الگوریتمهای پیشرفته و تحلیلهای مبتنی بر هوش مصنوعی موردنیاز است. اما قبل از هرچیز، باید روشی امن و قابلاعتماد برای ذخیرهسازی، سازماندهی و بازیابی ترابایتها داده که توسط شرکتهای بزرگ نگهداری میشوند، وجود داشته باشد.
سرعت (Velocity): در گذشته، هر دادهای که تولید میشد باید قبل از تحلیل یا بازیابی، در یک پایگاه دادهی سنتی بهصورت دستی وارد میشد. امروزه، فناوری کلانداده به پایگاههای داده اجازه میدهد تا دادهها را در حین تولید، پردازش، تحلیل و پیکربندی کنند؛ گاهی فقط در چند میلیثانیه. این بدان معناست که کسبوکارها میتوانند دادههای بلادرنگ را برای دریافت فرصتهای مالی، پاسخگویی به نیازهای مشتریان، خنثی کردن کلاهبرداریها و رسیدگی به هر فعالیت دیگری که فاکتور سرعت در آن حیاتی است، استفاده کرد.
تنوع (Variety): مجموعههای دادهای که از دادههای ساختاریافته تشکیل شدهاند، صرفنظر از حجمشان، لزوماً کلانداده نیستند. کلانداده معمولاً از ترکیبی از دادههای ساختاریافته، بدون ساختار و نیمهساختاریافته تشکیل شده است. پایگاههای داده سنتی و راهحلهای مدیریت داده، فاقد انعطافپذیری و گستردگی برای مدیریت مجموعهدادههای پیچیده و مختلفی که کلانداده را تشکیل میدهند، هستند.
صحت (Veracity): در حالی که فناوری پایگاه دادهی مدرن این امکان را برای شرکتها فراهم میکند که مقادیر و انواع کلانداده را جمعآوری و تفسیر کنند، تنها زمانی این کار ارزشمند است که دقیق و بهموقع انجام شود. در پایگاههای داده سنتی که فقط با دادههای ساختاریافته پر میشدند، خطاهای نحوی و اشتباهات تایپی عامل معمول درمورد نقص در دقت دادهها بودند. اما در دادههای بدون ساختار، مجموعهی جدیدی از چالشهای جدیدی درمورد صحت دادهها وجود دارد. جهتگیریهای انسانی و مسائل مربوط به منشأ دادهها و… همگی میتوانند بر کیفیت و صحت دادهها تأثیر بگذارند.
ارزش (Value): بدون شک، نتایجی که از تحلیل کلاندادهها به دست میآیند اغلب جذاب و غیرمنتظره هستند. اما برای کسبوکارها، تحلیل کلاندادهها باید اینسایتهایی ارائه دهد که به آنها کمک کند تا رقابتیتر و انعطافپذیرتر شده و به مشتریان خود خدمات بهتری ارائه کنند. فناوریهای مدرن کلان داده، ظرفیت جمعآوری و بازیابی دادهها را فعال کرده و مزایایی قابلاندازهگیری برای سودآوری و انعطافپذیری عملیاتی فراهم میکنند.
مدیریت بیگ دیتا وابسته به سیستمهایی است که توانایی پردازش و تحلیل معنادار مقادیر زیادی از اطلاعات متفاوت و پیچیده را دارند. در این راستا، بیگ دیتا و هوش مصنوعی تا حدودی رابطهای متقابل دارند. بیگ دیتا بدون هوش مصنوعی برای سازماندهی و تجزیه و تحلیل آن، کاربرد عملی زیادی نخواهد داشت و میزان دقت تحلیلهای هوش مصنوعی به وسعت مجموعهدادههای موجود در کلان داده بستگی دارد. الگوریتمهای یادگیری ماشین نیز دادههای دریافتی را تعریف کرده و الگوهای درون آنها را شناسایی میکنند. این اطلاعات به اتخاذ تصمیمات تجاری و اتوماسیون فرایندها کمک میکنند. یادگیری ماشین با کمک بیگ دیتا رشد میکند زیرا هرچه مجموعهدادهها قویتر باشند، سیستم فرصت بیشتری برای یادگیری و تکامل مداوم و انطباق فرایندهای خود خواهد داشت. طبیعتاً کاربرد کلان داده در حوزههای مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است. اما به طور کلی، باید به خاطر داشت که Big Data هنوز بسیار جوان است و راهی بسیار طولانی و البته اثرگذار در پیش دارد تا کاربردهای آن را به شکل اجتماعی، سیاسی و تجاری متبلور گردد. لزوم توجه به این مقوله در تخصیص راهبردها و منابع امری حیاتی برای توسعه و رشد بهینه هر جامعه محسوب می شود.