تاریخچه علم داده 


علم داده در سال 2001 توسط ویلیام کلیولند با تعریف "برنامه ای برای گسترش جنبه های فنی در رشته آمار " مطرح شد. علم داده عبارت جدیدی است اما سالها پیش از آن بهره می بردند، ناپلئون بناپارت از الگوهای ریاضی برای استراتژی های جنگی استفاده می کرد. ویلیام کلیولند این علم جدید را علم کامپیوتر میدانست و معتقد بود که "منافع استفاده از یک تحلیلگر داده محدود است. "

این علم در کشور ایران اولین پروژه خود را در دانشگاه تهران شروع کرد، و دانشگاه شهید بهشتی تهران در مقطع کارشناسی ارشد علم داده پذیرش دانشجو دارد همچنین مرکز پژوهشی دانشگاه تهران به صورت تخصصی این علم را دنبال میکند.



علم داده (Data Science)



علم داده(Data science ) چیست ؟


این نوع علم، علمی است که با ترکیب الگوها، ابزارها و یادگیری ماشین با هدف دسترسی به الگوهای پنهان موجود در داده های خام، است. به بیان ساده تر علم داده، دانشی است برای استخراج دانش و اطلاعات از مجموعه ای اطلاعات گسترده و داده، علم داده حوزه های بسیاری دارد که شامل ریاضیات، علوم کامپیوتر و مهندسی داده و... میباشد.


به متخصص علم داده، دانشمند داده (Data scientist) میگویند که این تخصص توسط جف همربارکر و دی جی پاتیل مطرح شد، دانشمند داده به مهارت های زیادی دسترسی دارد که طیف وسیعی را شامل میشود:


  • تجزیه و تحلیل داده ها 
  • یادگیری ماشین و شناخت انواع الگوها 
  • طرح پیشبینی ها 
  • ایجاد چالش ها و مسائل پیچیده 
  • حل مسائل پیچیده با علم داده 
  • بدست آوردن داده های تمیز
  • آماده سازی داده ها 
  • برنامه ریزی برای داده ها و ایجاد الگو
  • نظارت بر داده های جدید و به کارگیری آنها در تحقیقات جدید
  • ساخت مدل بر اساس الگو ها و داده ها 
  • ...



 (Data Science) حوزه های علم داده


پیش نیازهایی که برای علم داده لازم است شامل :

  • یادگیری ماشین 
  • برنامه نویسی 
  • آشنایی با پایگاه داده 
  • دانش آمار و ریاضیات 
  • مدل سازی 



کاربرد های علم داده 


این نوع علم در حوزه های بسیاری کاربرد دارد که شامل موارد زیر می شود:


علم داده در حوزه پزشکی: در سراسر جهان بیمارستان ها و مراکز پزشکی از هوش مصنوعی استفاده میکنند که باعث عملکرد بهتر مراقبت های پزشکی میشود، به طور مثال بکارگیری ساعت های هوشمند و موبایل ها اطلاعات ژنتیکی و بیماری ها را ثبت میکند که با توجه به آن هرگونه مشکلی را اطلاع رسانی میکند، همچنین پزشکان بسیاری پرونده های سلامت بیماران خود را به صورت دیجیتال طراحی میکنند تا روند بیماری، دارو های مصرفی و... را دسترس داشته و با دیگر پزشکان بیمار در ارتباط باشند.


این علم  در روند پیشگیری بیماری نیز نقش مهمی را ایفا میکند، با توجه به عکس ام ار ای، سی تی اسکن و ماموگرافی و... تومورها و ناهنجاری های موجود در بافت را تشخیص میدهد. علم داده به دانشمندان کمک میکند که ترکیب یک دارو با بدن انسان را پیشبینی کنند و داروهایی با عملکرد بهتر به بیماران ارائه دهند.


علم داده در حوزه بانکداری: بانک ها از این علم برای بسیاری از فناوری های خود بهره می برند، به طور مثال در بانکداری برای تشخیص تقلب، ارزش گذاری بر روی مشتری، پیشبینی ریزش مشتری و سیستم های توصیه گر و... استفاده می شود.


تشخیص تقلب به صورتی است که با استفاده از هویت مشتریان، رفتار غیر معمول آنها مثل برداشت یا انتقال کلان پول، سرقت های بزرگ و... اطلاع رسانی میشود، یک تراکنش غیر معمول از یک مشتری در سیستم های کشف تقلب بررسی میشود.

مشتریان یک بانک با ثبت هویت خود و میزان تراکنش هایی که دارند یک الگو رفتاری را ارائه میدهند، در صورتی که یک مشتری در یک دوره زمانی از حساب های خود استفاده نکند، سیستم ها پیشنهاد هایی را در اختیار مشتری قرار میدهند تا از ریزش مشتری پیشگیری کنند، همچنین با در نظر گرفتن مقدار حساب های مشتریان می توان پیشنهاد های بسیار مناسبی به آنها ارائه داد.


علم داده در اکوسیستم: این علم قابلیت پیش بینی آب و هوا را نیز دارد، علاوه بر آن خطرات احتمالی مثل زلزله، سونامی یا سیل را نیز پیش بینی میکند که کمک قابل توجهی برای جان مردم است.


علم داده در حوزه کشاورزی: این دانش به کشاورزان کمک میکند تا انواع آفات و بیماری ها را که بر محصولات تاثیر می گذارند را شناسایی کرده و از وقوع آنها جلوگیری کند. علم داده با پیش بینی وضع آب و هوا تاثیرات مفیدی را در زمین های کشاورزی ایجاد میکند و یکی دیگر از قابلیت های علم داده در این حوزه پیش بینی میزان بازدهی محصولات میباشد.



کاربردهای علم داده  در صنعت های مختلف



موارد دیگر بسیار زیادی از کاربردهای این علم وجود دارد مانند خانه های هوشمند و خودروهای خودران و... که تمام اینها اهمیت و ارزش علم داده را نشان میدهد.


نتیجه گیری 


علم داده، دانش و فرآیندی می باشد که با آن از اطلاعات و داده های خام با ترکیب الگوریتم ها میتوان دانش ساختار یافته و داده های بهینه شده ای را ایجاد کرد. این علم در حوزه های بسیاری دخالت دارد و میزان کارایی این علم هر روز گسترده تر میشود. این دانش مسائل پیچیده را آسان کرده و بر روی زندگی افراد جامعه تاثیر مثبت نیز پیاده میکند.