یادگیری ماشین نظارت شده چیست؟
یادگیری ماشین نظارت شده (Supervised learning) از یادگیری های ماشین میباشد که در این روش، الگو ها توسط اطلاعات برچسب دار آموزش دیده و یک داده با تابع ایجاد میکنند، به طور ساده تر میتوان گفت برای الگوی مورد نظر خود یک پارامتر تعریف کرده تا ماشین با توجه به آن پارامتر داده ها را استخراج کند.
در این روش دانشمندان داده های برچسب دار خود را معرفی کرده و ماشین ها توسط این برچسب ها همبستگی میان مدل را ارزیابی میکنند و همچنین متغیرها را در نظر گرفته و سپس داده ها را استخراج میکنند. الگوریتم های یادگیری تحت نظارت به صورت زیر میباشد:
- طبقه بندی باینری (Binary classification): این دسته بندی تحت نظارت برای تقسیم داده ها به دو دسته می باشد مانند زن، مرد و بله، خیر و ...
- طبقه بندی چند دسته ای (Multi class-classification): این طبقه بندی تحت نظارت یادگیری ماشین برای انتخاب و تقسیم برای بیش از دو پاسخ میباشد.
- رگرسیون (Regression): رگرسیون زمانی به کار میرود که مدل به کار رفته، یک مقدار واقعی و پیوسته داشته باشد یا به طور ساده تر میتوان گفت متغیر خروجی دسته ای بوده و دارای دو یا چند کلاس است.
- کلاسه بندی (Ensembling): از این نوع یادگیری ماشین تحت نظارت برای ارائه پیش بینی دقیق و بهینه تر در بین چندین مدل استفاده میشود.
یادگیری ماشین بدون نظارت چیست؟
در یادگیری ماشین بدون نظارت، نیازی به برچسب گذاری برای استخراج داده ها نیست. این الگوریتم ها داده ها را بدون برچسب گذاری ارائه میدهند. در این روش ماشین خود آموزش می بیند تا داده ها را بدون برچسب گذاری پیدا کند، این یادگیری نیز انواع مختلفی دارد که به زیر میباشد:
- انجمن و خوشه بندی
انجمن: این نوع از یادگیری ماشین بدون نظارت، الگوریتمی بر قانون کشف احتمال وقوع همزمان در یک مجموعه یکپارچه میباشد به طور مثال سبد خرید محصولات.
خوشه بندی: خوشه بندی الگوریتمی است که برای تقسیم اشیا به خوشه های شبیه به هم هستند به کار میرود. این الگوریتم خود زیرمجموعه ای دارد که به صورت زیر میباشد:
1.خوشه بندی همسان (Overlapping Clustering): در این نوع از یادگیری ماشین بدون نظارت، داده ها به صورت خوشه ای در بخش های جداگانه ارائه داده میشوند.
2.خوشه بندی سلسله ای (Clustering Hierarchical): در این الگوریتم به دو صورت داده ها استخراج میشوند که شامل تقسیم کننده و تجمیعی میباشد.
3.خوشه بندی تک یا انحصاری (Exclusive Clustering): این نوع از الگوریتم به صورتی است که در آن یک خوشه وجود دارد.
4.خوشه بندی احتمالی: در این الگوریتم داده بر پایه احتمال به یک خوشه یا چند خوشه تقسیم میشوند به طور مثال خوشه بندی گاوسی یکی از پر استفاده ترین تقسیم بندی ها میباشد، در این تقسیم بندی داده ها به صورت پارامترهای ناشناخته تولید خواهند شد.
یادگیری ماشین تقویتی (Reinforcement Learning) چیست؟
در این نوع از یادگیری ماشین، الگوریتم های مد نظر را ارائه داده و سپس اجازه داده میشود که خود ماشین داده نهایی را بر اساس اموزشی که خود دیده استخراج کند به طور مثال روند پیش بینی یک تیم ورزشی را در سال های قبل و میزان تمرین و بازیکنان را ارائه داده و سپس ماشین بر اساس آموزش های خود و الگوریتم های اعمال شده پیش بینی را ارائه میدهد.
یادگیری ماشین نیمه نظارتی (semi supervised learning) چیست؟
این نوع یادگیری ماشین از ترکیب دو روش نظارتی و بدون نظارت الهام گرفته است و دانشمندان برای این روش الگوریتم ها را با برچسب گذاری داده ها آموزش میدهند و ماشین خود آن ها را به تنهایی و بدون برچسب گذاری بررسی میکند و داده ها را استخراج میکند، در این روش داده ورودی توسعه یافته و اطلاعات بیشتری در اختیار قرار خواهد داد.
یادگیری ماشین تشخیص ناهنجاری (Anomaly Detection) چیست؟
در فرایند تشخیص ناهنجاری یا غیر معمول بودن داده ها، هدف یافتن داده هایی است که از سایر داده ها به طور چشمگیری تفاوت داشته و الگوهای اصلی را نقص میکنند، با کمک الگوریتم های یادگیری ماشین، مدل ها با روش آماری تغییر می یابند و با این فرایند میتوان نقاط داده های ناهنجار را شناسایی کرد. از این نوع یادگیری در تحلیل خطرات مالی، یافتن خطا در سازمان و تحلیل سرمایه استفاده کرد.
یادگیری ماشین سیستم توصیه گر (Recommendation Systems) چیست؟
از سیستم های توصیه گر در حوزه یادگیری ماشین و هوش مصنوعی استفاده میشود، این سیستم ها توصیه و پیشنهادهایی برای محصولات، محتوا و... ارائه میدهد. این سیستم ها با هدف بهبود تجربه بهتر و رضایت کاربران ایجاد شده است. این سیستم با جمع آوری داده های بدست آمده از نظرات کاربران، الگوریتم هایی را ایجاد میکند تا بر اساس علاقه مندی کاربران محصولات جدیدی را توصیه کند.
نتیجه گیری
یادگیری ماشین به بخش ها مختلفی تقسیم شده است که هر کدام از این بادگیرها در بخش های مختلفی مانند پیش بینی آب و هوا، پیش بینی نتیجه تیم های ورزشی و سبد خرید و تشخیص اشیا، تقلب و.... به کار برده میشود. یادگیری نظارت شده با کمک الگوریتم های برچسب گذاری شده داده را استخراج می شود به طور ساده تر پارامتری برای داده ها تعیین میشود. در یادگیری بدون نظارت هیچ برچسبی برای الگوریتم پیاده شده اعمال نمیشود و بخش نیمه نظارتی یادگیری ماشین ترکیبی از دو یادگیری نظارت شده و بدون نظارت است که برچسب ها تعریف شده اما در آخر ماشین خود با توجه به آموزش پیش بینی یا داده را استخراج میکند.