مبانی یادگیری ماشین


تاریخ انتشار: 1398/تیر/20
نویسنده:حامد سهامی
گروه دانش : علوم داده
تعداد بازدید: 8 مرتبه
اشتراک گذاری:

یادگیری ماشین یکی از روش های تحلیل داده است که ساخت مدل های تحلیلی را خودکار میکند. در یادگیری ماشین از الگوریتم های 
که به صورت تکرار پذیر از داده ها یاد میگیرند استفاده میشود. اساسا به کامپیوتر ها اجازه می دهد که الگوها و خواص پنهان درون داده را شناسایی کنند، بدون اینکه برنامه ای صراحتا نوشته شود.

تشخیص چهره در فیس بوک یک مثال بسیار خوب از یادگیری ماشین استو اگر شما یک گروه از تصاویر ده نفر را ارسال کنید 
. و همه آنها از اعضا فیس بوک باشند و تصویری از خودشان در پروفایل شان داشته باشند، فیس بوک تصویر آنها را شناسایی کرده و به شما پیشنهاد هایی از نشانه گذاری در تصاویر ارائه میدهد.

دسته بندی های یادگیری ماشین

  • دسته بندی متون
  • کشف تقلب
  • پردازش تصویر و تشخیص چهره
  • پردازش زبان مانند فهمیدن زبان صحبت کننده
  • دسته بندی یا تعیین سگمنت ها در بازار
  • اطلاعات بایومتری

انواع یادگیری ماشین

یادگیری با نظارت: الگوریتم هایی که به همراه خروجی های معین بروی داده های آموزشی به کار گرفته میشوند. مانند کشف تقلب در کارت های اعتباری
یادگیری بی نظارت: این الگوریتم ها الگوهای درون داده ها را شناسایی میکنند بدون آنکه خروجی برای آنها مشخص شود. مانند کشف ناهنجاری

یادگیری تقویتی: این الگوریتم ها از تعاملات درون محیطی شروع به یادگیری می کنند. این الگوریتم ها به صورت سعی و خطا و ثبت کردن استراتژی ها به همراه بهبود ها به کار گرفته میشوند. مانند برنامه های شطرنج

نکته: برای دامنه کاری مالی یادگیری های با نظارت بسیار مناسب هستند.

انواع الگوریتم های یادگیری ماشین

طبقه بندی: در این الگووریتم یک سری داده دریافت میشود و نتیجه یکی از بخشهای داده خواهد بود. 
رگرسیون: برای پیدا کردن اعداد استفاده میشود
تشخیص ناهنجاری: تحلیل الگوها
خوشه بندی: اگر نیاز به شناخت ساختارها داشته باشید مورد استفاده قرار می گیرد
تقویتی: زمانی که به تصمیم گیری نیاز داشته باشید به کار گرفته میشود تا بر اساس سوابق گذشته درون محیطی بدست آمده تصمیم گیری را انجام دهد.

طبقه بندی خطی

طبقه بندی و رگرسیون دو نوع از مسایل یادگیری ماشین هستند و با خروجی های دلخواه دسته بندی میشوند. در ابتدا، ما باید مسیله را شناسایی کنیم 
تا الگوریتم مناسب را پیدا کنیم.

رگرسیون

ما در حال مدل سازی روابط بین داده های متوالی از متغیر های X وتا T هستیم. برای مثال، فرض کنید شما میخواهید اگر بازار بالا یا پایین برود پیش بینی کنید ، خروجی یک سری از قیمت ها خواهد بود.

میانگین قیمت ها، حجم و سرعت متوالی برای دریافت سری قیمت های متغیر هدف استفاده خواهند شد.

طبقه بندی

متغیر ورودی X ممکن است هنوز متوالی باشد اما متغیر هدف ممکن است گسسته باشد.
متغیر T برابر با یک خواهد بود اگر به C1 اختصاص پیدا کند.
متغیر T برابر با صفر خواهد بود اگر به C2 اختصاص پیدا کند.
برای مثال، فرض کنید شما میخواهید که بالا و پایین رفتن بازار را پیش بینی کنید . میانگین قیمت، 
حجم و سرعت پیوسته نیز برای بدست آوردن متغیر قیمت به صورت گسسته استفاده کنید.

به بیان ساده طبقه بندی منجر به برچسب گذاری میشود و برچسب ها نیز که همان خروجی های مطلوب هستند در ساخت مدل تعیین میشوند و از مدل ساخته شده نیز در نهایت برای پیش بینی استفاده میشود.

مراحل یادگیری ماشین

این مهم نیست که کدام مدل و شکل یادگیری ماشین را شما به کار میگیرید، مسیله این است که در 4 مرحله تمام مدل ها اجرا میشوند.
1- آماده سازی داده 
2- آموزش داده
3- آزمایش داده
4- بارگزاری مدل