مرور کتابخانه های یادگیری ماشین در پایتون


تاریخ انتشار: 1398/تیر/20
نویسنده:حامد سهامی
گروه دانش : علوم داده
تعداد بازدید: 24 مرتبه
اشتراک گذاری:

scikit-learn

یک پروژه سورس باز است. این پروژه به طور مداوم در حال توسعه و ارتقاء است و در کامیونیتی خود از افراد زیادی بهره مند می باشد. این پروژه شامل تعداد زیادی از الگوریتم های یادگیری ماشین است، هر یک از این الگوریتم ها ابزار بسیار محبوبی در نزد متخصصین هستند و از این پروژه در قالب یک کتابخانه ی پایتون به طور ثابت تقریبا در پروژه های یادگیری ماشین به کار می آیند. این کتابخانه به طور گسترده ای در صنعت و دانشگاه ها و مراکز تحقیقاتی به کار گرفته میشود که البته لازم بذکر است که کدهای آماده و مستندات فراوانی از کارهای ممکن با این کتابخانه در سطح اینترنت منتشر شده است. این کتابخانه به خوبی با سایر ابزار های کار با اعداد در پایتون قابل استفاده است که من در آینده به بیان و معرفی آنها خواهم پرداخت . پس از مطالعه خلاصه معرفی این پروژه به شما دوستان عزیز توصیه میکنم به راهنمای این کتابخانه مراجعه کرده و آن را دقیقا مطالعه نمایید تا از جزئیات هر الگوریتم به طور جداگانه آگاه شوید.

NumPy

نام پای یکی از پکیج های پایه و اساسی در محاسبات علوم داده از پایتون است. این پکیج شامل امکانات مناسبی برای آرایه های چند بعدی ، توابع محاسباتی سطح بالا از قبیل عملیات جبر خطی و مبدل ها و تولید کننده اعداد تصادفی است. آرایه های این کتابخانه به عنوان ساختمان داده های پایه الگوریتم های کتابخانه sklearn هستند. این کتابخانه داده ها را از ارایه های نام پای دریافت میکند . هر داده ای که شما استفاده می کنید به آرایه از نام پای تبدیل میشود. هسته عملیاتی نام پای کلاس ndarry است که یک آرایه چند بعدی می باشد. تمام المان های آرایه باید از یک نوع داده ای باشند.

SciPy

یک مجموعه از توابع محاسباتی علوم داده در پایتون است. این مجموعه فراهم کننده ی، توابع گسترده ی دیگر، مانند جبر خطی پیشرفته، توابع ارتقاء محاسبتی، پردازش سیگنال، توابع محاسباتی ویژه و آماری توزیع شده است.

matplotlib

یکی از کتابخانه های اصلی پایتون در حوزه علوم داده است. این کتابخانه توابعی را برای انتشار و ارائه امکانات بصری از قبیل نمودار های خطی، هیستوگرام، پلات های ویژه و بسیاری از نمودارها و امکانات دیگر است. امکان استفاده از این امکانات در داخل نوت بوک جوپیتروجود دارد، شما می توانید اشکال مختلف مبتنی بر مجموعه داده های خود به صورت مستقیم در داخل مرورگر با شکل ویژه ای، وجود دارد. ما این کتابخانه را به شما توصیه میکنیم تا محیطی تعاملی ایجاد کنیم.

pandas

پاندا یکی از کتابخانه های پایتون برای تحلیل و کار با داده است. این کتابخانه برای ساخت دیتا فریم های کاربردی در مجموعه دستورات کار با داده نیز به کار گرفته میشود. در بیان ساده فکر کنید دیتا فریم یک جدول است مانند یک صفحه گسترده اکسل است. پاندا متد های فراوانی برای ویرایش و عملیات بروی این اطلاعات در قالب جدول است. به طور مشخص می توان مانند دستورات SQL این جداول را به هم متصل نمود و یا بروی آنها درستورات یا کوئری هایی را اجرا نمود. حتی پاندا می تواند آرایه های مورد نیاز Numpy را به سادگی به ازای ستون های مورد نظر شما تولید کند. ارزشمندی دیگر این کتابخانه توانایی فراخوانی و وارد کردن اطلاعات از انواع فایل ها و منابع اطلاعاتی را دارد.