یادگیری ماشین چیست؟ چطور کار می کند؟ و نکات کاربردی

تیم تولید محتوا آوریل 27, 2021آخرین به روز رسانی: آوریل 14, 2024

خواندن این مطلب 9 دقیقه زمان میبرد

یادگیری ماشین روی برنامه هایی متمرکز است که به صورت تجربی یاد می گیرند و به مرور زمان تصمیم گیری یا دقت پیش بینی آنها بهبود می یابد.

یادگیری ماشین چیست؟

یادگیری ماشین شاخه ای از هوش مصنوعی (AI) است که بر ساخت برنامه هایی متمرکز است که از داده ها می آموزند و به مرور زمان و بدون اینکه برنامه ریزی شوند، به دقت آنها اضافه می شود.

در علم داده، الگوریتم توالی مراحل پردازش آماری است. در یادگیری ماشین، الگوریتم ها برای یافتن الگوها و ویژگی ها در حجم عظیمی از داده ها “آموزش داده می شوند” تا بتوانند براساس داده های جدید تصمیم گیری و پیش بینی کنند. هرچه الگوریتم بهتر باشد، با پردازش داده های بیشتر، تصمیمات و پیش بینی ها دقیق تر می شوند.

80 اصطلاح رایج دنیای تکنولوژی که باید بدانید

امروزه، نمونه های بسیاری از یادگیری ماشین در اطراف ماست. دستیارهای دیجیتال در پاسخ به دستورات صوتی ما در وب جستجو می کنند و موسیقی پخش می کنند. وب سایت ها محصولات و فیلم ها و آهنگ ها را براساس آنچه قبلاً خریده ایم، تماشا کرده ایم یا گوش داده ایم، توصیه می کنند.

فیلترهای هرزنامه دسترسی ایمیل های ناخواسته به صندوق های ورودی ما را متوقف می کنند. سیستم های تجزیه و تحلیل تصاویر پزشکی به پزشکان کمک می کنند تومورهایی را که ممکن است نادیده گرفته باشند، تشخیص دهند. و اولین اتومبیل های خودران در حال سواری در جاده ها هستند.

می توان انتظار بیشتری داشت. هرچه داده های بزرگ بزرگتر می شوند، رایانه ها قدرتمندتر و مقرون به صرفه تر می شوند و توانایی دانشمندان در زمینه توسعه الگوریتم ها بهبود می یابد، یادگیری ماشین کارایی بیشتر و بیشتری در زندگی شخصی و کاری ما پیدا کرده است.

یادگیری ماشین چگونه کار می کند؟

چهار مرحله اساسی برای ساخت یک برنامه یادگیری ماشین (یا مدل) وجود دارد. این کارها معمولاً توسط دانشمندان داده انجام می شوند. این دانشمندان از نزدیک با متخصصان تجاری که صاحبان مدل ها هستند همکاری می کنند.

مرحله 1: انتخاب و آماده سازی مجموعه داده های آموزش

داده های آموزشی، مجموعه ای از داده های نمونه هستند که مدل یادگیری ماشین برای حل مسئله استفاده می کند. در بعضی موارد، داده های آموزشی برای نشان دادن ویژگی ها و طبقه بندی هایی که مدل برای شناسایی نیاز دارد، “برچسب گذاری” می شوند. سایر داده ها بدون برچسب هستند و مدل باید به تنهایی آن ویژگی ها را استخراج و طبقه بندی کند.

در هر صورت، داده های آموزشی باید به درستی آماده شوند. همچنین باید به دو زیر مجموعه تقسیم شوند: زیر مجموعه آموزشی، که برای آموزش برنامه استفاده می شود و زیر مجموعه ارزیابی، که برای آزمایش و اصلاح آن استفاده می شود.

مرحله 2: انتخاب الگوریتمی برای اجرا در مجموعه داده های آموزشی

الگوریتم مجموعه ای از مراحل پردازش آماری است. نوع الگوریتم به نوع (با برچسب یا بدون برچسب) و مقدار داده در مجموعه داده های آموزشی و به نوع مسئله ای که باید حل شود بستگی دارد.

انواع متداول الگوریتم های یادگیری ماشین برای استفاده با داده های دارای برچسب شامل موارد زیر هستند:

الگوریتم های رگرسیون: رگرسیون خطی و لجستیک نمونه هایی از الگوریتم های رگرسیون هستند که برای درک روابط داده ها استفاده می شوند. از رگرسیون خطی برای پیش بینی مقدار یک متغیر وابسته بر اساس مقدار یک متغیر مستقل استفاده می شود. از رگرسیون لجستیک می توان زمانی استفاده کرد که متغیر وابسته ماهیت دودویی داشته باشد: A یا B. به عنوان مثال، یک الگوریتم رگرسیون خطی می تواند برای پیش بینی فروش سالانه یک فروشنده (متغیر وابسته) براساس رابطه آن با تحصیلات یا میزان تجربه او (متغیرهای مستقل) آموزش داده شود. نوع دیگری از الگوریتم رگرسیون به نام ماشین بردار پشتیبانی هنگامی بکار می رود که طبقه بندی متغیرهای وابسته دشوارتر باشد.
درختان تصمیم: درختان تصمیم گیرنده از داده های طبقه بندی شده برای ارائه توصیه ها بر اساس مجموعه ای از قوانین تصمیم گیری استفاده می کنند. به عنوان مثال، یک درخت تصمیم که شرط بندی بر روی یک اسب خاص را برای برنده شدن توصیه می کند، می تواند از داده های مربوط به اسب (به عنوان مثال سن، درصد برنده شدن، شجره نامه) استفاده کند و برای توصیه یک تصمیم قوانینی را اعمال کند.
الگوریتم های مبتنی بر نمونه گیری: مثال خوبی از الگوریتم های مبتنی بر نمونه گیری K-Nearest Neighbor یاk-nn است. این الگوریتم از طبقه بندی برای تخمین احتمال عضویت یک نقطه داده در یک گروه یا گروه دیگر بر اساس نزدیکی با سایر نقاط داده استفاده می کند.

الگوریتم های قابل استفاده با داده های بدون برچسب شامل موارد زیر هستند:

الگوریتم های خوشه بندی: خوشه ها را به عنوان گروه در نظر بگیرید. خوشه بندی روی شناسایی گروه هایی که دارای سوابق مشابه هستند و برچسب گذاری سوابق با توجه به گروهی که به آن تعلق دارند تمرکز دارد. این کار بدون اطلاع قبلی در مورد گروه ها و خصوصیات آنها انجام می شود. انواع الگوریتم های خوشه بندی شامل خوشه بندی K-means ، TwoStep و Kohonen است.
الگوریتم های وابستگی: الگوریتم های وابستگی الگوها و روابط موجود در داده ها را پیدا می کنند و روابط مکرر “اگر-آنگاه” که قوانین تداعی نامیده می شوند را شناسایی می کنند. این موارد مشابه قوانینی هستند که در داده کاوی استفاده می شود.
شبکه عصبی: الگوریتمی است که یک شبکه لایه ای از محاسبات با یک لایه ورودی، که داده ها را می بلعد، حداقل یک لایه پنهان، که محاسبات را انجام می دهد و نتیجه گیری های مختلفی در مورد ورودی انجام می دهد و یک لایه خروجی که به هر نتیجه گیری یک احتمال اختصاص می دهد را توصیف می کند. یک شبکه عصبی عمیق شبکه ای با چندین لایه پنهان را تعریف می کند، که هر یک از آنها به طور پی در پی نتایج لایه قبلی را اصلاح می کند.

مرحله 3: آموزش الگوریتم برای ایجاد مدل

آموزش الگوریتم یک فرآیند تکرار شونده است – این فرآیند شامل اجرای متغیرها از طریق الگوریتم، مقایسه خروجی با نتایج لازم، تنظیم وزن و بایاس در الگوریتم که ممکن است به رسیدن به نتیجه دقیق تر بیانجامد، و اجرای دوباره متغیرها تا زمانیکه الگوریتم در بیشتر مواقع به نتیجه صحیح برسد می شود.

الگوریتم آموزش دیده و دقیق حاصل، مدل یادگیری ماشین است – یک تمایز مهم برای یادآوری، زیرا “الگوریتم” و “مدل” به اشتباه به جای یکدیگر استفاده می شوند، حتی توسط ماشین های یادگیری ماشین.

مرحله 4: استفاده و بهبود مدل

مرحله آخر استفاده از مدل با داده های جدید و در بهترین حالت برای بهبود دقت و کارایی آن با گذشت زمان است. این که داده های جدید از کجا آمده باشند، به مشکل حل شده بستگی دارد.

به عنوان مثال، یک مدل یادگیری ماشین که برای شناسایی هرزنامه طراحی شده است پیام های ایمیل را می بلعد، در حالی که یک مدل یادگیری ماشین که یک جارو برقی ربات را هدایت می کند، داده های حاصل از تعامل در دنیای واقعی با اسباب و اثاثیه حاضر در اتاق را می بلعد.

روش های یادگیری ماشین

روش های یادگیری ماشین (سبک های یادگیری ماشین نیز نامیده می شوند) به سه دسته اصلی تقسیم می شوند.

یادگیری ماشین نظارتی

یادگیری ماشین نظارتی خود را در یک مجموعه داده دارای برچسب آموزش می دهد. به این معنا که داده ها با اطلاعاتی که مدل یادگیری ماشین برای تعیین آنها در نظر گرفته شده و حتی ممکن است به روشی که مدل قرار است داده ها را طبقه بندی کند، برچسب گذاری شده اند.

به عنوان مثال، یک مدل بینایی رایانه ای که برای شناسایی سگهای نژاد ژرمن شپرد طراحی شده است، ممکن است با مجموعه داده های مختلفی از تصاویر سگهای دارای برچسب آموزش ببیند.

یادگیری ماشین نظارتی به داده های آموزشی کمتری نسبت به سایر روش های یادگیری ماشین نیاز دارد و آموزش را آسان تر می کند زیرا نتایج مدل را می توان با نتایج برچسب دار واقعی مقایسه کرد. اما، تهیه اطلاعات با برچسب مناسب گران است و خطر ایجاد مدلی که تغییرات دقیق داده های جدید را به درستی کنترل نمی کند وجود دارد.

یادگیری ماشین بی نظارت

یادگیری ماشین بدون نظارت داده های بدون برچسب را می بلعد و از الگوریتم ها برای استخراج ویژگی های معنی دار مورد نیاز برای برچسب گذاری، مرتب سازی و طبقه بندی داده ها در زمان واقعی، بدون دخالت انسان استفاده می کند. یادگیری بدون نظارت کمتر به تصمیم گیری ها و پیش بینی های خودکار مربوط می شود و بیشتر به شناسایی الگوها و روابط در داده هایی که انسان نادیده می گیرد، می پردازد.

به عنوان مثال، تشخیص هرزنامه را در نظر بگیرید – افراد بیش از آنچه تیمی از دانشمندان می توانند در طول زندگی خود برچسب گذاری یا طبقه بندی کنند، ایمیل تولید می کنند. یک الگوریتم یادگیری بی نظارت می تواند حجم عظیمی از ایمیل ها را تجزیه و تحلیل کرده و ویژگی ها و الگوهایی را که نشانگر هرزنامه هستند کشف کند و با گذشت زمان در تشخیص هرزنامه ها بهتر می شود.

یادگیری نیمه نظارتی

یادگیری نیمه نظارتی بین یادگیری نظارتی و بی نظارت قرار دارد. در طول آموزش، از مجموعه داده های دارای برچسب کوچکتر برای طبقه بندی و استخراج ویژگی ها از یک مجموعه داده بزرگتر و بدون برچسب استفاده می شود. یادگیری نیمه نظارتی می تواند مشکل نداشتن داده های دارای برچسب کافی برای آموزش الگوریتم یادگیری نظارتی را حل کند.

یادگیری ماشین تقویتی

این نوع یادگیری یک مدل یادگیری ماشین رفتاری است که شبیه به یادگیری نظارتی است، اما الگوریتم با استفاده از داده های نمونه آموزش داده نمی شود. این مدل همزمان با استفاده از آزمون و خطا می آموزد. دنباله ای از نتایج موفقیت آمیز تقویت خواهد شد تا بهترین توصیه یا سیاست برای یک مشکل خاص ارائه شود.

سیستم IBM Watson® که برنده چالش خطر در سال 2011 شد مثال خوبی است. این سیستم با استفاده از یادگیری تقویتی در مورد اینکه آیا سوالی را بپرسید، کدام مربع را در صفحه انتخاب کنید و چه مقدار شرط بندی کنید تصمیم می گیرد.

برنامه نویسی هوش مصنوعی اندروید

یادگیری عمیق

یادگیری عمیق زیر مجموعه یادگیری ماشین است (یادگیری عمیق یادگیری ماشین است، اما یادگیری ماشین یادگیری عمیق نیست). الگوریتم های یادگیری عمیق یک شبکه عصبی مصنوعی را تعریف می کنند که برای یادگیری نحوه یادگیری مغز انسان طراحی شده است.

مدل های یادگیری عمیق به داده های زیادی احتیاج دارند که از چندین لایه محاسبات عبور می کنند و برای تنظیم و بهبود مستمر نتایج، از وزنه ها و بایس های لایه های پی در پی استفاده می کنند.

مدل های یادگیری عمیق معمولاً بی نظارت یا نیمه نظارتی هستند. همچنین می توانند تقویتی نیز باشند. انواع خاصی از مدل های یادگیری عمیق- از جمله شبکه های عصبی کانولوشن (CNNs) و شبکه های عصبی بازگشتی (RNNs)- درحال پیشرفت در زمینه هایی مانند بینایی کامپیوتر، پردازش زبان طبیعی (از جمله تشخیص گفتار) و اتومبیل های خودران هستند.

یادگیری ماشین در دنیای واقعی

همانطور که در ابتدا اشاره شد، یادگیری ماشین در همه جا وجود دارد. در اینجا فقط به چند نمونه از یادگیری ماشین که ممکن است هر روز با آن روبرو شوید اشاره می کنیم:

دستیارهای دیجیتال: Apple Siri ، Amazon Alexa،Google Assistant و سایر دستیارهای دیجیتالی از پردازش زبان طبیعی (NLP) پشتیبانی می کنند، یک برنامه یادگیری ماشین که به رایانه ها امکان پردازش داده های متنی و صوتی را می دهد و زبان انسان را همانطور که افراد می فهمند، پردازش می کند. پردازش زبان طبیعی همچنین برنامه های مبتنی بر صدا مانند GPS و نرم افزار تشخیص گفتار را هدایت می کند.
پیشنهادات: مدل های یادگیری عمیق پیشنهادهای ارائه شده توسط آمازون، Netflix،Spotify و سایر خدمات فروشگاهی، سرگرمی، سفر، جستجوی کار و اخبار را ارائه می دهند.
تبلیغات آنلاین متنی: مدل های یادگیری ماشین و یادگیری عمیق می توانند محتوای یک صفحه وب را ارزیابی کنند – نه تنها موضوع، بلکه تفاوت های ظریف مانند نظر یا نگرش نویسنده – و تبلیغات متناسب با منافع بازدید کننده ارائه دهند.
چت بات ها: چت بات ها می توانند از ترکیبی از شناسایی الگو، پردازش زبان طبیعی و شبکه های عصبی عمیق برای تفسیر متن ورودی و ارائه پاسخ های مناسب استفاده کنند.
کشف تقلب: مدلهای رگرسیون و طبقه بندی یادگیری ماشین جایگزین سیستمهای تشخیص تقلب مبتنی بر قوانین شده اند که در هنگام تشخیص موارد استفاده از کارت اعتباری دزدی دارای تعداد زیادی مثبت کاذب هستند و بندرت در کشف استفاده مجرمانه از داده های مالی دزدیده شده یا به خطر افتاده موفق عمل می کنند.
امنیت سایبری: یادگیری ماشین می تواند اطلاعات را از گزارشات حادثه، هشدارها، پست های وبلاگ و موارد دیگر برای شناسایی تهدیدات احتمالی، مشاوره به تحلیلگران امنیتی، و تسریع پاسخ دهی استخراج کند.
تجزیه و تحلیل تصاویر پزشکی: انواع و حجم داده های تصویربرداری پزشکی دیجیتال در مقایسه با قبل توسعه پیدا کرده است، در نتیجه اطلاعات بیشتری برای تشخیص وجود دارد و البته خطای انسانی در خواندن داده ها نیز افزایش پیدا کرده است. شبکه های عصبی کانولوشن (CNN) ، شبکه های عصبی بازگشتی(RNN) و سایر مدل های یادگیری عمیق به طور فزاینده ای در استخراج ویژگی ها و اطلاعات از تصاویر پزشکی برای کمک به تشخیص دقیق، موفق بوده اند.
اتومبیل های خودران: اتومبیل های خودران به یک ماشین یادگیری ماشین احتیاج دارند – آنها باید بطور مداوم اشیا موجود در محیط اطراف ماشین را شناسایی کنند، نحوه تغییر یا حرکت آنها را پیش بینی کنند و ماشین را از اشیا دور و به سمت مقصد راننده هدایت کنند. تقریباً تمامی اشکال الگوریتم یادگیری ماشین و یادگیری عمیق که در بالا ذکر شدند، نقشی در توانایی یک خودروی خودران دارند.

یادگیری ماشین و ابر IBM

IBM Watson Machine Learningاز چرخه یادگیری ماشین پشتیبانی می کند. این مجموعه در محدوده پیشنهادهایی عمل می کند که به شما اجازه می دهند هر جا که داده ها وجود دارند، مدل های یادگیری ماشین بسازید و آنها را در هر جای محیط ترکیبی چند ابری خود قرار دهید.

۱۹ تا از بهترین ترفندهای کاربردی کامپیوتر

IBM Watson Machine Learning در IBM Cloud Pak for Data به دانش داده های سازمانی و تیم های هوش مصنوعی کمک می کند تا توسعه و استقرار هوش مصنوعی را در یک سیستم داده بومی ابر و سیستم عامل AI افزایش دهند. IBM Watson Machine Learning Cloud ، یک سرویس مدیریت شده در محیط IBM Cloud و سریع ترین راه برای انتقال مدل ها از روی دسک تاپ به استقرار برای تولید است.

با این اپلیکیشن ساده، هر زبانی رو فقط با روزانه 5 دقیقه گوش دادن، توی 80 روز مثل بلبل حرف بزن! بهترین متد روز، همزمان تقویت حافظه، آموزش تصویری با کمترین قیمت ممکن!

برچسب ها