Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы

Мазмұны:

Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы
Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы

Бейне: Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы

Бейне: Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы
Бейне: 11 сынып. 3 тақырып. Машиналық оқыту принциптері. ЖМБ. 2024, Қараша
Anonim

Негізгі айырмашылық – бақыланатын және бақыланбайтын машиналық оқыту

Бақыланатын оқыту және бақылаусыз оқыту - машиналық оқытудың екі негізгі тұжырымдамасы. Бақыланатын оқыту – мысал енгізу-шығару жұптары негізінде кірісті шығысқа салыстыратын функцияны үйренуге арналған Machine Learning тапсырмасы. Бақыланбайтын оқыту – таңбаланбаған деректерден жасырын құрылымды сипаттау функциясын шығаруға арналған Machine Learning тапсырмасы. Бақыланатын және бақыланбайтын машиналық оқытудың негізгі айырмашылығы - бақыланатын оқыту таңбаланған деректерді, ал бақылаусыз оқыту таңбаланбаған деректерді пайдаланады.

Машинаны оқыту – компьютерлік жүйеге нақты бағдарламаланбай деректерден үйрену мүмкіндігін беретін информатика саласы. Ол деректерді талдауға және ондағы заңдылықтарды болжауға мүмкіндік береді. Машиналық оқытудың көптеген қолданбалары бар. Олардың кейбіреулері бетті тану, ым-ишараны тану және сөйлеуді тану. Машиналық оқытуға байланысты әртүрлі алгоритмдер бар. Олардың кейбіреулері регрессия, классификация және кластерлеу. Машиналық оқытуға негізделген қосымшаларды әзірлеуге арналған ең көп таралған бағдарламалау тілдері R және Python болып табылады. Java, C++ және Matlab сияқты басқа тілдерді де пайдалануға болады.

Бақыланатын оқыту дегеніміз не?

Машиналық оқытуға негізделген жүйелерде модель алгоритм бойынша жұмыс істейді. Бақыланатын оқытуда үлгі бақыланады. Біріншіден, модельді оқыту қажет. Алынған білімнің арқасында ол болашақ мысалдарға жауаптарды болжай алады. Модель белгіленген деректер жиынын пайдаланып оқытылады. Жүйеге үлгіден тыс деректер берілгенде, ол нәтижені болжай алады. Төменде танымал IRIS деректер жинағынан шағын үзінді берілген.

Бақыланатын және бақылаусыз оқытудың айырмашылығы_02-сурет
Бақыланатын және бақылаусыз оқытудың айырмашылығы_02-сурет

Жоғарыдағы кестеге сәйкес, Сепал ұзындығы, Сепал ені, Пател ұзындығы, Пател ені және Түрлер атрибуттар деп аталады. Бағандар мүмкіндіктер ретінде белгілі. Бір жолда барлық атрибуттар үшін деректер бар. Сондықтан бір қатарды бақылау деп атайды. Деректер сандық немесе категориялық болуы мүмкін. Модельге кіріс ретінде сәйкес түр атауы бар бақылаулар беріледі. Жаңа бақылау берілгенде, модель ол жататын түр түрін болжауы керек.

Бақыланатын оқытуда жіктеу және регрессия алгоритмдері бар. Классификация – таңбаланған мәліметтерді жіктеу процесі. Модель деректер санаттарын бөлетін шекараларды жасады. Модельге жаңа деректер берілгенде, ол нүктенің бар жеріне қарай санаттауға болады. K-En Nearest Neighbors (KNN) классификация үлгісі болып табылады. k мәніне байланысты санат шешіледі. Мысалы, k 5 болғанда, белгілі бір деректер нүктесі А санатындағы сегіз деректер нүктесіне және В санатындағы алты деректер нүктесіне жақын болса, деректер нүктесі A ретінде жіктеледі.

Регрессия – жаңа деректердің нәтижесін болжау үшін алдыңғы деректердің үрдісін болжау процесі. Регрессияда шығыс бір немесе бірнеше үздіксіз айнымалылардан тұруы мүмкін. Болжау деректер нүктелерінің көпшілігін қамтитын сызық арқылы орындалады. Ең қарапайым регрессия моделі сызықтық регрессия болып табылады. Ол жылдам және KNN сияқты баптау параметрлерін қажет етпейді. Егер деректер параболалық трендті көрсетсе, онда сызықтық регрессия үлгісі қолайлы емес.

Бақыланатын және бақылаусыз оқытудың айырмашылығы
Бақыланатын және бақылаусыз оқытудың айырмашылығы

Бұл бақыланатын оқыту алгоритмдерінің кейбір мысалдары. Әдетте, бақыланатын оқыту әдістерінен алынған нәтижелер дәлірек және сенімдірек, өйткені кіріс деректері жақсы белгілі және таңбаланған. Сондықтан құрылғы тек жасырын үлгілерді талдауы керек.

Бақылаусыз оқыту дегеніміз не?

Бақыланбайтын оқытуда үлгі бақыланбайды. Модель нәтижелерді болжау үшін өздігінен жұмыс істейді. Ол таңбаланбаған деректер бойынша қорытындыға келу үшін машиналық оқыту алгоритмдерін пайдаланады. Жалпы, бақылаусыз оқыту алгоритмдері бақыланатын оқыту алгоритмдеріне қарағанда қиынырақ, өйткені ақпарат аз. Кластер – бақылаусыз оқытудың бір түрі. Оны алгоритмдер арқылы белгісіз деректерді топтастыру үшін пайдалануға болады. k-орта және тығыздыққа негізделген кластерлеу екі кластерлеу алгоритмі болып табылады.

k-орташа алгоритм, әрбір кластер үшін k центроидты кездейсоқ орналастырады. Содан кейін әрбір деректер нүктесі ең жақын центроидқа тағайындалады. Евклидтік қашықтық деректер нүктесінен центроидқа дейінгі қашықтықты есептеу үшін қолданылады. Деректер нүктелері топтарға жіктеледі. k центроидтар үшін позициялар қайтадан есептеледі. Жаңа центроидтық позиция топтағы барлық нүктелердің орташа мәнімен анықталады. Тағы да әрбір деректер нүктесі ең жақын центроидқа тағайындалады. Бұл процесс центроидтар өзгермейінше қайталанады. k-орташа – жылдам кластерлеу алгоритмі, бірақ кластерлеу нүктелерінің нақты инициализациясы жоқ. Сондай-ақ, кластер нүктелерін инициализациялауға негізделген кластерлеу үлгілерінің үлкен вариациясы бар.

Тағы бір кластерлеу алгоритмі - тығыздыққа негізделген кластерлеу. Ол сондай-ақ шуы бар тығыздыққа негізделген кеңістіктік кластерлеу қолданбалары ретінде белгілі. Ол кластерді тығыздық қосылған нүктелердің максималды жиыны ретінде анықтау арқылы жұмыс істейді. Олар тығыздыққа негізделген кластерлеу үшін қолданылатын екі параметр. Олар Ɛ (эпсилон) және минималды нүктелер. Ɛ - маңайдың ең үлкен радиусы. Ең аз нүктелер кластерді анықтау үшін Ɛ маңындағы нүктелердің ең аз саны болып табылады. Бұл бақылаусыз оқытуға жататын кластерлеудің кейбір мысалдары.

Жалпы, бақылаусыз оқыту алгоритмдерінен алынған нәтижелер дәл әрі сенімді емес, себебі құрылғы жасырын үлгілер мен функцияларды анықтау алдында кіріс деректерін анықтап, белгілеуі керек.

Бақыланатын және бақыланбайтын машиналық оқытудың қандай ұқсастығы бар?

Бақыланатын және бақыланбайтын оқытудың екеуі де машиналық оқытудың түрлері

Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы неде?

Қадағаланатын және бақыланбайтын машиналық оқыту

Бақыланатын оқыту – мысал енгізу-шығару жұптары негізінде кірісті шығысқа салыстыратын функцияны үйренуге арналған Machine Learning тапсырмасы. Бақыланбайтын оқыту – таңбаланбаған деректерден жасырын құрылымды сипаттау функциясын шығаруға арналған Machine Learning тапсырмасы.
Негізгі функция
Бақыланатын оқытуда модель белгіленген кіріс деректеріне негізделген нәтижені болжайды. Бақылаусыз оқытуда үлгі үлгілерді өздігінен анықтау арқылы таңбаланған деректерсіз нәтижені болжайды.
Нәтижелердің дәлдігі
Бақыланатын оқыту әдістерінен алынған нәтижелер дәлірек және сенімдірек. Бақыланбайтын оқыту әдістерінен алынған нәтижелер дәл әрі сенімді емес.
Негізгі алгоритмдер
Бақыланатын оқытуда регрессия және классификация алгоритмдері бар. Бақылаусыз оқытуда кластерлеу алгоритмдері бар.

Қорытынды – Бақыланатын және Бақыланбайтын машиналық оқыту

Бақыланатын оқыту және бақылаусыз оқыту - бұл машиналық оқытудың екі түрі. Бақыланатын оқыту – мысал енгізу-шығару жұптары негізінде кірісті шығысқа салыстыратын функцияны үйренуге арналған Machine Learning тапсырмасы. Бақыланбайтын оқыту – таңбаланбаған деректерден жасырын құрылымды сипаттау функциясын шығаруға арналған Machine Learning тапсырмасы. Бақыланатын және бақыланбайтын машиналық оқытудың айырмашылығы мынада: қадағаланатын оқыту таңбаланған деректерді пайдаланады, ал бақыланбайтын бейімдеу таңбаланбаған деректерді пайдаланады.

Ұсынылған: