Сызықтық және логистикалық регрессия
Статистикалық талдауда зерттеуге қатысты айнымалылар арасындағы байланыстарды анықтау маңызды. Кейде бұл талдаудың жалғыз мақсаты болуы мүмкін. Қарым-қатынастың бар екенін анықтау және байланысты анықтау үшін қолданылатын күшті құралдардың бірі - регрессиялық талдау.
Регрессиялық талдаудың қарапайым түрі – сызықтық регрессия, мұнда айнымалылар арасындағы қатынас сызықтық қатынас болып табылады. Статистикалық терминдерде ол түсіндірме айнымалы мен жауап айнымалысы арасындағы байланысты көрсетеді. Мысалы, регрессияны пайдалана отырып, біз кездейсоқ іріктеуден жиналған деректер негізінде тауар бағасы мен тұтыну арасындағы байланысты белгілей аламыз. Регрессиялық талдау деректер жиынының регрессия функциясын жасайды, ол қол жетімді деректерге жақсы сәйкес келетін математикалық модель болып табылады. Мұны шашыраңқы сызба арқылы оңай көрсетуге болады. Графикалық регрессия берілген деректер жиыны үшін ең жақсы сәйкес келетін қисық сызығын табуға тең. Қисықтың функциясы регрессия функциясы болып табылады. Математикалық модельді пайдалану арқылы тауардың пайдаланылуын берілген баға бойынша болжауға болады.
Сондықтан регрессиялық талдау болжау мен болжауда кеңінен қолданылады. Ол сондай-ақ эксперименттік деректерде, физика, химия салаларында және көптеген жаратылыстану ғылымдары мен инженерлік пәндердегі байланыстарды орнату үшін қолданылады. Егер байланыс немесе регрессия функциясы сызықтық функция болса, онда процесс сызықтық регрессия деп аталады. Шашырау сызбасында оны түзу сызық түрінде көрсетуге болады. Егер функция параметрлердің сызықтық комбинациясы болмаса, регрессия сызықты емес.
Логистикалық регрессия көп айнымалы регрессиямен салыстырылады және ол жауап айнымалысына бірнеше болжаушылардың әсерін түсіндіру үшін үлгі жасайды. Дегенмен, логистикалық регрессияда түпкілікті нәтиже айнымалысы категориялық болуы керек (әдетте бөлінген; яғни, өлім немесе тірі қалу сияқты қол жеткізуге болатын нәтижелер жұбы, дегенмен арнайы әдістер санатталған ақпаратты модельдеуге мүмкіндік береді). Үздіксіз нәтиже айнымалысы логистикалық регрессия үшін пайдаланылатын категориялық айнымалыға айналуы мүмкін; дегенмен, үздіксіз айнымалы мәндерді осылай жию негізінен дұрыс емес, себебі ол дәлдікті төмендетеді.
Сызықтық регрессиядан айырмашылығы, орташа мәнге қарай, логистикалық регрессиядағы болжаушы айнымалылар сызықты байланысқан, жалпы таралған немесе әрбір кластер ішінде бірдей дисперсияға ие болуға мәжбүр етілмейді. Нәтижесінде болжауыш пен нәтиже айнымалылары арасындағы қатынас сызықтық функция болуы мүмкін емес.
Логистикалық және сызықтық регрессияның айырмашылығы неде?
• Сызықтық регрессияда түсіндірмелі айнымалы мен жауап айнымалысы арасындағы сызықтық қатынас қабылданады және нақты қатынасты беру үшін үлгіні қанағаттандыратын параметрлер талдау арқылы табылады.
• Сызықтық регрессия сандық айнымалылар үшін орындалады және нәтижелі функция сандық болады.
• Логистикалық регрессияда пайдаланылатын деректер категориялық немесе сандық болуы мүмкін, бірақ нәтиже әрқашан категориялық болады.