Регрессия және корреляция
Статистикада екі кездейсоқ шама арасындағы байланысты анықтау маңызды. Ол басқаларға қатысты бір айнымалы туралы болжам жасау мүмкіндігін береді. Регрессиялық талдау және корреляция ауа райы болжамында, қаржы нарығының мінез-құлқында, эксперименттер арқылы физикалық байланыстарды орнатуда және әлдеқайда нақты әлем сценарийлерінде қолданылады.
Регрессия дегеніміз не?
Регрессия – екі айнымалы арасындағы қатынасты салу үшін қолданылатын статистикалық әдіс. Көбінесе деректер жиналғанда басқаларға тәуелді айнымалылар болуы мүмкін. Бұл айнымалылар арасындағы нақты байланысты тек регрессия әдістерімен анықтауға болады. Бұл қатынасты анықтау бір айнымалының екіншісіне әрекетін түсінуге және болжауға көмектеседі.
Регрессиялық талдаудың ең кең тараған қолданылуы берілген мән немесе тәуелсіз айнымалы мәндер ауқымы үшін тәуелді айнымалының мәнін бағалау болып табылады. Мысалы, регрессияны пайдалана отырып, біз кездейсоқ іріктеуден жиналған деректер негізінде тауар бағасы мен тұтыну арасындағы қатынасты белгілей аламыз. Регрессиялық талдау деректер жиынының регрессия функциясын жасайды, ол қол жетімді деректерге жақсы сәйкес келетін математикалық модель болып табылады. Мұны шашыраңқы сызба арқылы оңай көрсетуге болады. Графикалық түрде регрессия берілген деректер жиыны үшін ең жақсы сәйкес келетін қисық сызығын табуға тең. Қисықтың функциясы регрессия функциясы болып табылады. Математикалық модельді пайдалана отырып, белгілі бір баға бойынша тауарға сұранысты болжауға болады.
Сондықтан регрессиялық талдау болжау мен болжауда кеңінен қолданылады. Ол сондай-ақ эксперименттік деректерде, физика, химия салаларында және көптеген жаратылыстану ғылымдары мен инженерлік пәндердегі байланыстарды орнату үшін қолданылады. Егер байланыс немесе регрессия функциясы сызықтық функция болса, онда процесс сызықтық регрессия деп аталады. Шашырау сызбасында оны түзу сызық түрінде көрсетуге болады. Егер функция параметрлердің сызықтық комбинациясы болмаса, регрессия сызықты емес.
Корреляция дегеніміз не?
Корреляция – екі айнымалы арасындағы байланыстың беріктігінің өлшемі. Корреляция коэффициенті екінші айнымалының өзгеруіне негізделген бір айнымалының өзгеру дәрежесін сандық түрде көрсетеді. Статистикада корреляция екі айнымалы арасындағы статистикалық қатынас болып табылатын тәуелділік ұғымымен байланысты.
Пирсонс корреляция коэффициенті немесе жай ғана r корреляция коэффициенті -1 және 1 (-1≤r≤+1) арасындағы мән. Бұл ең жиі қолданылатын корреляция коэффициенті және тек айнымалылар арасындағы сызықтық қатынас үшін жарамды.r=0 болса, байланыс жоқ, ал r≥0 болса, қатынас тура пропорционал болады; яғни бір айнымалының мәні екіншісінің ұлғаюымен өседі. Егер r≤0 болса, қатынас кері пропорционал; яғни бір айнымалы азаяды, себебі екіншісі артады.
Сызықтылық шартына байланысты r корреляция коэффициентін айнымалылар арасында сызықтық байланыстың болуын анықтау үшін де пайдалануға болады.
Регрессия мен корреляцияның айырмашылығы неде?
Регрессия екі кездейсоқ шама арасындағы байланыстың формасын береді, ал корреляция қатынастың беріктік дәрежесін береді.
Регрессиялық талдау нәтижелерді экстраполяциялауға және болжауға көмектесетін регрессия функциясын жасайды, ал корреляция тек қай бағытта өзгеруі мүмкін екендігі туралы ақпарат бере алады.
Корреляция коэффициенті жоғарырақ болса, талдау арқылы дәлірек сызықтық регрессия үлгілері беріледі. (|r|≥0,8)