Регрессия және ANOVA
Регрессия және ANOVA (Ауыспалылықты талдау) статистикалық теориядағы бір айнымалының екіншісімен салыстырғандағы әрекетін талдаудың екі әдісі болып табылады. Регрессияда бұл көбінесе тәуелсіз айнымалыға негізделген тәуелді айнымалының вариациясы, ал ANOVA-да бұл екі басқосудағы екі үлгінің атрибуттарының вариациясы.
Регрессия туралы толығырақ
Регрессия – екі айнымалы арасындағы қатынасты салу үшін қолданылатын статистикалық әдіс. Көбінесе деректер жиналғанда басқаларға тәуелді айнымалылар болуы мүмкін. Бұл айнымалылар арасындағы нақты байланысты тек регрессия әдістерімен орнатуға болады. Бұл қатынасты анықтау бір айнымалының екіншісіне әрекетін түсінуге және болжауға көмектеседі.
Регрессиялық талдаудың ең көп тараған қолданбасы берілген мән үшін тәуелді айнымалының мәнін немесе тәуелді айнымалылар мәндерінің ауқымын бағалау болып табылады. Мысалы, регрессияны пайдалана отырып, біз кездейсоқ іріктеуден жиналған деректер негізінде тауар бағасы мен тұтыну арасындағы байланысты белгілей аламыз. Регрессиялық талдау деректер жиынының регрессия функциясын жасайды, ол қол жетімді деректерге жақсы сәйкес келетін математикалық модель болып табылады. Мұны шашыраңқы сызба арқылы оңай көрсетуге болады. Графикалық регрессия берілген деректер жиыны үшін ең жақсы сәйкес келетін қисық сызығын табуға тең. Қисықтың функциясы регрессия функциясы болып табылады. Математикалық модельді пайдалана отырып, белгілі бір баға үшін тауарды пайдалануды болжауға болады.
Сондықтан регрессиялық талдау болжау мен болжауда кеңінен қолданылады. Ол сондай-ақ эксперименттік деректерде, физика, химия салаларында және көптеген жаратылыстану ғылымдары мен инженерлік пәндердегі байланыстарды орнату үшін қолданылады. Егер байланыс немесе регрессия функциясы сызықтық функция болса, онда процесс сызықтық регрессия деп аталады. Шашырау сызбасында оны түзу сызық түрінде көрсетуге болады. Егер функция параметрлердің сызықтық комбинациясы болмаса, регрессия сызықты емес.
ANOVA (Аспецияларды талдау) туралы толығырақ
ANOVA екі немесе одан да көп айнымалылар арасындағы байланысты талдауды анық қамтымайды. Керісінше, ол әртүрлі популяциялардан алынған екі немесе одан да көп үлгілердің бірдей орташа мәні бар-жоғын тексереді. Мысалы, мектептегі бағаға өткізілген емтиханның сынақ нәтижелерін қарастырайық. Тесттер әртүрлі болса да, өнімділік сыныптан сыныпқа бірдей болуы мүмкін. Мұны тексерудің бір әдісі - әр сыныптың құралдарын салыстыру. ANOVA немесе ANAlysis Of Variance бұл гипотезаны тексеруге мүмкіндік береді. Негізінде ANOVA-ны екі популяциядан алынған екі үлгінің орташалары салыстырылатын t-сынағының кеңейтімі ретінде қарастыруға болады.
ANOVA-ның іргелі идеясы - үлгідегі вариацияны және үлгілер арасындағы вариацияны қарастыру. Үлгідегі вариация кездейсоқтыққа жатқызылуы мүмкін, ал үлгілер арасындағы вариация кездейсоқтықпен де, басқа сыртқы факторлармен де байланысты болуы мүмкін. Дисперсиялық талдау үш модельге негізделген; тіркелген әсерлер үлгісі, кездейсоқ әсерлер үлгісі және аралас әсерлер үлгісі.
Регрессия мен ANOVA арасындағы айырмашылық неде?
• ANOVA – екі немесе одан да көп үлгілер арасындағы вариацияны талдау, ал регрессия – екі немесе одан да көп айнымалылар арасындағы байланысты талдау.
• ANOVA теориясы үш негізгі үлгіні (тұрақты әсерлер үлгісі, кездейсоқ әсерлер моделі және аралас әсерлер моделі), ал регрессия екі үлгіні (сызықтық регрессия үлгісі және көп регрессия үлгісі) арқылы қолданылады.
• ANOVA және регрессия екеуі де Жалпы сызықтық үлгінің (GLM) екі нұсқасы. ANOVA категориялық болжау айнымалыларына негізделген, ал регрессия сандық болжау айнымалыларына негізделген.
• Регрессия икемді әдіс болып табылады және ол болжау мен болжауда, ал ANOVA екі немесе одан да көп популяцияның теңдігін салыстыру үшін пайдаланылады.