Айырмашылық пен Ковариация
Вариация және ковариация статистикада қолданылатын екі өлшем. Дисперсия – мәліметтердің шашырауының өлшемі, ал ковариация екі кездейсоқ шаманың бірге өзгеру дәрежесін көрсетеді. Дисперсия - бұл интуитивті ұғым, бірақ ковариация математикалық түрде бастапқыда онша интуитивті емес түрде анықталады.
Вариация туралы толығырақ
Дисперсиялық – таралудың орташа мәнінен деректердің дисперсиясының өлшемі. Ол деректер нүктелерінің таралудың орташа мәнінен қаншалықты қашықтықта жатқанын көрсетеді. Бұл ықтималдық үлестірімінің негізгі дескрипторларының бірі және таралу сәттерінің бірі. Сондай-ақ, дисперсия жиынтықтың параметрі болып табылады, ал жиынтықтан таңдаманың дисперсиясы жиынтық дисперсиясының бағалаушысы ретінде әрекет етеді. Бір жағынан, ол стандартты ауытқудың квадраты ретінде анықталады.
Қарапайым тілде оны әрбір деректер нүктесі мен таралу ортасы арасындағы қашықтық квадраттарының орташа мәні ретінде сипаттауға болады. Дисперсияны есептеу үшін келесі формула қолданылады.
Var(X)=E[(X-µ)2] популяция үшін және
Var(X)=E[(X-‾x)2] үлгі үшін
Var(X)=E[X2]-(E[X])2 мәнін беру үшін оны одан әрі жеңілдетуге болады.
Айырмашылықтың кейбір қолтаңбалық қасиеттері бар және оны пайдалануды жеңілдету үшін жиі статистикада қолданылады. Дисперсия теріс емес, өйткені ол қашықтықтардың квадраты. Дегенмен, дисперсия ауқымы шектелмейді және нақты үлестірімге байланысты. Тұрақты кездейсоқ шаманың дисперсиясы нөлге тең, ал дисперсия орналасу параметріне қатысты өзгермейді.
Коварианс туралы толығырақ
Статистикалық теорияда ковариация екі кездейсоқ шаманың бірге қаншалықты өзгеретінін көрсететін өлшем болып табылады. Басқаша айтқанда, ковариация екі кездейсоқ шама арасындағы корреляцияның күшін көрсететін өлшем. Сондай-ақ, оны екі кездейсоқ шаманың дисперсиясы тұжырымдамасының жалпылауы ретінде қарастыруға болады.
Ақырлы екінші импульспен бірге таралатын екі кездейсоқ шама X және Y ковариансы σXY=E[(X-E[X])(Y-E[" ретінде белгілі Y])]. Осыдан дисперсияны ковариацияның ерекше жағдайы ретінде көруге болады, мұнда екі айнымалы бірдей. Cov(X, X)=Var(X)
Ковариацияны қалыпқа келтіру арқылы сызықтық корреляция коэффициентін немесе Пирсон корреляция коэффициентін алуға болады, ол ρ=E[(X-E[X])(Y-E[Y])]/(σ ретінде анықталады. X σY)=(Cov(X, Y))/(σX σY )
Графикалық түрде, деректер нүктелерінің жұбы арасындағы ковариантты қарама-қарсы шыңдардағы деректер нүктелері бар тіктөртбұрыштың ауданы ретінде көруге болады. Оны екі деректер нүктесі арасындағы бөлу шамасының өлшемі ретінде түсіндіруге болады. Бүкіл халық үшін тіктөртбұрыштарды ескере отырып, барлық деректер нүктелеріне сәйкес келетін төртбұрыштардың қабаттасуын бөлудің күші ретінде қарастыруға болады; екі айнымалының дисперсиясы. Ковариация екі өлшемде, себебі екі айнымалы, бірақ оны бір айнымалыға жеңілдету бір өлшемдегі бөлу ретінде жалғыздың дисперсиясын береді.
Дисперсия мен ковариацияның айырмашылығы неде?
• Дисперсия – популяциядағы таралу/дисперсия өлшемі, ал коварианс екі кездейсоқ шаманың өзгеру өлшемі немесе корреляцияның күші ретінде қарастырылады.
• Дисперсияны ковариацияның ерекше жағдайы ретінде қарастыруға болады.
• Дисперсия мен ковариация деректер мәндерінің шамасына тәуелді және оларды салыстыруға болмайды; сондықтан олар нормаланады. Ковариация корреляция коэффициентіне (екі кездейсоқ шаманың стандартты ауытқуларының көбейтіндісіне бөлу) және дисперсия стандартты ауытқуға (квадрат түбірін алу арқылы) нормаланады