Категориялық деректер және сандық деректер
Деректер - анықтама немесе талдау мақсатында жиналған фактілер немесе ақпарат. Көбінесе бұл деректер тиісті субъектінің атрибуты ретінде жиналады. Бұл атрибут бірінен екіншісіне өзгеруі мүмкін, сондықтан бұл өзгермелі атрибут айнымалы ретінде қарастырылуы мүмкін. Айнымалылар мәндердің әртүрлі пішіндерін қабылдай алады және олар жиналған деректерде ішкі болып табылады.
Айнымалылар сапалы немесе сандық болуы мүмкін; яғни айнымалы сандық болса, жауаптар сандар болып табылады және өлшенетін атрибуттың шамасын белгілі бір дәлдікпен айтуға болады. Басқа түрі, сапалық айнымалылар сапалы атрибуттарды өлшейді және айнымалылар қабылдайтын мәндерді өлшем немесе шама тұрғысынан беру мүмкін емес. Айнымалылардың өзі категориялық айнымалылар ретінде белгілі және категориялық айнымалы арқылы жиналған деректер категориялық деректер болып табылады.
Сандық деректер туралы толығырақ
Сандық деректер негізінен айнымалыдан алынған сандық деректер болып табылады және мәннің өлшем/шама сезімі бар. Алынған сандық деректер Стэнли Смит Стивенс әзірлеген теорияға негізделген тағы үш санатқа бөлінеді. Сандық деректер реттік, интервал немесе қатынас болуы мүмкін. Деректер түрі мәндерді өлшеу әдісімен анықталады, ал түрлері өлшеу деңгейлері ретінде белгілі.
Адамның салмағы, екі нүкте арасындағы қашықтық, температура және акция бағасы сандық деректердің мысалы болып табылады.
Статистикада әдістердің көпшілігі сандық деректерді талдауға арналған. Сандық деректерді талдау үшін негізгі сипаттамалық статистика, регрессия және басқа қорытынды әдістер қолданылады.
Категориялық деректер туралы толығырақ
Категориялық деректер сапалы айнымалыға, көбінесе санға, сөзге немесе таңбаға арналған мәндер. Олар қарастырылатын жағдайдағы айнымалының қол жетімді бірнеше таңдаудың біріне жататынын көрсетеді. Сондықтан олар санаттардың біріне жатады; сондықтан атау категориялық.
Адамның саяси ұстанымы, ұлты, адамның жақсы көретін түсі, науқастың қан тобы – сапалық белгілер. Кейде санды категориялық мән ретінде алуға болады, бірақ санның өзі өлшенетін атрибуттың шамасын білдірмейді. Пошта индексі бір мысал.
Сонымен қатар кез келген категориялық мәндер номиналды деректер түріне жатады, ол өлшем деңгейлеріне негізделген басқа түр болып табылады. Категориялық деректерді талдау үшін қолданылатын әдістер сандық деректерден өзгеше, бірақ негізгі принцип бірдей болуы мүмкін.
Категориялық және сандық деректердің айырмашылығы неде?
• Сандық деректер сандық айнымалы үшін алынған мәндер болып табылады және айнымалы мәнмәтінге қатысты шама сезімін білдіреді (сондықтан олар әрқашан сандық мәнді қамтитын сандар немесе таңбалар). Категориялық деректер – сапалық айнымалы үшін алынған мәндер; категориялық деректер сандары үлкен мәнді білдірмейді.
• Сандық деректер әрқашан реттік, қатынас немесе интервал түріне жатады, ал категориялық деректер номиналды түрге жатады.
• Сандық деректерді талдау үшін қолданылатын әдістер категориялық деректер үшін қолданылатын әдістерден ерекшеленеді, тіпті принциптер бірдей болса да, қолданбада айтарлықтай айырмашылықтар болса да.
• Сандық деректер сипаттамалық статистикада, регрессияда, уақыттық қатарларда және т.б. статистикалық әдістер арқылы талданады.
• Категориялық деректер үшін әдетте сипаттамалық әдістер мен графикалық әдістер қолданылады. Кейбір параметрлік емес сынақтар да қолданылады.