Data Mining және OLAP
Деректерді іздеу және OLAP екеуі де ортақ Business Intelligence (BI) технологияларының екеуі. Іскерлік интеллект бизнес деректерінен пайдалы ақпаратты анықтау және алу үшін компьютерге негізделген әдістерді білдіреді. Деректерді өндіру - бұл үлкен деректер жиынтығынан қызықты үлгілерді шығарумен айналысатын информатика саласы. Ол жасанды интеллект, статистика және дерекқорды басқарудың көптеген әдістерін біріктіреді. OLAP (онлайн аналитикалық өңдеу) аты айтып тұрғандай көпөлшемді дерекқорларды сұрау тәсілдерінің жинағы.
Деректерді өндіру деректердегі білімдерді табу (KDD) ретінде де белгілі. Жоғарыда айтылғандай, бұл бастапқы деректерден бұрын белгісіз және қызықты ақпаратты алумен айналысатын информатика саласы. Деректердің экспоненциалды өсуіне байланысты, әсіресе бизнес сияқты салаларда, деректерді өндіру осы үлкен деректер байлығын іскерлік интеллектке түрлендірудің өте маңызды құралы болды, өйткені соңғы бірнеше онжылдықта үлгілерді қолмен алу мүмкін емес болып көрінді. Мысалы, ол қазіргі уақытта әлеуметтік желілерді талдау, алаяқтықты анықтау және маркетинг сияқты әртүрлі қолданбалар үшін қолданылады. Деректерді іздеу әдетте келесі төрт тапсырмамен айналысады: кластерлеу, жіктеу, регрессия және ассоциация. Кластерлеу – құрылымдалмаған деректерден ұқсас топтарды анықтау. Жіктеу – жаңа деректерге қолданылуы мүмкін оқыту ережелері және әдетте келесі қадамдарды қамтиды: деректерді алдын ала өңдеу, модельдеуді жобалау, үйрену/мүмкіндіктерді таңдау және бағалау/тексеру. Регрессия - деректерді модельдеу үшін ең аз қатесі бар функцияларды табу. Ал ассоциация айнымалылар арасындағы қатынастарды іздейді. Деректерді өндіру әдетте Wal-Mart-та келесі жылы жоғары табыс алуға көмектесетін негізгі өнімдер қандай деген сұрақтарға жауап беру үшін пайдаланылады.
OLAP – көп өлшемді сұрауларға жауап беретін жүйелер класы. Әдетте OLAP маркетинг, бюджеттеу, болжау және ұқсас қосымшалар үшін қолданылады. OLAP үшін пайдаланылатын дерекқорлар жылдам өнімділікті ескере отырып, күрделі және арнайы сұраулар үшін конфигурацияланғаны айтпаса да түсінікті. Әдетте матрица OLAP шығысын көрсету үшін пайдаланылады. Жолдар мен бағандар сұрау өлшемдері арқылы жасалады. Олар жиі жиынтықты алу үшін бірнеше кестелерде біріктіру әдістерін пайдаланады. Мысалы, оны Wal-Mart-та өткен жылмен салыстырғанда осы жылдың сатылымы туралы білуге болады ма? Келесі тоқсандағы сатылымдар туралы болжам қандай? Пайыздық өзгеріске қарап, тренд туралы не айтуға болады?
Data mining және OLAP ұқсас екені анық болса да, олар интеллект алу үшін деректермен жұмыс істейді, негізгі айырмашылық олардың деректермен жұмыс істеу жолында. OLAP құралдары көп өлшемді деректерді талдауды қамтамасыз етеді және олар деректердің жиынтықтарын қамтамасыз етеді, бірақ керісінше, деректерді өңдеу деректер жиынындағы арақатынастарға, үлгілерге және әсерлерге бағытталған. Бұл біріктірумен OLAP мәмілесі, ол «қосу» арқылы деректердің жұмысына дейін төмендейді, бірақ деректерді өңдеу «бөлуге» сәйкес келеді. Тағы бір маңызды айырмашылық, деректерді өңдеу құралдары деректерді модельдейтін және әрекет ететін ережелерді қайтарған кезде, OLAP нақты уақытта бизнес өлшемі бойынша салыстыру және контраст әдістерін жүргізеді.