ДҚБЖ және Data Mining
ДҚБЖ (Дерекқорды басқару жүйесі) – дерекқор мазмұнын сақтауға, деректерді құруға/қолдануға, іздеуге және басқа да функцияларға мүмкіндік беретін сандық дерекқорларды басқару үшін пайдаланылатын толық жүйе. Екінші жағынан, Data Mining - бұл бастапқы деректерден бұрын белгісіз және қызықты ақпаратты алумен айналысатын информатика саласы. Әдетте, Деректерді іздеу процесі үшін кіріс ретінде пайдаланылатын деректер дерекқорларда сақталады. Статистикаға бейім пайдаланушылар Data Mining пайдаланады. Олар деректердегі жасырын үлгілерді іздеу үшін статистикалық модельдерді пайдаланады. Деректер өндірушілері әртүрлі деректер элементтері арасындағы пайдалы қарым-қатынастарды табуға мүдделі, бұл бизнес үшін тиімді.
ДҚБЖ
ДҚБЖ, кейде жай ғана дерекқор менеджері деп аталады, жүйеде (яғни қатты диск немесе желіде) орнатылған барлық дерекқорларды басқаруға (яғни ұйымдастыру, сақтау және іздеу) арналған компьютерлік бағдарламалардың жиынтығы.. Әлемде деректер қорын басқару жүйелерінің әртүрлі түрлері бар және олардың кейбіреулері белгілі бір мақсаттарға конфигурацияланған деректер қорын дұрыс басқаруға арналған. Ең танымал коммерциялық деректер қорын басқару жүйелері - Oracle, DB2 және Microsoft Access. Бұл өнімдердің барлығы әртүрлі пайдаланушылар үшін әртүрлі деңгейдегі артықшылықтарды бөлу құралдарын қамтамасыз етеді, бұл ДҚБЖ-ны бір әкімші арқылы орталықтан басқаруға немесе бірнеше әртүрлі адамдарға бөлуге мүмкіндік береді. Кез келген деректер қорын басқару жүйесінде төрт маңызды элемент бар. Олар модельдеу тілі, деректер құрылымдары, сұрау тілі және транзакциялар механизмі. Модельдеу тілі ДҚБЖ орналастырылған әрбір дерекқордың тілін анықтайды. Қазіргі уақытта иерархиялық, желілік, реляциялық және объектілік сияқты бірнеше танымал тәсілдер тәжірибеде. Деректер құрылымдары жеке жазбалар, файлдар, өрістер және олардың анықтамалары және көрнекі медиа сияқты нысандар сияқты деректерді ұйымдастыруға көмектеседі. Деректерді сұрау тілі кіру деректерін, әртүрлі пайдаланушыларға кіру құқықтарын және жүйеге деректерді қосу протоколдарын бақылау арқылы дерекқордың қауіпсіздігін қамтамасыз етеді. SQL - реляциялық деректер қорын басқару жүйелерінде қолданылатын танымал сұраныс тілі. Соңында, транзакцияларға мүмкіндік беретін механизм параллельділік пен көптікке көмектеседі. Бұл механизм бір жазбаны бір уақытта бірнеше пайдаланушылар өзгертпейтініне көз жеткізеді, осылайша деректер тұтастығын әдептілікте сақтайды. Сонымен қатар, ДҚБЖ сақтық көшірме жасауды және басқа мүмкіндіктерді де қамтамасыз етеді.
Деректерді жинау
Деректерді өндіру деректердегі білімді ашу (KDD) ретінде де белгілі. Жоғарыда айтылғандай, бұл бастапқы деректерден бұрын белгісіз және қызықты ақпаратты алумен айналысатын информатиканың фелиди. Деректердің экспоненциалды өсуіне байланысты, әсіресе бизнес сияқты салаларда, деректерді өндіру осы үлкен деректер байлығын іскерлік интеллектке түрлендірудің өте маңызды құралы болды, өйткені соңғы бірнеше онжылдықта үлгілерді қолмен алу мүмкін емес болып көрінді. Мысалы, ол қазіргі уақытта әлеуметтік желілерді талдау, алаяқтықты анықтау және маркетинг сияқты әртүрлі қолданбалар үшін қолданылады. Деректерді іздеу әдетте келесі төрт тапсырмамен айналысады: кластерлеу, жіктеу, регрессия және ассоциация. Кластерлеу – құрылымдалмаған деректерден ұқсас топтарды анықтау. Жіктеу – жаңа деректерге қолданылуы мүмкін оқыту ережелері және әдетте келесі қадамдарды қамтиды: деректерді алдын ала өңдеу, модельдеуді жобалау, үйрену/мүмкіндіктерді таңдау және бағалау/тексеру. Регрессия - деректерді модельдеу үшін ең аз қатесі бар функцияларды табу. Ал ассоциация айнымалылар арасындағы қатынастарды іздейді. Деректерді өндіру әдетте Wal-Mart-та келесі жылы жоғары табыс алуға көмектесетін негізгі өнімдер қандай? сияқты сұрақтарға жауап беру үшін пайдаланылады.
ДҚБЖ мен деректерді өңдеудің айырмашылығы неде?
ДҚБЖ – бұл сандық дерекқорлар жиынтығын орналастыруға және басқаруға арналған толыққанды жүйе. Дегенмен, Data Mining - бұл шикізат деректерінен пайдалы және бұрын белгісіз ақпаратты алумен айналысатын информатикадағы әдіс немесе тұжырымдама. Көбінесе бұл бастапқы деректер өте үлкен дерекқорларда сақталады. Сондықтан деректер өндірушілері Деректерді өндіру процесіне дейін және кезінде бастапқы деректерді өңдеу, басқару және тіпті алдын ала өңдеу үшін ДҚБЖ бар функцияларын пайдаланады. Дегенмен, ДҚБЖ жүйесін деректерді талдау үшін жалғыз пайдалану мүмкін емес. Бірақ қазіргі уақытта кейбір ДҚБЖ кірістірілген деректерді талдау құралдары немесе мүмкіндіктері бар.