Жартылай қосылу және Блумға қосылу
Жартылай біріктіру және Блуммен біріктіру - таратылған дерекқорлар үшін сұрауларды өңдеуде қолданылатын екі біріктіру әдісі. Бөлінген дерекқорлардағы сұрауларды өңдеу кезінде деректерді әртүрлі тораптарда орналасқан дерекқорлар арасында тасымалдау қажет. Бұл тасымалдау қажет деректер көлеміне байланысты қымбат операция болуы мүмкін. Сондықтан, таратылған дерекқор ортасында сұрауларды өңдеу кезінде тораптар арасында тасымалданатын деректер көлемін азайту үшін сұрауларды оңтайландыру маңызды. Жартылай біріктіру және гүлденуді біріктіру - деректерді тасымалдау көлемін азайту және сұранысты тиімді өңдеуді орындау үшін пайдалануға болатын екі әдіс.
Жартылай қосылу дегеніміз не?
Жартылай біріктіру – таратылған дерекқор орталарында сұранысты тиімді өңдеу үшін қолданылатын әдіс. 1-сайтта орналасқан Қызметкерлердің дерекқоры (қызметкердің аты-жөні, ол жұмыс істейтін бөлім нөмірі және т.б. мәліметтерді сақтайды) және сайтта орналасқан Бөлім дерекқоры (бөлім нөмірі, бөлім атауы, орналасқан жері және т.б. сияқты ақпаратты сақтайтын) жағдайды қарастырыңыз. 2. Мысалы, егер біз 3-сайтта орналасқан сұрау процессорында сұрауды орындау арқылы ол жұмыс істейтін қызметкердің аты-жөнін және бөлімнің атын (тек «Нью-Йоркте» орналасқан бөлімшелер үшін) алғымыз келсе, оның бірнеше жолы бар. бұл тапсырманы орындау үшін деректерді үш сайт арасында тасымалдауға болады. Бірақ деректерді тасымалдау кезінде сайттар арасында бүкіл дерекқорды тасымалдау қажет емес екенін ескеру маңызды. Сұрауды тиімді орындау үшін тораптар арасында біріктіру үшін қажет кейбір атрибуттарды (немесе кортеждерді) ғана тасымалдау қажет. Жартылай біріктіру - сайттар арасында жіберілетін деректер көлемін азайту үшін қолданылатын әдіс. Жартылай біріктіруде тек біріктіру бағаны бір тораптан екіншісіне тасымалданады, содан кейін сол тасымалданған баған басқа тораптар арасындағы жөнелтілген қатынастардың өлшемін азайту үшін пайдаланылады. Жоғарыда келтірілген мысал үшін сіз жай ғана орналасқан жері=“Нью-Йорк” кортеждерінің бөлім нөмірін және бөлім атауын 2-сайттан 1-сайтқа тасымалдай аласыз және 1-сайтта қосылуды орындап, соңғы қатынасты 3-сайтқа қайта жібере аласыз.
Blum Join дегеніміз не?
Бұрын айтылғандай, блум біріктіру – таратылған дерекқор орталарында сұрауларды орындау кезінде сайттар арасында қажетсіз деректерді тасымалдауды болдырмау үшін қолданылатын басқа әдіс. Блум қосылымында біріктіру бағанының өзін тасымалдаудың орнына, біріктіру бағанының ықшам көрінісі тораптар арасында тасымалданады. Bloom қосылымы мүшелік сұрауларды орындау үшін бит векторын пайдаланатын гүлдену сүзгісін пайдаланады. Біріншіден, біріктіру бағанының көмегімен гүлдену сүзгісі құрастырылады және ол тораптар арасында тасымалданады, содан кейін біріктіру операциялары орындалады.
Жартылай қосылу мен Bloom қосылудың айырмашылығы неде?
Жартылай біріктіру және гүлдену біріктіру әдістерінің екеуі де таратылған дерекқор ортасында сұрауларды орындау кезінде тораптар арасында тасымалданатын деректер көлемін азайту үшін пайдаланылса да, bloom біріктіру тасымалданатын деректер көлемін (кортеждер санын) төмендетеді. жиын мүшеліктерін анықтау үшін бит векторын пайдаланатын гүлдену сүзгілерінің тұжырымдамасын пайдалану арқылы жартылай біріктіру. Сондықтан жартылай біріктіруді пайдаланудан гөрі гүлденуді пайдалану тиімдірек болады.