Apache Spark MLlib პლატფორმა მონაცემთა ტბებში მოთხოვნების დამუშავებისთვის
Main Article Content
ანოტაცია
დიდი მონაცემების ეპოქაში, მონაცემთა ტბები შეუცვლელი გახდა სტრუქტურირებული და
არასტრუქტურირებული ტიპის დიდი მასშტაბის მონაცემების შესანახად. ტრადიციული მონაცემთა ბაზებისგან
განსხვავებით, მონაცემთა ტბები ინახავს ნედლ მონაცემებს საკუთარ ფორმატში, რაც უზრუნველყოფს მოქნილობას
მომავალი ანალიზისთვის. თუმცა, მონაცემთა მოცულობა და მრავალფეროვნება მონაცემთა ტბებში წარმოადგენს
გამოწვევებს მოთხოვნის ეფექტური დამუშავებისთვის. ნაშრომში წარმოდგენილა მონაცემთა ტბების, როგორც
ცენტრალიზებული საცავის როლი და მნიშვნელობა მასშტაბური მონაცემების შენახვისა და ანალიზისთვის. ასევე
მოცემულია მონაცემთა ტბების სირთულეები დამუშავების თვალსაზრისით. აღნიშნულ პრობლემასთან
გამკლავების მიზნით წარმოდგენილია Apache Spark ინსტრუმენტის როლი, როგორც მოქნილი ანალიტიკური
მექანიზმი მონაცემთა ფართომასშტაბიანი დამუშავებისთვის. აღწერილია Apache Spark MLlib უპირატესობები
მონაცემთა ტბებში მოთხოვნების დამუშავების პრობლემების გადასალახად. წარმოდგენილია პლატფორმები და
სერვისები, რომლებიც იყენებენ Apache Spark MLlib-ს ინდუსტრიის აპლიკაციებს. ასევე განხილულია რეალური
თანამედროვე აპლიკაციები და კვლევის მომავალი ტენდენციები და მიმართულებები.