Apache Spark MLlib პლატფორმა მონაცემთა ტბებში მოთხოვნების დამუშავებისთვის

Main Article Content

გიორგი მურადოვი

ანოტაცია

დიდი მონაცემების ეპოქაში, მონაცემთა ტბები შეუცვლელი გახდა სტრუქტურირებული და
არასტრუქტურირებული ტიპის დიდი მასშტაბის მონაცემების შესანახად. ტრადიციული მონაცემთა ბაზებისგან
განსხვავებით, მონაცემთა ტბები ინახავს ნედლ მონაცემებს საკუთარ ფორმატში, რაც უზრუნველყოფს მოქნილობას
მომავალი ანალიზისთვის. თუმცა, მონაცემთა მოცულობა და მრავალფეროვნება მონაცემთა ტბებში წარმოადგენს
გამოწვევებს მოთხოვნის ეფექტური დამუშავებისთვის. ნაშრომში წარმოდგენილა მონაცემთა ტბების, როგორც
ცენტრალიზებული საცავის როლი და მნიშვნელობა მასშტაბური მონაცემების შენახვისა და ანალიზისთვის. ასევე
მოცემულია მონაცემთა ტბების სირთულეები დამუშავების თვალსაზრისით. აღნიშნულ პრობლემასთან
გამკლავების მიზნით წარმოდგენილია Apache Spark ინსტრუმენტის როლი, როგორც მოქნილი ანალიტიკური
მექანიზმი მონაცემთა ფართომასშტაბიანი დამუშავებისთვის. აღწერილია Apache Spark MLlib უპირატესობები
მონაცემთა ტბებში მოთხოვნების დამუშავების პრობლემების გადასალახად. წარმოდგენილია პლატფორმები და
სერვისები, რომლებიც იყენებენ Apache Spark MLlib-ს ინდუსტრიის აპლიკაციებს. ასევე განხილულია რეალური
თანამედროვე აპლიკაციები და კვლევის მომავალი ტენდენციები და მიმართულებები.

საკვანძო სიტყვები:
მოთხოვნის დამუშავება, მონაცემთა ტბები, Apache Spark, MLlib, Big Data Analytics, Machine Learning.
გამოქვეყნებული: დეკ 7, 2024

Article Details

სექცია
ინფორმაციის და კომუნიკაციის ტექნოლოგიები