Apache Spark MLlib პლატფორმა მონაცემთა ტბებში მოთხოვნების  დამუშავებისთვის

გიორგი მურადოვი

გიორგი მურადოვი

ანოტაცია

დიდი მონაცემების ეპოქაში, მონაცემთა ტბები შეუცვლელი გახდა სტრუქტურირებული და
არასტრუქტურირებული ტიპის დიდი მასშტაბის მონაცემების შესანახად. ტრადიციული მონაცემთა ბაზებისგან
განსხვავებით, მონაცემთა ტბები ინახავს ნედლ მონაცემებს საკუთარ ფორმატში, რაც უზრუნველყოფს მოქნილობას
მომავალი ანალიზისთვის. თუმცა, მონაცემთა მოცულობა და მრავალფეროვნება მონაცემთა ტბებში წარმოადგენს
გამოწვევებს მოთხოვნის ეფექტური დამუშავებისთვის. ნაშრომში წარმოდგენილა მონაცემთა ტბების, როგორც
ცენტრალიზებული საცავის როლი და მნიშვნელობა მასშტაბური მონაცემების შენახვისა და ანალიზისთვის. ასევე
მოცემულია მონაცემთა ტბების სირთულეები დამუშავების თვალსაზრისით. აღნიშნულ პრობლემასთან
გამკლავების მიზნით წარმოდგენილია Apache Spark ინსტრუმენტის როლი, როგორც მოქნილი ანალიტიკური
მექანიზმი მონაცემთა ფართომასშტაბიანი დამუშავებისთვის. აღწერილია Apache Spark MLlib უპირატესობები
მონაცემთა ტბებში მოთხოვნების დამუშავების პრობლემების გადასალახად. წარმოდგენილია პლატფორმები და
სერვისები, რომლებიც იყენებენ Apache Spark MLlib-ს ინდუსტრიის აპლიკაციებს. ასევე განხილულია რეალური
თანამედროვე აპლიკაციები და კვლევის მომავალი ტენდენციები და მიმართულებები.

pdf

საკვანძო სიტყვები:

მოთხოვნის დამუშავება, მონაცემთა ტბები, Apache Spark, MLlib, Big Data Analytics, Machine Learning.

გამოქვეყნებული: დეკ 7, 2024

გამოცემა

ტომ. 27 No. 2(76) (2024): ინტელექტი

სექცია

ინფორმაციის და კომუნიკაციის ტექნოლოგიები

PKPApplication::getCCLicenseBadge(https://creativecommons.org/licenses/by-nc/4.0)

Article Sidebar

Main Article Content

ანოტაცია

Article Details