Adatfolyam feldolgozó rendszerek optimalizálása párhuzamos feldolgozásra
Témavezető: | Benczúr András |
SZTAKI | |
email: | benczur@ilab.sztaki.hu |
Projekt leírás
Témavezető Sidló Csaba
Az elosztott adatfolyam feldolgozás és az elosztott adatbázis kezelés témái az utóbbi években sokat közeledtek egymáshoz, és elérhetővé váltak olyan rendszerek, amik már nem külön, hanem egységes keretben oldanak meg kötegelt és adatfolyam feladatokat. Cél egy ilyen rendszer, az Apache Spark Structured Streaming viselkedésének vizsgálata és elemzése többgépes (felhő) környezetben párhuzamosan futtatott job-okkal: az adat és a rendszer milyen paraméterei lényegesek teljesítmény szempontjából, és milyen lényegi összefüggések figyelhetők meg paraméterek és teljesítmény között.
Előfeltételek
alapszintű programozási és adatbázis-kezelési ismeretek
Hivatkozások
G. van Dongen and D. Van den Poel, "Evaluation of Stream Processing Frameworks," in IEEE Transactions on Parallel and Distributed Systems, vol. 31, no. 8, pp. 1845-1858, 2020