A gépi tanulásban az osztályozási feladatok központi szerepet töltenek be. Ezeknél a feladatoknál bemenet-kimenet párokból álló minta alapján kell a kimeneti osztályváltozót a bemeneti változó segítségével modellezni. Általában az optimális osztályozó és/vagy a regressziós függvény becslése a cél.
Ehhez kapcsolódóan a hallgató érdeklődéséhez mérten többféle feladat is kitűzhető:
1) A regressziós függvény egy adott pontbecsléséhez hogyan konstruálható konfidenciahalmaz minél gyengébb statisztikai feltevések mellett? Ezek a konstrukciók milyen elméleti garanciákat szolgáltatnak (egzaktság, konzisztencia)? Ezekhez a kérdésekhez kiindulási alapot adhat többek között a statisztikus tanuláselmélet, a VC dimenzió fogalma és a Rademacher-bonyolultság.
2) Izgalmas projekt feladat lehet a meglévő konfidenciahalmaz-konstrukciók implementálása és hozzáférhető adathalmazokon való validálása, illetve a halmazbecslések fejlesztése a tapasztalati eredmények alapján.
Hivatkozások
1) Devroye, Luc, et al. A Probabilistic Theory of Pattern Recognition, Vol. 31. Springer Science & Business Media, 2013, https://www.szit.bme.hu/~gyorfi/pbook.pdf
2) Györfi, László, et al. A Distribution-Free Theory of Nonparametric Regression. Vol. 1. New York: Springer, 2002.
3) Csáji, Balázs Csanád, et al. "Sign-perturbed sums: A new system identification approach for constructing exact non-asymptotic confidence regions in linear regression models." IEEE Transactions on Signal Processing 63.1 (2014): 169-181.
4) Tamás, Ambrus, and Balázs Csanád Csáji. "Exact Distribution-Free Hypothesis Tests for the Regression Function of Binary Classification via Conditional Kernel Mean Embeddings." IEEE Control Systems Letters 6 (2021): 860-865.