Klasszifikációs modellbecslések bizonytalanságának vizsgálata

Témavezető: Tamás Ambrus
SZTAKI, ELTE
email: tamasamb@sztaki.hu

Projekt leírás

A gépi tanulásban az osztályozási feladatok központi szerepet töltenek be. Ezeknél a feladatoknál bemenet-kimenet párokból álló minta alapján kell a kimeneti osztályváltozót a bemeneti változó segítségével modellezni. Általában az optimális osztályozó és/vagy a regressziós függvény becslése a cél. Ehhez kapcsolódóan a hallgató érdeklődéséhez mérten többféle feladat is kitűzhető:

1) A regressziós függvény egy adott pontbecsléséhez hogyan konstruálható konfidenciahalmaz minél gyengébb statisztikai feltevések mellett? Ezek a konstrukciók milyen elméleti garanciákat szolgáltatnak (egzaktság, konzisztencia)? Ezekhez a kérdésekhez kiindulási alapot adhat többek között a statisztikus tanuláselmélet, a VC dimenzió fogalma és a Rademacher-bonyolultság.

2) Izgalmas projekt feladat lehet a meglévő konfidenciahalmaz-konstrukciók implementálása és hozzáférhető adathalmazokon való validálása, illetve a halmazbecslések fejlesztése a tapasztalati eredmények alapján.

Előfeltételek

1) Angol nyelv

2) Programozási alapok

Hivatkozások

1) Devroye, Luc, et al. A Probabilistic Theory of Pattern Recognition, Vol. 31. Springer Science & Business Media, 2013, https://www.szit.bme.hu/~gyorfi/pbook.pdf

2) Györfi, László, et al. A Distribution-Free Theory of Nonparametric Regression. Vol. 1. New York: Springer, 2002.

3) Csáji, Balázs Csanád, et al. "Sign-perturbed sums: A new system identification approach for constructing exact non-asymptotic confidence regions in linear regression models." IEEE Transactions on Signal Processing 63.1 (2014): 169-181.

4) Tamás, Ambrus, and Balázs Csanád Csáji. "Exact Distribution-Free Hypothesis Tests for the Regression Function of Binary Classification via Conditional Kernel Mean Embeddings." IEEE Control Systems Letters 6 (2021): 860-865.

Hallgató

Korábbi hallgatók