Novák Benedek Bálint: Statisztikus tanuláselmélet: eloszlás-független predikciós- és konfidencia tartományok

Önálló projekt, szakmai gyakorlat I

2024/25 I. félév

Témavezető:
Csáji Balázs Csanád (SZTAKI és ELTE TTK Valószínűségelméleti és Statisztika Tanszék)

A gépi tanulás egyik alapproblémája az általánosítóképesség kérdése: egy véges minta alapján becsült modell egy ismeretlen, új mintaelemen vett hatékonyságának garantálása. Ennek a problémakörnek egy változata, amikor az új megfigyelést egy megadott valószínűséggel tartalmazó predikciós tartomány konstruálása a cél. Ha például független, azonos eloszlású (i.i.d.) bemenet-kimenet párjaink vannak, akkor egy új, véletlen bemenet függvényében szeretnénk a kimenetre egy garantált tartománybecslést (skalár esetben intervallumot), vagy ha egy idősorból van egy véges mintánk, a következő egy vagy több megfigyelésre szeretnénk egy sztochasztikusan garantált tartományt. A feladat eloszlás-független predikciós és konfidenfia tartomány konstrukciók vizsgálata és strukturális feltevések alapján való finomítása.

Hivatkozások

  1. Csáji, B. Cs.; Horváth, B.: Nonparametric, Nonasymptotic Confidence Bands with Paley-Wiener Kernels for Band-Limited Functions, IEEE Control Systems Letters (L-CSS), IEEE Press, Vol. 6, 2022, pp. 3355–3360
  2. Glenn Shafer and Vladimir Vovk: A Tutorial on Conformal Prediction, Journal of Machine Learning Research, 9, Mar 2008, pp. 371-421.
  3. Algo Caré, Simone Garatti and Marco C. Campi: A Coverage Theory for Least Squares, Journal of the Royal Statistical Society B, 79, Part 5, 2017, pp. 1367–1389.
  4. Bernhard Schölkopf, and Alexander J. Smola: Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond, MIT Press, 2002.