Mesterséges intelligencia, gépi/mély tanulás: Generatív hangmodellezés

Témavezető: Lukács András
ELTE Matematikai Intézet, MI Kutatócsoport
email: andras.lukacs@ttk.elte.hu

Projekt leírás

Generatív típusú hálózatok (GAN) alkalmazása hangenerálási feladatokban. Cél olyan modellek megismerése, melyek beszédszintézisre lettek kifejlesztve, és ezek átalakítása klasszikus hangszerek hangjának generálására.

Előfeltételek

Hivatkozások

[1] Shalev-Shwartz, Shai, and Shai Ben-David. Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press, 2014. https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/understanding-machine-learning-theory-algorithms.pdf

[2] Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep learning. MIT Press, 2016. http://www.deeplearningbook.org/

[3] Joshi, Chaitanya: Transformers are Graph Neural Networks, Towards Data Science, 2020. https://towardsdatascience.com/transformers-are-graph-neural-networks-bca9f75412aa

[4] Gaál, Gusztáv, Balázs Maga, and András Lukács: Attention U-net based adversarial architectures for chest X-ray lung segmentation, arXiv:2003.10304, 2020. https://arxiv.org/abs/2003.10304

Korábbi hallgatók