Epidemiológiai modellezési módszerek a kockázatkezelésben

Témavezető: Darida Sándor
OTP Bank
email: Sandor.Darida@otpbank.hu

Projekt leírás

A módszer a fertőző betegségek matematikai modellezésén alapul. Az alapötlet, hogy a banki defaultot (bedőlést) egyfajta fertőzésként kezeljük, és a modell célja a fertőzésnek leginkább kitett entitások azonosítása. Az érintett populációt gráfként kezeljük, ahol a csúcsok az ügyfél-entitások és az élek írják le a kapcsolatot mely a fertőzés terjedését biztosítják.

Az eredeti (SI, SIR, stb.) epidemiológiai modellek esetén a fertőzési valószínűség a szomszédok számának függvényében leírható az alábbi képlettel: 1−ekγ∆t. Az új megközelítés az, hogy ún. „fuzzy-éleket” használunk, ahol ahelyett, hogy előre definiáljuk, hogy van e -él egy 0 és 1 közötti értékkel reprezentáljuk a két entitás közötti kapcsolat fertőzésterjesztési potenciálját. A

Banki kutatások igazolták, hogy ez az érték múltbéli terjedési adatok alapján modellezhető, melyből kiszámítható a fertőzési valószínűség. A modell performanciái jelentős szeparációs erőt mutatnak.

Feladat:

A jelenlegi eredmények igazolják, hogy egy megadott időintervallumra előre jelezhető a default-fertőzési valószínűség epidemiológiai modellekkel. Ebben az esetben „fuzzy-éleket” használunk azonban „fertőző” szomszédok „crisp” halmazt alkotnak (azaz valaki vagy fertőzött vagy nem). Nyitott kérdés, hogy finomítható -e tovább a modell azzal, ha a fertőző csúcsokat is egy 0 és 1 közti intervallumon értelmezzük. Banki környezetben megvan a lehetőség arra, hogy ezt az értéket valamilyen kockázati együtthatóval reprezentáljuk. A modell fejlesztése a jelentkező feladata lesz melyhez eszközt és maszkolt adatokat biztosítunk.

Egy másik továbblépési lehetőség, a fent leírt rendszer dinamikájának vizsgálata. Ismertek az állapottér várható értékeire felírható sztochasztikus differenciálegyenlet-rendszerei. A feladat ennek általánosítása, a lehetséges megoldások, fixpontok stb. vizsgálata.

Előfeltételek

· Középfokú angol nyelvtudás

· Legalább egy adatbányász szoftver alapfokú ismerete (Python, R, SAS)

· Legalább alapfokú SQL nyelv ismeret

Hivatkozások

Hitelkockázati modellek fejlesztése az OTP Bankban

Wikipedia, Predictive modelling

Wikipedia, Logistic regression ·

Wikipedia, Default

Wikipedia, Credit risk

Wikipedia, Mathematical modelling of infectious disease

Wikipedia, Compartmental models in epidemiology

Simon, P.L., Taylor, M., Kiss., I.Z., Exact epidemic models on graphs using graph-automorphism driven lumping, J. Math. Biol., 62, 479-508 (2011).