Epidemiológiai modellezési módszerek a kockázatkezelésben
Témavezető: | Darida Sándor |
OTP Bank | |
email: | Sandor.Darida@otpbank.hu |
Projekt leírás
A módszer a fertőző betegségek matematikai modellezésén alapul. Az alapötlet, hogy a banki defaultot (bedőlést) egyfajta fertőzésként kezeljük, és a modell célja a fertőzésnek leginkább kitett entitások azonosítása. Az érintett populációt gráfként kezeljük, ahol a csúcsok az ügyfél-entitások és az élek írják le a kapcsolatot mely a fertőzés terjedését biztosítják.
Az eredeti (SI, SIR, stb.) epidemiológiai modellek esetén a fertőzési valószínűség a szomszédok számának függvényében leírható az alábbi képlettel: 1−ekγ∆t. Az új megközelítés az, hogy ún. „fuzzy-éleket” használunk, ahol ahelyett, hogy előre definiáljuk, hogy van e -él egy 0 és 1 közötti értékkel reprezentáljuk a két entitás közötti kapcsolat fertőzésterjesztési potenciálját. A
Banki kutatások igazolták, hogy ez az érték múltbéli terjedési adatok alapján modellezhető, melyből kiszámítható a fertőzési valószínűség. A modell performanciái jelentős szeparációs erőt mutatnak.
Feladat:
A jelenlegi eredmények igazolják, hogy egy megadott időintervallumra előre jelezhető a default-fertőzési valószínűség epidemiológiai modellekkel. Ebben az esetben „fuzzy-éleket” használunk azonban „fertőző” szomszédok „crisp” halmazt alkotnak (azaz valaki vagy fertőzött vagy nem). Nyitott kérdés, hogy finomítható -e tovább a modell azzal, ha a fertőző csúcsokat is egy 0 és 1 közti intervallumon értelmezzük. Banki környezetben megvan a lehetőség arra, hogy ezt az értéket valamilyen kockázati együtthatóval reprezentáljuk. A modell fejlesztése a jelentkező feladata lesz melyhez eszközt és maszkolt adatokat biztosítunk.
Egy másik továbblépési lehetőség, a fent leírt rendszer dinamikájának vizsgálata. Ismertek az állapottér várható értékeire felírható sztochasztikus differenciálegyenlet-rendszerei. A feladat ennek általánosítása, a lehetséges megoldások, fixpontok stb. vizsgálata.
Előfeltételek
· Középfokú angol nyelvtudás
· Legalább egy adatbányász szoftver alapfokú ismerete (Python, R, SAS)
· Legalább alapfokú SQL nyelv ismeret
Hivatkozások
Hitelkockázati modellek fejlesztése az OTP Bankban
Wikipedia, Predictive modelling
Wikipedia, Logistic regression ·
Wikipedia, Default
Wikipedia, Credit risk
Wikipedia, Mathematical modelling of infectious disease
Wikipedia, Compartmental models in epidemiology
Simon, P.L., Taylor, M., Kiss., I.Z., Exact epidemic models on graphs using graph-automorphism driven lumping, J. Math. Biol., 62, 479-508 (2011).