Optimalizációs módszerek az önjáró autók látó rendszereiben
Témavezető: | Hajder Levente |
Eötvös Loránd University | |
email: | hajder@ik.elte.hu |
Projekt leírás
Az önvezető autózás napjaink egyik érdekes, intenzíven fejlődő területe, ahol a kutatási és a fejlesztési munkák szoros együttműködésére van szükség. Az önvezető járműveket különféle szenzorokkal szerelik fel, a hagyományos kameráktól a gyorsulásérzékelőkön át egészen a 3D-s szkennelésre képes lézeres letapogatókig, LiDAR mérőeszközökig. A szakemberek között komoly vita van arról, hogy milyen érzékelőket érdemes alkalmazni, az azonban biztosnak látszik, hogy digitális kamerákra mindenképpen szükség van. A kamerák működésének alapja, hogy az egyes pixelekhez a térben vetítősugarak tartoznak. Legalább két különböző helyzetű kamera esetén a két képen az összetartozó pixelek egy-egy sugarat határoznak meg, ezeknek térbeli metszéspontja adja a háromdimenziós helyét a megfigyelt pontnak. A kamerák működését a projektív geometria írja le. A térbeli gépi látás feladatainak megoldásához elsősorban becslési eljárásokat szokás használni, melyek a lineáris algebra és a statisztika eszközkészletére épülnek. Az önálló feladat során a hallgató először megismerkedik a projektív geometriával, azon belül is a kamerapárokat leíró epipoláris geometriával, megtanulja, hogyan lehet pontmegfeleltetésekből térbeli pozíciókat becsülni, affin megfeleltetésből pedig a felületi normálvektorokat. A konkrét feladat autókra szerelt kamerapárokból 3D-s információkat kinyerni. A munka során elsősorban síkfelületekre koncentrálunk, hiszen ilyenek városi környezetben sokszor előfordulnak: a legnagyobb, gépi látás szempontjából fontos síkfelületek a házfalak, a legkisebbek a közlekedési táblák. A becslő eljárások során nagyon fontos a robusztusság: ha a képen a pontok egymásnak nem felelnek meg, más tárgyponthoz tartoznak, az eredmény téves lesz. Ezeket a téves megfeleltetéseket statisztikai módszerekkel ki kell szűrni. A munkából TDK dolgozat is készíthető, komolyabb időráfordítás esetén szakirodalmi cikk is születhet.
Előfeltételek
● angol nyelvtudás (szakirodalom olvasása) ● MATLAB, esetleg C/C++ programozási készség
Hivatkozások
Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision Second Edition Cambridge University Press, March 2004. http://cvrs.whu.edu.cn/downloads/ebooks/Multiple%20View%20Geometry%20in%20Computer%20 Vision%20(Second%20Edition).pdf Richard Szeliski. Computer Vision: Algorithms and Applications Microsoft Research 2010. http://szeliski.org/Book/ http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf