3D modell skapas från billig video

tis, sep 04, 2018 09:58 CET

Hannes Ovrén visar i sin doktorsavhandling inom datorseende hur 3D modeller kan skapas från videor tagna med enkla kroppskameror. Forskningen öppnar nya möjligheter för både robotar och människor, inte minst för polis och räddningstjänst.

Forskningen inom datorseende har stor betydelse för utvecklingen inom artificiell intelligens, att robotar och andra system kan orientera sig och upptäcka föremål och människor är avgörande för utvecklingen av autonoma system.

Hannes Ovréns bidrag till utvecklingen handlar om att utifrån videofilmer, tagna av billiga kroppskameror, skapa en 3D modell av omgivningen, en modell som är helt skalenlig och mätbar.

– Idag rör sig robotar ganska försiktigt för att ta reda på var de är, de kan till och med behöva stanna upp för att lokalisera sig. Med den här tekniken kan roboten röra sig mera fritt och bygga en modell av sin omgivning medan den rör sig, säger Per-Erik Forssén, docent vid Avdelningen för datorseende och huvudhandledare till Hannes Ovrén.

Andra användningsområden är exempelvis inom polisen eller räddningstjänsten där de med en kamera på kroppen kan återskapa brotts- eller skadeplatsen i 3D i efterhand, med människor och föremål på exakt den plats de befann sig i fotoögonblicket.

Problemet med att skapa 3D modeller från enkla videokameror har hittills varit att kameran behöver stå stilla, helst på ett stativ. När kameran rör sig ser det på bilderna ut som raka föremål är böjda och står på olika höjd, de vobblar omkring och bilden blir distorderad. Orsaken till detta är att enkla kameror har en så kallad rullande slutare där bilden byggs upp pixelrad för pixelrad - som kamerorna i de smarta mobilerna.

– Det finns en rörelse i varje bildruta, men man kan göra bilden betydligt bättre genom att modellera hur kameran har rört sig och kompensera för det, berättar Hannes Ovrén.

För att beräkningarna inte ska bli alltför omfattande skapar han en kurva för hur kameran har rört sig, en så kallad spline. Kurvan byggs upp av knutpunkter där varje knutpunkt styr kurvans utseende vid en viss tidpunkt i filmen. Ju tätare knutpunkterna placeras desto mer komplicerade rörelser kan kurvan hantera - men beräkningarna blir också allt mer omfattande.

I avhandlingen visar Hannes Ovrén att det går att använda betydligt färre knutpunkter om man samtidigt modellerar det fel som uppstår på grund av att kurvan då rätas ut och blir mjukare. För att felet inte ska bli så stort använder han också en tröghetssensor som sätts fast på kameran, en liten och billig sensor som håller reda på accelerationen, vinkelhastigheten och riktningen mot jordplanet.

– Mätningarna från sensorn läggs också in beräkningarna och på så vis kan vi öka avståndet mellan kontrollpunkterna och minska storleken på beräkningarna, säger Hannes Ovrén.

Förenklingen innebär att kameran inte har rört sig exakt utmed kurvan men genom att även ta reda på hur skillnaden i rörelse påverkar storleken på mätfelet kan han vara ännu mera säker på att 3D-modellen och avstånden i den är rättvisande.

Hannes Ovrén försvarar sin avhandling den 7 september 2018.

Kontakt:

Per-Erik Forssén, per-erik.forssen@liu.se, 013 28 56 54

Hannes Ovrén, hannes.ovren@liu.se, 013 28 18 87

Video som illustrerar 3D-modellbygge från en sportkamera (GoPro):
https://www.youtube.com/watch?v=0jGfsWDHAZM

Pressmeddelandet skickat av Monica Westman, Vetenskapsredaktör, Linköpings universitet

www.liu.se 013-28 68 39, monica.westman@liu.se

Taggar:

Artificiell Intelligens 3D modell datorseende

3D modell skapas från billig video

Prenumerera

Media

Media

Dokument & länkar