Surround Vision Object Detection Using Deep Learning

The thesis first develops an object detection framework for front view camera images in surround vision data set. And with the goal of reducing as much annotated data as possible, various domain adaptation methods are applied to train other camera images based on the pretraining of a baseline model....

Full description

Bibliographic Details
Main Author: Gao, Yuan
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2018
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231929
id ndltd-UPSALLA1-oai-DiVA.org-kth-231929
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2319292018-09-01T05:53:50ZSurround Vision Object Detection Using Deep LearningengGao, YuanKTH, Skolan för elektroteknik och datavetenskap (EECS)2018Engineering and TechnologyTeknik och teknologierThe thesis first develops an object detection framework for front view camera images in surround vision data set. And with the goal of reducing as much annotated data as possible, various domain adaptation methods are applied to train other camera images based on the pretraining of a baseline model. Relevant data analysis work is performed to reveal useful information in object distribution over all cameras. Regularization techniques involving dropout, weight decay, data augmentation are attempted to lower the complexity of training model. Also, the experiments of ratio reduction are carried out to find the relationship between model performance and the amount of training data. It is shown that 30% of the training data for left rear and left front view cameras can be reduced without hurting the model performance significantly. In addition, the thesis plots the errors regarding vehicle locations through heatmap which is useful for further study. Overall, the results in these extensive experiments indicate that the model trained by domain adaptation is effective as expected. Avhandlingen börjar med att utveckla ett ramverk för objektdetektering i bilder från den framåtriktade kameran i surroundvision-data. Med målet att minska mängden annoterad data så mycket som möjligt, tillämpas olika metoder för domänanpassning för att träna på andra kamerabilder baserat på en basmodell. Relevant dataanalys utförs som avslöjar användbar information i objektdistributioner för alla kamerorna. Regulariseringstekniker som infattar Dropout, viktsönderfall, data-augmentering testas för att reducera träningsmodellens komplexitet. Experiment med kvotreduktion utförs också för att hitta förhållandet mellan modellens prestanda och mängden träningsdata. Det påvisas att 30% av träningsdata för den vänstra bakåtriktade och den vänstra framåtriktade kameran kan reduceras utan att modellens prestanda minskar väsentligt. Dessutom visas i avhandlingen felen angående fordonens placeringar genom värmekartor som är användbara för vidare studier. Sammantaget indikerar resultaten i dessa omfattande experiment på att modellen tränad med domänanpassning är, som förväntat, effektiv. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231929TRITA-EECS-EX ; 2018:404application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Engineering and Technology
Teknik och teknologier
spellingShingle Engineering and Technology
Teknik och teknologier
Gao, Yuan
Surround Vision Object Detection Using Deep Learning
description The thesis first develops an object detection framework for front view camera images in surround vision data set. And with the goal of reducing as much annotated data as possible, various domain adaptation methods are applied to train other camera images based on the pretraining of a baseline model. Relevant data analysis work is performed to reveal useful information in object distribution over all cameras. Regularization techniques involving dropout, weight decay, data augmentation are attempted to lower the complexity of training model. Also, the experiments of ratio reduction are carried out to find the relationship between model performance and the amount of training data. It is shown that 30% of the training data for left rear and left front view cameras can be reduced without hurting the model performance significantly. In addition, the thesis plots the errors regarding vehicle locations through heatmap which is useful for further study. Overall, the results in these extensive experiments indicate that the model trained by domain adaptation is effective as expected. === Avhandlingen börjar med att utveckla ett ramverk för objektdetektering i bilder från den framåtriktade kameran i surroundvision-data. Med målet att minska mängden annoterad data så mycket som möjligt, tillämpas olika metoder för domänanpassning för att träna på andra kamerabilder baserat på en basmodell. Relevant dataanalys utförs som avslöjar användbar information i objektdistributioner för alla kamerorna. Regulariseringstekniker som infattar Dropout, viktsönderfall, data-augmentering testas för att reducera träningsmodellens komplexitet. Experiment med kvotreduktion utförs också för att hitta förhållandet mellan modellens prestanda och mängden träningsdata. Det påvisas att 30% av träningsdata för den vänstra bakåtriktade och den vänstra framåtriktade kameran kan reduceras utan att modellens prestanda minskar väsentligt. Dessutom visas i avhandlingen felen angående fordonens placeringar genom värmekartor som är användbara för vidare studier. Sammantaget indikerar resultaten i dessa omfattande experiment på att modellen tränad med domänanpassning är, som förväntat, effektiv.
author Gao, Yuan
author_facet Gao, Yuan
author_sort Gao, Yuan
title Surround Vision Object Detection Using Deep Learning
title_short Surround Vision Object Detection Using Deep Learning
title_full Surround Vision Object Detection Using Deep Learning
title_fullStr Surround Vision Object Detection Using Deep Learning
title_full_unstemmed Surround Vision Object Detection Using Deep Learning
title_sort surround vision object detection using deep learning
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2018
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231929
work_keys_str_mv AT gaoyuan surroundvisionobjectdetectionusingdeeplearning
_version_ 1718727680903348224