Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid

Inom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generel...

Full description

Bibliographic Details
Main Author: Manousian, Jonathan
Format: Others
Language:Swedish
Published: Mittuniversitetet, Institutionen för informationssystem och –teknologi 2020
Subjects:
OCR
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343
id ndltd-UPSALLA1-oai-DiVA.org-miun-39343
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-miun-393432020-06-26T03:29:49ZDigitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstidsweManousian, JonathanMittuniversitetet, Institutionen för informationssystem och –teknologi2020TensorFlowObject detectionOCRCropping.Software EngineeringProgramvaruteknikInom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generella hanteringen av pappersformulär genom inskanning. Detta kan göras genom att utnyttja en beskärningsfunktion vid inskanningen. Beskärningen används för att beskära bort irrelevant data från formuläret och därmed framhävs det som ska skannas in. Därefter kan objektigenkänning användas för att känna igen siffror och text från det framhävda fältet. En Androidapplikation har utvecklats som utnyttjar mobilens inbyggda kamera för att skanna in och framhäva viktiga fält från formulär. Parallellt tränades en maskininlärningsmodell, med TensorFlow, att känna igen handskrivna siffror. Den färdigtränade modellen jämfördes med olika OCR-verktyg och resultatet visade att modellen detekterar handskrivna siffror bättre. A workplace can be made more efficient by digitalization. An example of that is the handling of forms. Most of the time physical forms are manually digitalized. The aim of this project is to simplify the general handling of forms by automating the process. This could be done by scanning photos of forms and using a cropping function to highlight the important parts. By doing this we can use object detection to recognize the text or numbers on that highlighted field. An application was built that utilizes a phone camera to snap a photo of a form, and then a cropping function was implemented to crop out the important part of the form excluding irrelevant data. Parallel to that a machine learning model was trained with TensorFlow to recognize handwritten numbers to work with the application. The trained model was evaluated and compared to different OCR tools, and the results showed that a model trained to detect a specific handwriting works better than general OCR tools on handwritten digits. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343Local DT-V20-G3-014application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic TensorFlow
Object detection
OCR
Cropping.
Software Engineering
Programvaruteknik
spellingShingle TensorFlow
Object detection
OCR
Cropping.
Software Engineering
Programvaruteknik
Manousian, Jonathan
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
description Inom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generella hanteringen av pappersformulär genom inskanning. Detta kan göras genom att utnyttja en beskärningsfunktion vid inskanningen. Beskärningen används för att beskära bort irrelevant data från formuläret och därmed framhävs det som ska skannas in. Därefter kan objektigenkänning användas för att känna igen siffror och text från det framhävda fältet. En Androidapplikation har utvecklats som utnyttjar mobilens inbyggda kamera för att skanna in och framhäva viktiga fält från formulär. Parallellt tränades en maskininlärningsmodell, med TensorFlow, att känna igen handskrivna siffror. Den färdigtränade modellen jämfördes med olika OCR-verktyg och resultatet visade att modellen detekterar handskrivna siffror bättre. === A workplace can be made more efficient by digitalization. An example of that is the handling of forms. Most of the time physical forms are manually digitalized. The aim of this project is to simplify the general handling of forms by automating the process. This could be done by scanning photos of forms and using a cropping function to highlight the important parts. By doing this we can use object detection to recognize the text or numbers on that highlighted field. An application was built that utilizes a phone camera to snap a photo of a form, and then a cropping function was implemented to crop out the important part of the form excluding irrelevant data. Parallel to that a machine learning model was trained with TensorFlow to recognize handwritten numbers to work with the application. The trained model was evaluated and compared to different OCR tools, and the results showed that a model trained to detect a specific handwriting works better than general OCR tools on handwritten digits.
author Manousian, Jonathan
author_facet Manousian, Jonathan
author_sort Manousian, Jonathan
title Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
title_short Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
title_full Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
title_fullStr Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
title_full_unstemmed Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
title_sort digitalisering av handskrivna siffror på fysiska formulär : utvärdering av tillförlitlighet och träningstid
publisher Mittuniversitetet, Institutionen för informationssystem och –teknologi
publishDate 2020
url http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343
work_keys_str_mv AT manousianjonathan digitaliseringavhandskrivnasiffrorpafysiskaformularutvarderingavtillforlitlighetochtraningstid
_version_ 1719323631682584576