Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid
Inom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generel...
Main Author: | |
---|---|
Format: | Others |
Language: | Swedish |
Published: |
Mittuniversitetet, Institutionen för informationssystem och –teknologi
2020
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343 |
id |
ndltd-UPSALLA1-oai-DiVA.org-miun-39343 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-miun-393432020-06-26T03:29:49ZDigitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstidsweManousian, JonathanMittuniversitetet, Institutionen för informationssystem och –teknologi2020TensorFlowObject detectionOCRCropping.Software EngineeringProgramvaruteknikInom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generella hanteringen av pappersformulär genom inskanning. Detta kan göras genom att utnyttja en beskärningsfunktion vid inskanningen. Beskärningen används för att beskära bort irrelevant data från formuläret och därmed framhävs det som ska skannas in. Därefter kan objektigenkänning användas för att känna igen siffror och text från det framhävda fältet. En Androidapplikation har utvecklats som utnyttjar mobilens inbyggda kamera för att skanna in och framhäva viktiga fält från formulär. Parallellt tränades en maskininlärningsmodell, med TensorFlow, att känna igen handskrivna siffror. Den färdigtränade modellen jämfördes med olika OCR-verktyg och resultatet visade att modellen detekterar handskrivna siffror bättre. A workplace can be made more efficient by digitalization. An example of that is the handling of forms. Most of the time physical forms are manually digitalized. The aim of this project is to simplify the general handling of forms by automating the process. This could be done by scanning photos of forms and using a cropping function to highlight the important parts. By doing this we can use object detection to recognize the text or numbers on that highlighted field. An application was built that utilizes a phone camera to snap a photo of a form, and then a cropping function was implemented to crop out the important part of the form excluding irrelevant data. Parallel to that a machine learning model was trained with TensorFlow to recognize handwritten numbers to work with the application. The trained model was evaluated and compared to different OCR tools, and the results showed that a model trained to detect a specific handwriting works better than general OCR tools on handwritten digits. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343Local DT-V20-G3-014application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
Swedish |
format |
Others
|
sources |
NDLTD |
topic |
TensorFlow Object detection OCR Cropping. Software Engineering Programvaruteknik |
spellingShingle |
TensorFlow Object detection OCR Cropping. Software Engineering Programvaruteknik Manousian, Jonathan Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
description |
Inom arbetslivet finns situationer i vilka vi kan utnyttja digitalisering för att förenkla och effektivisera arbetet. Ett exempel är den analoga hanteringen av fysiska formulär. Oftast överförs data från fysiska formulär till datorn manuellt. Syftet med detta projekt är att effektivisera den generella hanteringen av pappersformulär genom inskanning. Detta kan göras genom att utnyttja en beskärningsfunktion vid inskanningen. Beskärningen används för att beskära bort irrelevant data från formuläret och därmed framhävs det som ska skannas in. Därefter kan objektigenkänning användas för att känna igen siffror och text från det framhävda fältet. En Androidapplikation har utvecklats som utnyttjar mobilens inbyggda kamera för att skanna in och framhäva viktiga fält från formulär. Parallellt tränades en maskininlärningsmodell, med TensorFlow, att känna igen handskrivna siffror. Den färdigtränade modellen jämfördes med olika OCR-verktyg och resultatet visade att modellen detekterar handskrivna siffror bättre. === A workplace can be made more efficient by digitalization. An example of that is the handling of forms. Most of the time physical forms are manually digitalized. The aim of this project is to simplify the general handling of forms by automating the process. This could be done by scanning photos of forms and using a cropping function to highlight the important parts. By doing this we can use object detection to recognize the text or numbers on that highlighted field. An application was built that utilizes a phone camera to snap a photo of a form, and then a cropping function was implemented to crop out the important part of the form excluding irrelevant data. Parallel to that a machine learning model was trained with TensorFlow to recognize handwritten numbers to work with the application. The trained model was evaluated and compared to different OCR tools, and the results showed that a model trained to detect a specific handwriting works better than general OCR tools on handwritten digits. |
author |
Manousian, Jonathan |
author_facet |
Manousian, Jonathan |
author_sort |
Manousian, Jonathan |
title |
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
title_short |
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
title_full |
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
title_fullStr |
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
title_full_unstemmed |
Digitalisering av handskrivna siffror på fysiska formulär : Utvärdering av tillförlitlighet och träningstid |
title_sort |
digitalisering av handskrivna siffror på fysiska formulär : utvärdering av tillförlitlighet och träningstid |
publisher |
Mittuniversitetet, Institutionen för informationssystem och –teknologi |
publishDate |
2020 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39343 |
work_keys_str_mv |
AT manousianjonathan digitaliseringavhandskrivnasiffrorpafysiskaformularutvarderingavtillforlitlighetochtraningstid |
_version_ |
1719323631682584576 |