PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder

This study aims to investigate how dimensionality reduction of neuroimaging data prior to training support vector machines (SVMs) affects the classification accuracy of bipolar disorder. This study uses principal component analysis (PCA) for dimensionality reduction. An open source data set of 19 bi...

Full description

Bibliographic Details
Main Authors: Chen, Beichen, Chen, Amy Jinxin
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2019
Subjects:
SVM
PCA
MRI
MRT
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-259621
id ndltd-UPSALLA1-oai-DiVA.org-kth-259621
record_format oai_dc
collection NDLTD
language English
format Others
sources NDLTD
topic Bipolar disorder
diagnosis
computer-aided medical diagnosis
SVM
Support vector machine
PCA
Principal component analysis
dimensionality reduction
feature reduction
neuroimaging
MRI
sMRI
machine learning
classification
psychiatric disorders
mental illness
Bipolär sjukdom
diagnotisering
datorstödd medicinsk diagnotisering
SVM
stödvektormaskin
PCA
principalkomponentanalys
MRI
magnetisk resonanstomografi
MRT
dimensionalitetsreduktion
maskininlärning
dimensionsreduktion
klassificering
psykiska sjukdomar
Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle Bipolar disorder
diagnosis
computer-aided medical diagnosis
SVM
Support vector machine
PCA
Principal component analysis
dimensionality reduction
feature reduction
neuroimaging
MRI
sMRI
machine learning
classification
psychiatric disorders
mental illness
Bipolär sjukdom
diagnotisering
datorstödd medicinsk diagnotisering
SVM
stödvektormaskin
PCA
principalkomponentanalys
MRI
magnetisk resonanstomografi
MRT
dimensionalitetsreduktion
maskininlärning
dimensionsreduktion
klassificering
psykiska sjukdomar
Computer and Information Sciences
Data- och informationsvetenskap
Chen, Beichen
Chen, Amy Jinxin
PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
description This study aims to investigate how dimensionality reduction of neuroimaging data prior to training support vector machines (SVMs) affects the classification accuracy of bipolar disorder. This study uses principal component analysis (PCA) for dimensionality reduction. An open source data set of 19 bipolar and 31 control structural magnetic resonance imaging (sMRI) samples was used, part of the UCLA Consortium for Neuropsychiatric Phenomics LA5c Study funded by the NIH Roadmap Initiative aiming to foster breakthroughs in the development of novel treatments for neuropsychiatric disorders. The images underwent smoothing, feature extraction and PCA before they were used as input to train SVMs. 3-fold cross-validation was used to tune a number of hyperparameters for linear, radial, and polynomial kernels. Experiments were done to investigate the performance of SVM models trained using 1 to 29 principal components (PCs). Several PC sets reached 100% accuracy in the final evaluation, with the minimal set being the first two principal components. Accumulated variance explained by the PCs used did not have a correlation with the performance of the model. The choice of kernel and hyperparameters is of utmost importance as the performance obtained can vary greatly. The results support previous studies that SVM can be useful in aiding the diagnosis of bipolar disorder, and that the use of PCA as a dimensionality reduction method in combination with SVM may be appropriate for the classification of neuroimaging data for illnesses not limited to bipolar disorder. Due to the limitation of a small sample size, the results call for future research using larger collaborative data sets to validate the accuracies obtained. === Syftet med denna studie är att undersöka hur dimensionalitetsreduktion av neuroradiologisk data före träning av stödvektormaskiner (SVMs) påverkar klassificeringsnoggrannhet av bipolär sjukdom. Studien använder principalkomponentanalys (PCA) för dimensionalitetsreduktion. En datauppsättning av 19 bipolära och 31 friska magnetisk resonanstomografi(MRT) bilder användes, vilka tillhör den öppna datakällan från studien UCLA Consortium for Neuropsychiatric Phenomics LA5c som finansierades av NIH Roadmap Initiative i syfte att främja genombrott i utvecklingen av nya behandlingar för neuropsykiatriska funktionsnedsättningar. Bilderna genomgick oskärpa, särdragsextrahering och PCA innan de användes som indata för att träna SVMs. Med 3-delad korsvalidering inställdes ett antal parametrar för linjära, radiala och polynomiska kärnor. Experiment gjordes för att utforska prestationen av SVM-modeller tränade med 1 till 29 principalkomponenter (PCs). Flera PC uppsättningar uppnådde 100% noggrannhet i den slutliga utvärderingen, där den minsta uppsättningen var de två första PCs. Den ackumulativa variansen över antalet PCs som användes hade inte någon korrelation med prestationen på modellen. Valet av kärna och hyperparametrar är betydande eftersom prestationen kan variera mycket. Resultatet stödjer tidigare studier att SVM kan vara användbar som stöd för diagnostisering av bipolär sjukdom och användningen av PCA som en dimensionalitetsreduktionsmetod i kombination med SVM kan vara lämplig för klassificering av neuroradiologisk data för bipolär och andra sjukdomar. På grund av begränsningen med få dataprover, kräver resultaten framtida forskning med en större datauppsättning för att validera de erhållna noggrannheten.
author Chen, Beichen
Chen, Amy Jinxin
author_facet Chen, Beichen
Chen, Amy Jinxin
author_sort Chen, Beichen
title PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
title_short PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
title_full PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
title_fullStr PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
title_full_unstemmed PCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorder
title_sort pca based dimensionality reduction of mri images for training support vector machine to aid diagnosis of bipolar disorder
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2019
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-259621
work_keys_str_mv AT chenbeichen pcabaseddimensionalityreductionofmriimagesfortrainingsupportvectormachinetoaiddiagnosisofbipolardisorder
AT chenamyjinxin pcabaseddimensionalityreductionofmriimagesfortrainingsupportvectormachinetoaiddiagnosisofbipolardisorder
AT chenbeichen pcabaseraddimensionalitetsreduktionavmribilderfortraningavstodvektormaskintillattstodjadiagnostiseringavbipolarsjukdom
AT chenamyjinxin pcabaseraddimensionalitetsreduktionavmribilderfortraningavstodvektormaskintillattstodjadiagnostiseringavbipolarsjukdom
_version_ 1719258492961816576
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2596212019-09-27T04:35:23ZPCA based dimensionality reduction of MRI images for training support vector machine to aid diagnosis of bipolar disorderengPCA baserad dimensionalitetsreduktion av MRI bilder för träning av stödvektormaskin till att stödja diagnostisering av bipolär sjukdomChen, BeichenChen, Amy JinxinKTH, Skolan för elektroteknik och datavetenskap (EECS)KTH, Skolan för elektroteknik och datavetenskap (EECS)2019Bipolar disorderdiagnosiscomputer-aided medical diagnosisSVMSupport vector machinePCAPrincipal component analysisdimensionality reductionfeature reductionneuroimagingMRIsMRImachine learningclassificationpsychiatric disordersmental illnessBipolär sjukdomdiagnotiseringdatorstödd medicinsk diagnotiseringSVMstödvektormaskinPCAprincipalkomponentanalysMRImagnetisk resonanstomografiMRTdimensionalitetsreduktionmaskininlärningdimensionsreduktionklassificeringpsykiska sjukdomarComputer and Information SciencesData- och informationsvetenskapThis study aims to investigate how dimensionality reduction of neuroimaging data prior to training support vector machines (SVMs) affects the classification accuracy of bipolar disorder. This study uses principal component analysis (PCA) for dimensionality reduction. An open source data set of 19 bipolar and 31 control structural magnetic resonance imaging (sMRI) samples was used, part of the UCLA Consortium for Neuropsychiatric Phenomics LA5c Study funded by the NIH Roadmap Initiative aiming to foster breakthroughs in the development of novel treatments for neuropsychiatric disorders. The images underwent smoothing, feature extraction and PCA before they were used as input to train SVMs. 3-fold cross-validation was used to tune a number of hyperparameters for linear, radial, and polynomial kernels. Experiments were done to investigate the performance of SVM models trained using 1 to 29 principal components (PCs). Several PC sets reached 100% accuracy in the final evaluation, with the minimal set being the first two principal components. Accumulated variance explained by the PCs used did not have a correlation with the performance of the model. The choice of kernel and hyperparameters is of utmost importance as the performance obtained can vary greatly. The results support previous studies that SVM can be useful in aiding the diagnosis of bipolar disorder, and that the use of PCA as a dimensionality reduction method in combination with SVM may be appropriate for the classification of neuroimaging data for illnesses not limited to bipolar disorder. Due to the limitation of a small sample size, the results call for future research using larger collaborative data sets to validate the accuracies obtained. Syftet med denna studie är att undersöka hur dimensionalitetsreduktion av neuroradiologisk data före träning av stödvektormaskiner (SVMs) påverkar klassificeringsnoggrannhet av bipolär sjukdom. Studien använder principalkomponentanalys (PCA) för dimensionalitetsreduktion. En datauppsättning av 19 bipolära och 31 friska magnetisk resonanstomografi(MRT) bilder användes, vilka tillhör den öppna datakällan från studien UCLA Consortium for Neuropsychiatric Phenomics LA5c som finansierades av NIH Roadmap Initiative i syfte att främja genombrott i utvecklingen av nya behandlingar för neuropsykiatriska funktionsnedsättningar. Bilderna genomgick oskärpa, särdragsextrahering och PCA innan de användes som indata för att träna SVMs. Med 3-delad korsvalidering inställdes ett antal parametrar för linjära, radiala och polynomiska kärnor. Experiment gjordes för att utforska prestationen av SVM-modeller tränade med 1 till 29 principalkomponenter (PCs). Flera PC uppsättningar uppnådde 100% noggrannhet i den slutliga utvärderingen, där den minsta uppsättningen var de två första PCs. Den ackumulativa variansen över antalet PCs som användes hade inte någon korrelation med prestationen på modellen. Valet av kärna och hyperparametrar är betydande eftersom prestationen kan variera mycket. Resultatet stödjer tidigare studier att SVM kan vara användbar som stöd för diagnostisering av bipolär sjukdom och användningen av PCA som en dimensionalitetsreduktionsmetod i kombination med SVM kan vara lämplig för klassificering av neuroradiologisk data för bipolär och andra sjukdomar. På grund av begränsningen med få dataprover, kräver resultaten framtida forskning med en större datauppsättning för att validera de erhållna noggrannheten. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-259621TRITA-EECS-EX ; 2019:343application/pdfinfo:eu-repo/semantics/openAccess