Utvärdering av maskininlärningsmodeller vid konkursprediktion

Att identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd...

Full description

Bibliographic Details
Main Authors: Jansson, Mikaela, Ölander Gür, Katarina
Format: Others
Language:Swedish
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2021
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345
id ndltd-UPSALLA1-oai-DiVA.org-kth-299345
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2993452021-08-12T05:24:08ZUtvärdering av maskininlärningsmodeller vid konkursprediktionsweReview of bankruptcy prediction using machine learning methodsJansson, MikaelaÖlander Gür, KatarinaKTH, Skolan för elektroteknik och datavetenskap (EECS)2021Other Computer and Information ScienceAnnan data- och informationsvetenskapAtt identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd konkursrisk ar därmed en faktor som kan hjälpa kreditgivare att fatta mer varsamma investeringsbeslut. Arbetet ämnar därför att undersöka hur väl fyra olika maskininlärningsalgoritmer kan predicera okad risk för konkurs utifrån finansiell bolagsdata. Modellerna som används är logistisk regression, Support Vector Machine, Decision Trees och Random Forest. Då datan var obalanserad där antalet icke-konkurser var överrepresenterad fick modellerna tränas och testas på flera olika fördelade dataset och de slutgiltiga resultaten bygger på ett dataset som är balanserat. Modellerna utvärderades med hjälp av en förväxlingsmatris och evalueringsmatten korrekthet, precision, täckning och F-score. Ju mer balanserad datan blev desto bättre blev resultaten men trots detta skiljde sig resultaten mellan modellerna. Studien visade att logistisk regression presterade sämst av samtliga modeller med ett F-score på 60%. Random Forest var den modell som hade bast prediktiv förmåga med ett F-score på 77%. Vid studerande av särdragen visade det sig bland annat att förändring i antalet anställda, soliditet och eget kapital har en förklaringsgrad till konkurs och är något som bör tas i beaktande vid kreditbedömning. Andra faktorer, såsom vilken industri ett företag tillhör, bör även det ha en betydelse vid kreditbedömning då olika branscher tenderar att ha fler konkurser än andra.   When evaluating a company’s financial situation it is essential to identify financial distress in order for creditors to avoid credit losses. An important part of credit assessment is to analyze the probability that a company will go bankrupt or not. Analyzing an increased risk of bankruptcy is thus a factor that can help lenders make more prudent investment decisions. Accordingly, this study aims to investigate how well four different machine learning algorithms can predict increased risk of bankruptcy based on financial company data. The models used are Logistic Regression, Support Vector Machine, Decision Trees and Random Forest. As the data was imbalanced where the number of non-bankruptcies was overrepresented, the models were trained on several different distributed datasets and the final results are based on a dataset that is balanced. The models were evaluated using a confusion matrix and the evaluation metrics accuracy, precision, recall and F-score. The more balanced the data was, the better the results were but despite this the results differed between the models. The study showed that logistic regression performed the worst of add models with an F-score of 60%. Random Forest was the model with the best predictive ability with an F-score of 77%. When investigating the features, change in number of employees, equity ratio and equity turned out to have a degree of explanation for bankruptcy and should be taken into account when assessing credit. Other factors, such as which industry a company belongs to, should also be a factor taken into account as some industries tend to have more bankruptcies than others. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345TRITA-EECS-EX ; 2021:357application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Other Computer and Information Science
Annan data- och informationsvetenskap
spellingShingle Other Computer and Information Science
Annan data- och informationsvetenskap
Jansson, Mikaela
Ölander Gür, Katarina
Utvärdering av maskininlärningsmodeller vid konkursprediktion
description Att identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd konkursrisk ar därmed en faktor som kan hjälpa kreditgivare att fatta mer varsamma investeringsbeslut. Arbetet ämnar därför att undersöka hur väl fyra olika maskininlärningsalgoritmer kan predicera okad risk för konkurs utifrån finansiell bolagsdata. Modellerna som används är logistisk regression, Support Vector Machine, Decision Trees och Random Forest. Då datan var obalanserad där antalet icke-konkurser var överrepresenterad fick modellerna tränas och testas på flera olika fördelade dataset och de slutgiltiga resultaten bygger på ett dataset som är balanserat. Modellerna utvärderades med hjälp av en förväxlingsmatris och evalueringsmatten korrekthet, precision, täckning och F-score. Ju mer balanserad datan blev desto bättre blev resultaten men trots detta skiljde sig resultaten mellan modellerna. Studien visade att logistisk regression presterade sämst av samtliga modeller med ett F-score på 60%. Random Forest var den modell som hade bast prediktiv förmåga med ett F-score på 77%. Vid studerande av särdragen visade det sig bland annat att förändring i antalet anställda, soliditet och eget kapital har en förklaringsgrad till konkurs och är något som bör tas i beaktande vid kreditbedömning. Andra faktorer, såsom vilken industri ett företag tillhör, bör även det ha en betydelse vid kreditbedömning då olika branscher tenderar att ha fler konkurser än andra.   === When evaluating a company’s financial situation it is essential to identify financial distress in order for creditors to avoid credit losses. An important part of credit assessment is to analyze the probability that a company will go bankrupt or not. Analyzing an increased risk of bankruptcy is thus a factor that can help lenders make more prudent investment decisions. Accordingly, this study aims to investigate how well four different machine learning algorithms can predict increased risk of bankruptcy based on financial company data. The models used are Logistic Regression, Support Vector Machine, Decision Trees and Random Forest. As the data was imbalanced where the number of non-bankruptcies was overrepresented, the models were trained on several different distributed datasets and the final results are based on a dataset that is balanced. The models were evaluated using a confusion matrix and the evaluation metrics accuracy, precision, recall and F-score. The more balanced the data was, the better the results were but despite this the results differed between the models. The study showed that logistic regression performed the worst of add models with an F-score of 60%. Random Forest was the model with the best predictive ability with an F-score of 77%. When investigating the features, change in number of employees, equity ratio and equity turned out to have a degree of explanation for bankruptcy and should be taken into account when assessing credit. Other factors, such as which industry a company belongs to, should also be a factor taken into account as some industries tend to have more bankruptcies than others.
author Jansson, Mikaela
Ölander Gür, Katarina
author_facet Jansson, Mikaela
Ölander Gür, Katarina
author_sort Jansson, Mikaela
title Utvärdering av maskininlärningsmodeller vid konkursprediktion
title_short Utvärdering av maskininlärningsmodeller vid konkursprediktion
title_full Utvärdering av maskininlärningsmodeller vid konkursprediktion
title_fullStr Utvärdering av maskininlärningsmodeller vid konkursprediktion
title_full_unstemmed Utvärdering av maskininlärningsmodeller vid konkursprediktion
title_sort utvärdering av maskininlärningsmodeller vid konkursprediktion
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2021
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345
work_keys_str_mv AT janssonmikaela utvarderingavmaskininlarningsmodellervidkonkursprediktion
AT olandergurkatarina utvarderingavmaskininlarningsmodellervidkonkursprediktion
AT janssonmikaela reviewofbankruptcypredictionusingmachinelearningmethods
AT olandergurkatarina reviewofbankruptcypredictionusingmachinelearningmethods
_version_ 1719459682658025472