Utvärdering av maskininlärningsmodeller vid konkursprediktion
Att identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd...
Main Authors: | , |
---|---|
Format: | Others |
Language: | Swedish |
Published: |
KTH, Skolan för elektroteknik och datavetenskap (EECS)
2021
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-299345 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-2993452021-08-12T05:24:08ZUtvärdering av maskininlärningsmodeller vid konkursprediktionsweReview of bankruptcy prediction using machine learning methodsJansson, MikaelaÖlander Gür, KatarinaKTH, Skolan för elektroteknik och datavetenskap (EECS)2021Other Computer and Information ScienceAnnan data- och informationsvetenskapAtt identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd konkursrisk ar därmed en faktor som kan hjälpa kreditgivare att fatta mer varsamma investeringsbeslut. Arbetet ämnar därför att undersöka hur väl fyra olika maskininlärningsalgoritmer kan predicera okad risk för konkurs utifrån finansiell bolagsdata. Modellerna som används är logistisk regression, Support Vector Machine, Decision Trees och Random Forest. Då datan var obalanserad där antalet icke-konkurser var överrepresenterad fick modellerna tränas och testas på flera olika fördelade dataset och de slutgiltiga resultaten bygger på ett dataset som är balanserat. Modellerna utvärderades med hjälp av en förväxlingsmatris och evalueringsmatten korrekthet, precision, täckning och F-score. Ju mer balanserad datan blev desto bättre blev resultaten men trots detta skiljde sig resultaten mellan modellerna. Studien visade att logistisk regression presterade sämst av samtliga modeller med ett F-score på 60%. Random Forest var den modell som hade bast prediktiv förmåga med ett F-score på 77%. Vid studerande av särdragen visade det sig bland annat att förändring i antalet anställda, soliditet och eget kapital har en förklaringsgrad till konkurs och är något som bör tas i beaktande vid kreditbedömning. Andra faktorer, såsom vilken industri ett företag tillhör, bör även det ha en betydelse vid kreditbedömning då olika branscher tenderar att ha fler konkurser än andra. When evaluating a company’s financial situation it is essential to identify financial distress in order for creditors to avoid credit losses. An important part of credit assessment is to analyze the probability that a company will go bankrupt or not. Analyzing an increased risk of bankruptcy is thus a factor that can help lenders make more prudent investment decisions. Accordingly, this study aims to investigate how well four different machine learning algorithms can predict increased risk of bankruptcy based on financial company data. The models used are Logistic Regression, Support Vector Machine, Decision Trees and Random Forest. As the data was imbalanced where the number of non-bankruptcies was overrepresented, the models were trained on several different distributed datasets and the final results are based on a dataset that is balanced. The models were evaluated using a confusion matrix and the evaluation metrics accuracy, precision, recall and F-score. The more balanced the data was, the better the results were but despite this the results differed between the models. The study showed that logistic regression performed the worst of add models with an F-score of 60%. Random Forest was the model with the best predictive ability with an F-score of 77%. When investigating the features, change in number of employees, equity ratio and equity turned out to have a degree of explanation for bankruptcy and should be taken into account when assessing credit. Other factors, such as which industry a company belongs to, should also be a factor taken into account as some industries tend to have more bankruptcies than others. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345TRITA-EECS-EX ; 2021:357application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
Swedish |
format |
Others
|
sources |
NDLTD |
topic |
Other Computer and Information Science Annan data- och informationsvetenskap |
spellingShingle |
Other Computer and Information Science Annan data- och informationsvetenskap Jansson, Mikaela Ölander Gür, Katarina Utvärdering av maskininlärningsmodeller vid konkursprediktion |
description |
Att identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd konkursrisk ar därmed en faktor som kan hjälpa kreditgivare att fatta mer varsamma investeringsbeslut. Arbetet ämnar därför att undersöka hur väl fyra olika maskininlärningsalgoritmer kan predicera okad risk för konkurs utifrån finansiell bolagsdata. Modellerna som används är logistisk regression, Support Vector Machine, Decision Trees och Random Forest. Då datan var obalanserad där antalet icke-konkurser var överrepresenterad fick modellerna tränas och testas på flera olika fördelade dataset och de slutgiltiga resultaten bygger på ett dataset som är balanserat. Modellerna utvärderades med hjälp av en förväxlingsmatris och evalueringsmatten korrekthet, precision, täckning och F-score. Ju mer balanserad datan blev desto bättre blev resultaten men trots detta skiljde sig resultaten mellan modellerna. Studien visade att logistisk regression presterade sämst av samtliga modeller med ett F-score på 60%. Random Forest var den modell som hade bast prediktiv förmåga med ett F-score på 77%. Vid studerande av särdragen visade det sig bland annat att förändring i antalet anställda, soliditet och eget kapital har en förklaringsgrad till konkurs och är något som bör tas i beaktande vid kreditbedömning. Andra faktorer, såsom vilken industri ett företag tillhör, bör även det ha en betydelse vid kreditbedömning då olika branscher tenderar att ha fler konkurser än andra. === When evaluating a company’s financial situation it is essential to identify financial distress in order for creditors to avoid credit losses. An important part of credit assessment is to analyze the probability that a company will go bankrupt or not. Analyzing an increased risk of bankruptcy is thus a factor that can help lenders make more prudent investment decisions. Accordingly, this study aims to investigate how well four different machine learning algorithms can predict increased risk of bankruptcy based on financial company data. The models used are Logistic Regression, Support Vector Machine, Decision Trees and Random Forest. As the data was imbalanced where the number of non-bankruptcies was overrepresented, the models were trained on several different distributed datasets and the final results are based on a dataset that is balanced. The models were evaluated using a confusion matrix and the evaluation metrics accuracy, precision, recall and F-score. The more balanced the data was, the better the results were but despite this the results differed between the models. The study showed that logistic regression performed the worst of add models with an F-score of 60%. Random Forest was the model with the best predictive ability with an F-score of 77%. When investigating the features, change in number of employees, equity ratio and equity turned out to have a degree of explanation for bankruptcy and should be taken into account when assessing credit. Other factors, such as which industry a company belongs to, should also be a factor taken into account as some industries tend to have more bankruptcies than others. |
author |
Jansson, Mikaela Ölander Gür, Katarina |
author_facet |
Jansson, Mikaela Ölander Gür, Katarina |
author_sort |
Jansson, Mikaela |
title |
Utvärdering av maskininlärningsmodeller vid konkursprediktion |
title_short |
Utvärdering av maskininlärningsmodeller vid konkursprediktion |
title_full |
Utvärdering av maskininlärningsmodeller vid konkursprediktion |
title_fullStr |
Utvärdering av maskininlärningsmodeller vid konkursprediktion |
title_full_unstemmed |
Utvärdering av maskininlärningsmodeller vid konkursprediktion |
title_sort |
utvärdering av maskininlärningsmodeller vid konkursprediktion |
publisher |
KTH, Skolan för elektroteknik och datavetenskap (EECS) |
publishDate |
2021 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299345 |
work_keys_str_mv |
AT janssonmikaela utvarderingavmaskininlarningsmodellervidkonkursprediktion AT olandergurkatarina utvarderingavmaskininlarningsmodellervidkonkursprediktion AT janssonmikaela reviewofbankruptcypredictionusingmachinelearningmethods AT olandergurkatarina reviewofbankruptcypredictionusingmachinelearningmethods |
_version_ |
1719459682658025472 |