Predicting Depression: a comparative study of machine learning approaches based on language usage.

La depresión es uno de los mayores problemas de salud pública que constituye a su vez una de las principales causas de incapacidad. A nivel mundial, más de 332 millones de personas de todas las edades padecen este trastorno. Investigaciones previas demuestran que el lenguaje que utilizan las persona...

Full description

Bibliographic Details
Main Authors: Luciana Mariñelarena-Dondena, Edgardo Ferretti, Manolis Maragoudakis, Maximiliano Sapino, Marcelo Luis Errecalde
Format: Article
Language:English
Published: CAEN 2017-01-01
Series:Cuadernos de Neuropsicologia
Subjects:
Online Access:http://www.redalyc.org/articulo.oa?id=439656187002
Description
Summary:La depresión es uno de los mayores problemas de salud pública que constituye a su vez una de las principales causas de incapacidad. A nivel mundial, más de 332 millones de personas de todas las edades padecen este trastorno. Investigaciones previas demuestran que el lenguaje que utilizan las personas refleja su salud mental. Por tal motivo, existe un creciente interés en la aplicación de técnicas de procesamiento del lenguaje natural para predecir la depresión. En este trabajo se presenta un estudio comparativo de diferentes métodos de aprendizaje automático como así también distintas maneras de representación de los documentos con el fin de detectar automáticamente a aquellos usuarios de medios sociales que manifestaron haber sido diagnosticados previamente con depresión. Los resultados obtenidos mostraron que la performance del clasificador mejoró considerablemente cuando se aplicó un enfoque de Aprendizaje Profundo combinándolo con el algoritmo SMOTE (Synthetic Minority Oversampling TEchnique) que permite hacer frente al problema de las clases desbalanceadas alcanzando así una medida F1 del 82.93%. En síntesis, este enfoque combinado, SMOTE + Aprendizaje Profundo, predice la depresión con una exactitud de más del 94%.
ISSN:0718-4123