Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento

Algoritmos de aprendizado semi-supervisionado ativo podem se configurar como ferramentas úteis em cenários práticos em que os dados são numerosamente obtidos, mas atribuir seus respectivos rótulos de classe se configura como uma tarefa custosa/difícil. A literatura em aprendizado ativo destaca diver...

Full description

Bibliographic Details
Main Author: Batista, Antônio José de Lima
Other Authors: Campello, Ricardo José Gabrielli Barreto
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2016
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02122016-114143/
id ndltd-usp.br-oai-teses.usp.br-tde-02122016-114143
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-02122016-1141432019-05-09T17:40:46Z Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento Active semi-supervised classification based on multiple clustering hierarchies Batista, Antônio José de Lima Active learning Active semi-supervised classification Aprendizado ativo Aprendizado de máquina Classificação ativa semi-supervisionada Clustering hierarchies. Hierarquia de grupos. Machine learning Algoritmos de aprendizado semi-supervisionado ativo podem se configurar como ferramentas úteis em cenários práticos em que os dados são numerosamente obtidos, mas atribuir seus respectivos rótulos de classe se configura como uma tarefa custosa/difícil. A literatura em aprendizado ativo destaca diversos algoritmos, este trabalho partiu do tradicional Hierarchical Sampling estabelecido para operar sobre hierarquias de grupos. As características de tal algoritmo o coloca à frente de outros métodos ativos, entretanto o mesmo ainda apresenta algumas dificuldades. A fim de aprimorá-lo e contornar suas principais dificuldades, incluindo sua sensibilidade na escolha particular de uma hierarquia de grupos como entrada, este trabalho propôs estratégias que possibilitaram melhorar o algoritmo na sua forma original e diante de variantes propostas na literatura. Os experimentos em diferentes bases de dados reais mostraram que o algoritmo proposto neste trabalho é capaz de superar e competir em qualidade dentro do cenário de classificação ativa com outros algoritmos ativos da literatura. Active semi-supervised learning can play an important role in classification scenarios in which labeled data are laborious and/or expensive to obtain, while unlabeled data are numerous and can be easily acquired. There are many active algorithms in the literature and this work focuses on an active semi-supervised algorithm that can be driven by clustering hierarchy, the well-known Hierarchical Sampling (HS) algorithm. This work takes as a starting point the original Hierarchical Sampling algorithm and perform changes in different aspects of the original algorithm in order to tackle its main drawbacks, including its sensitivity to the choice of a single particular hierarchy. Experimental results over many real datasets show that the proposed algorithm performs superior or competitive when compared to a number of state-of-the-art algorithms for active semi-supervised classification. Biblioteca Digitais de Teses e Dissertações da USP Campello, Ricardo José Gabrielli Barreto 2016-08-08 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02122016-114143/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic Active learning
Active semi-supervised classification
Aprendizado ativo
Aprendizado de máquina
Classificação ativa semi-supervisionada
Clustering hierarchies.
Hierarquia de grupos.
Machine learning
spellingShingle Active learning
Active semi-supervised classification
Aprendizado ativo
Aprendizado de máquina
Classificação ativa semi-supervisionada
Clustering hierarchies.
Hierarquia de grupos.
Machine learning
Batista, Antônio José de Lima
Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
description Algoritmos de aprendizado semi-supervisionado ativo podem se configurar como ferramentas úteis em cenários práticos em que os dados são numerosamente obtidos, mas atribuir seus respectivos rótulos de classe se configura como uma tarefa custosa/difícil. A literatura em aprendizado ativo destaca diversos algoritmos, este trabalho partiu do tradicional Hierarchical Sampling estabelecido para operar sobre hierarquias de grupos. As características de tal algoritmo o coloca à frente de outros métodos ativos, entretanto o mesmo ainda apresenta algumas dificuldades. A fim de aprimorá-lo e contornar suas principais dificuldades, incluindo sua sensibilidade na escolha particular de uma hierarquia de grupos como entrada, este trabalho propôs estratégias que possibilitaram melhorar o algoritmo na sua forma original e diante de variantes propostas na literatura. Os experimentos em diferentes bases de dados reais mostraram que o algoritmo proposto neste trabalho é capaz de superar e competir em qualidade dentro do cenário de classificação ativa com outros algoritmos ativos da literatura. === Active semi-supervised learning can play an important role in classification scenarios in which labeled data are laborious and/or expensive to obtain, while unlabeled data are numerous and can be easily acquired. There are many active algorithms in the literature and this work focuses on an active semi-supervised algorithm that can be driven by clustering hierarchy, the well-known Hierarchical Sampling (HS) algorithm. This work takes as a starting point the original Hierarchical Sampling algorithm and perform changes in different aspects of the original algorithm in order to tackle its main drawbacks, including its sensitivity to the choice of a single particular hierarchy. Experimental results over many real datasets show that the proposed algorithm performs superior or competitive when compared to a number of state-of-the-art algorithms for active semi-supervised classification.
author2 Campello, Ricardo José Gabrielli Barreto
author_facet Campello, Ricardo José Gabrielli Barreto
Batista, Antônio José de Lima
author Batista, Antônio José de Lima
author_sort Batista, Antônio José de Lima
title Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
title_short Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
title_full Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
title_fullStr Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
title_full_unstemmed Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
title_sort classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2016
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02122016-114143/
work_keys_str_mv AT batistaantoniojosedelima classificacaosemisupervisionadaativabaseadaemmultiplashierarquiasdeagrupamento
AT batistaantoniojosedelima activesemisupervisedclassificationbasedonmultipleclusteringhierarchies
_version_ 1719049791994855424