Métodos robustos em análise de agrupamento para dados simbólicos

Made available in DSpace on 2014-06-12T16:00:00Z (GMT). No. of bitstreams: 2 arquivo5813_1.pdf: 1242512 bytes, checksum: 898cc02cecdade8681b49f419621a5ce (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 === Faculdade de Amparo à Ciência e Te...

Full description

Bibliographic Details
Main Author: Cristina de Assis, Elaine
Other Authors: Maria Cardoso Rodrigues de Souza, Renata
Language:Portuguese
Published: Universidade Federal de Pernambuco 2014
Subjects:
Online Access:https://repositorio.ufpe.br/handle/123456789/2657
id ndltd-IBICT-oai-repositorio.ufpe.br-123456789-2657
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufpe.br-123456789-26572019-01-21T19:04:04Z Métodos robustos em análise de agrupamento para dados simbólicos Cristina de Assis, Elaine Maria Cardoso Rodrigues de Souza, Renata Análise de Agrupamento Análise de Dados Simbólicos Algoritmos Rígido e Difuso Baseados em Medoid Dados Simbólicos Mistos Made available in DSpace on 2014-06-12T16:00:00Z (GMT). No. of bitstreams: 2 arquivo5813_1.pdf: 1242512 bytes, checksum: 898cc02cecdade8681b49f419621a5ce (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 Faculdade de Amparo à Ciência e Tecnologia do Estado de Pernambuco Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias completas, enquanto métodos de particionamento procuram obter uma simples partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy). Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos. Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente aos dados, variáveis podem assumir conjuntos de categorias ou intervalos, possivelmente até mesmo com freqüências ou pesos. A análise de dados simbólicos (Symbolic Data Analysis) é um domínio relacionado com análise multivariada, reconhecimento de padrão e inteligência artificial para tratar com conjuntos de dados simbólicos descritos por intervalos, distribuição de peso (probabilidade) ou conjuntos de categorias. Esta dissertação apresenta métodos de agrupamento rígidos e difusos/nebulosos baseados em medoid para conjuntos de dados simbólicos. Diferentes funções de distâncias padronizadas para dados simbólicos são também investigadas. Para avaliar os métodos aplicados a dados simbólicos, foram realizados experimentos com conjuntos de dados intervalares artificiais contendo observações aberrantes e conjuntos de dados simbólicos reais mistos. Os resultados da medida de qualidade adotada demonstraram que em geral os métodos baseados em medoid obtiveram um desempenho satisfatório em relação a outros métodos de particionamento existentes na literatura de dados simbólicos 2014-06-12T16:00:00Z 2014-06-12T16:00:00Z 2011-01-31 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis Cristina de Assis, Elaine; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em análise de agrupamento para dados simbólicos. 2011. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2011. https://repositorio.ufpe.br/handle/123456789/2657 por info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE
collection NDLTD
language Portuguese
sources NDLTD
topic Análise de Agrupamento
Análise de Dados Simbólicos
Algoritmos Rígido e Difuso Baseados em Medoid
Dados Simbólicos Mistos
spellingShingle Análise de Agrupamento
Análise de Dados Simbólicos
Algoritmos Rígido e Difuso Baseados em Medoid
Dados Simbólicos Mistos
Cristina de Assis, Elaine
Métodos robustos em análise de agrupamento para dados simbólicos
description Made available in DSpace on 2014-06-12T16:00:00Z (GMT). No. of bitstreams: 2 arquivo5813_1.pdf: 1242512 bytes, checksum: 898cc02cecdade8681b49f419621a5ce (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 === Faculdade de Amparo à Ciência e Tecnologia do Estado de Pernambuco === Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias completas, enquanto métodos de particionamento procuram obter uma simples partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy). Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos. Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente aos dados, variáveis podem assumir conjuntos de categorias ou intervalos, possivelmente até mesmo com freqüências ou pesos. A análise de dados simbólicos (Symbolic Data Analysis) é um domínio relacionado com análise multivariada, reconhecimento de padrão e inteligência artificial para tratar com conjuntos de dados simbólicos descritos por intervalos, distribuição de peso (probabilidade) ou conjuntos de categorias. Esta dissertação apresenta métodos de agrupamento rígidos e difusos/nebulosos baseados em medoid para conjuntos de dados simbólicos. Diferentes funções de distâncias padronizadas para dados simbólicos são também investigadas. Para avaliar os métodos aplicados a dados simbólicos, foram realizados experimentos com conjuntos de dados intervalares artificiais contendo observações aberrantes e conjuntos de dados simbólicos reais mistos. Os resultados da medida de qualidade adotada demonstraram que em geral os métodos baseados em medoid obtiveram um desempenho satisfatório em relação a outros métodos de particionamento existentes na literatura de dados simbólicos
author2 Maria Cardoso Rodrigues de Souza, Renata
author_facet Maria Cardoso Rodrigues de Souza, Renata
Cristina de Assis, Elaine
author Cristina de Assis, Elaine
author_sort Cristina de Assis, Elaine
title Métodos robustos em análise de agrupamento para dados simbólicos
title_short Métodos robustos em análise de agrupamento para dados simbólicos
title_full Métodos robustos em análise de agrupamento para dados simbólicos
title_fullStr Métodos robustos em análise de agrupamento para dados simbólicos
title_full_unstemmed Métodos robustos em análise de agrupamento para dados simbólicos
title_sort métodos robustos em análise de agrupamento para dados simbólicos
publisher Universidade Federal de Pernambuco
publishDate 2014
url https://repositorio.ufpe.br/handle/123456789/2657
work_keys_str_mv AT cristinadeassiselaine metodosrobustosemanalisedeagrupamentoparadadossimbolicos
_version_ 1718859809971765248