Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.

A extração de regras de associação (ARM - Association Rule Mining) de dados quantitativos tem sido pesquisa de grande interesse na área de mineração de dados. Com o crescente aumento das bases de dados, há um grande investimento na área de pesquisa na criação de algoritmos para melhorar o desempenho...

Full description

Bibliographic Details
Main Author: Ricardo Ferreira Vieira de Castro
Other Authors: Maria Luiza Fernandes Velloso
Format: Others
Language:Portuguese
Published: Universidade do Estado do Rio de Janeiro 2014
Subjects:
Online Access:http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=8137
id ndltd-IBICT-urn-repox.ist.utl.pt-UERJ-oai-www.bdtd.uerj.br-5484
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Engenharia Eletrônica
Apriori
Fuzzy Apriori
Extração de regras de associação
Regras de classificação associativa
Detecção de intrusos
Electronic Engineering
Apriori
Fuzzy Apriori
Fuzzy Association Rule Mining
Associative classification rule
Intruder Detection
ENGENHARIAS
spellingShingle Engenharia Eletrônica
Apriori
Fuzzy Apriori
Extração de regras de associação
Regras de classificação associativa
Detecção de intrusos
Electronic Engineering
Apriori
Fuzzy Apriori
Fuzzy Association Rule Mining
Associative classification rule
Intruder Detection
ENGENHARIAS
Ricardo Ferreira Vieira de Castro
Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
description A extração de regras de associação (ARM - Association Rule Mining) de dados quantitativos tem sido pesquisa de grande interesse na área de mineração de dados. Com o crescente aumento das bases de dados, há um grande investimento na área de pesquisa na criação de algoritmos para melhorar o desempenho relacionado a quantidade de regras, sua relevância e a performance computacional. O algoritmo APRIORI, tradicionalmente usado na extração de regras de associação, foi criado originalmente para trabalhar com atributos categóricos. Geralmente, para usá-lo com atributos contínuos, ou quantitativos, é necessário transformar os atributos contínuos, discretizando-os e, portanto, criando categorias a partir dos intervalos discretos. Os métodos mais tradicionais de discretização produzem intervalos com fronteiras sharp, que podem subestimar ou superestimar elementos próximos dos limites das partições, e portanto levar a uma representação imprecisa de semântica. Uma maneira de tratar este problema é criar partições soft, com limites suavizados. Neste trabalho é utilizada uma partição fuzzy das variáveis contínuas, que baseia-se na teoria dos conjuntos fuzzy e transforma os atributos quantitativos em partições de termos linguísticos. Os algoritmos de mineração de regras de associação fuzzy (FARM - Fuzzy Association Rule Mining) trabalham com este princípio e, neste trabalho, o algoritmo FUZZYAPRIORI, que pertence a esta categoria, é utilizado. As regras extraídas são expressas em termos linguísticos, o que é mais natural e interpretável pelo raciocício humano. Os algoritmos APRIORI tradicional e FUZZYAPRIORI são comparado, através de classificadores associativos, baseados em regras extraídas por estes algoritmos. Estes classificadores foram aplicados em uma base de dados relativa a registros de conexões TCP/IP que destina-se à criação de um Sistema de Detecção de Intrusos. === The mining of association rules of quantitative data has been of great research interest in the area of data mining. With the increasing size of databases, there is a large investment in research in creating algorithms to improve performance related to the amount of rules, its relevance and computational performance. The APRIORI algorithm, traditionally used in the extraction of association rules, was originally created to work with categorical attributes. In order to use continuous attributes, it is necessary to transform the continuous attributes, through discretization, into categorical attributes, where each categorie corresponds to a discrete interval. The more traditional discretization methods produce intervals with sharp boundaries, which may underestimate or overestimate elements near the boundaries of the partitions, therefore inducing an inaccurate semantical representation. One way to address this problem is to create soft partitions with smoothed boundaries. In this work, a fuzzy partition of continuous variables, which is based on fuzzy set theory is used. The algorithms for mining fuzzy association rules (FARM - Fuzzy Association Rule Mining) work with this principle, and, in this work, the FUZZYAPRIORI algorithm is used. In this dissertation, we compare the traditional APRIORI and the FUZZYAPRIORI, through classification results of associative classifiers based on rules extracted by these algorithms. These classifiers were applied to a database of records relating to TCP / IP connections that aims to create an Intrusion Detection System.
author2 Maria Luiza Fernandes Velloso
author_facet Maria Luiza Fernandes Velloso
Ricardo Ferreira Vieira de Castro
author Ricardo Ferreira Vieira de Castro
author_sort Ricardo Ferreira Vieira de Castro
title Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
title_short Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
title_full Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
title_fullStr Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
title_full_unstemmed Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos.
title_sort análise de desempenho dos algoritmos apriori e fuzzy apriori na extração de regras de associação aplicados a um sistema de detecção de intrusos.
publisher Universidade do Estado do Rio de Janeiro
publishDate 2014
url http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=8137
work_keys_str_mv AT ricardoferreiravieiradecastro analisededesempenhodosalgoritmosaprioriefuzzyapriorinaextracaoderegrasdeassociacaoaplicadosaumsistemadedeteccaodeintrusos
AT ricardoferreiravieiradecastro performanceanalysisofalgorithmsaprioriandfuzzyaprioriinassociationrulesminingappliedtoasystemforintrusiondetection
_version_ 1718675433328738304
spelling ndltd-IBICT-urn-repox.ist.utl.pt-UERJ-oai-www.bdtd.uerj.br-54842018-05-23T23:36:58Z Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos. Performance analysis of algorithms Apriori and Fuzzy Apriori in association rules mining applied to a System for Intrusion Detection. Ricardo Ferreira Vieira de Castro Maria Luiza Fernandes Velloso Nival Nunes de Almeida Orlando Bernardo Filho Karla Tereza Figueiredo Leite Engenharia Eletrônica Apriori Fuzzy Apriori Extração de regras de associação Regras de classificação associativa Detecção de intrusos Electronic Engineering Apriori Fuzzy Apriori Fuzzy Association Rule Mining Associative classification rule Intruder Detection ENGENHARIAS A extração de regras de associação (ARM - Association Rule Mining) de dados quantitativos tem sido pesquisa de grande interesse na área de mineração de dados. Com o crescente aumento das bases de dados, há um grande investimento na área de pesquisa na criação de algoritmos para melhorar o desempenho relacionado a quantidade de regras, sua relevância e a performance computacional. O algoritmo APRIORI, tradicionalmente usado na extração de regras de associação, foi criado originalmente para trabalhar com atributos categóricos. Geralmente, para usá-lo com atributos contínuos, ou quantitativos, é necessário transformar os atributos contínuos, discretizando-os e, portanto, criando categorias a partir dos intervalos discretos. Os métodos mais tradicionais de discretização produzem intervalos com fronteiras sharp, que podem subestimar ou superestimar elementos próximos dos limites das partições, e portanto levar a uma representação imprecisa de semântica. Uma maneira de tratar este problema é criar partições soft, com limites suavizados. Neste trabalho é utilizada uma partição fuzzy das variáveis contínuas, que baseia-se na teoria dos conjuntos fuzzy e transforma os atributos quantitativos em partições de termos linguísticos. Os algoritmos de mineração de regras de associação fuzzy (FARM - Fuzzy Association Rule Mining) trabalham com este princípio e, neste trabalho, o algoritmo FUZZYAPRIORI, que pertence a esta categoria, é utilizado. As regras extraídas são expressas em termos linguísticos, o que é mais natural e interpretável pelo raciocício humano. Os algoritmos APRIORI tradicional e FUZZYAPRIORI são comparado, através de classificadores associativos, baseados em regras extraídas por estes algoritmos. Estes classificadores foram aplicados em uma base de dados relativa a registros de conexões TCP/IP que destina-se à criação de um Sistema de Detecção de Intrusos. The mining of association rules of quantitative data has been of great research interest in the area of data mining. With the increasing size of databases, there is a large investment in research in creating algorithms to improve performance related to the amount of rules, its relevance and computational performance. The APRIORI algorithm, traditionally used in the extraction of association rules, was originally created to work with categorical attributes. In order to use continuous attributes, it is necessary to transform the continuous attributes, through discretization, into categorical attributes, where each categorie corresponds to a discrete interval. The more traditional discretization methods produce intervals with sharp boundaries, which may underestimate or overestimate elements near the boundaries of the partitions, therefore inducing an inaccurate semantical representation. One way to address this problem is to create soft partitions with smoothed boundaries. In this work, a fuzzy partition of continuous variables, which is based on fuzzy set theory is used. The algorithms for mining fuzzy association rules (FARM - Fuzzy Association Rule Mining) work with this principle, and, in this work, the FUZZYAPRIORI algorithm is used. In this dissertation, we compare the traditional APRIORI and the FUZZYAPRIORI, through classification results of associative classifiers based on rules extracted by these algorithms. These classifiers were applied to a database of records relating to TCP / IP connections that aims to create an Intrusion Detection System. 2014-02-20 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=8137 por info:eu-repo/semantics/openAccess application/pdf Universidade do Estado do Rio de Janeiro Programa de Pós-Graduação em Engenharia Eletrônica UERJ BR reponame:Biblioteca Digital de Teses e Dissertações da UERJ instname:Universidade do Estado do Rio de Janeiro instacron:UERJ