Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede

Orientador : Prof. Dr. Carmem Satie Hara === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 24/09/2015 === Inclui referências : f. 88-92 === Resumo: O monitoramento de redes é uma atividade pertencente à...

Full description

Bibliographic Details
Main Author: Hoss, Diego Jonathan
Other Authors: Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
Format: Others
Language:Portuguese
Published: 2018
Subjects:
Online Access:http://hdl.handle.net/1884/40913
id ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-40913
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Ciência da computação
Metadados
Processamento eletronico de dados - Processamento distribuido
Teses
spellingShingle Ciência da computação
Metadados
Processamento eletronico de dados - Processamento distribuido
Teses
Hoss, Diego Jonathan
Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
description Orientador : Prof. Dr. Carmem Satie Hara === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 24/09/2015 === Inclui referências : f. 88-92 === Resumo: O monitoramento de redes é uma atividade pertencente à área de gerência de redes, na qual efetua-se a coleta, armazenamento, processamento e análise dos dados de monitoramento. Para realizar esta atividade, existem ferramentas que implementam tais funcionalidades. Grande parte destas ferramentas são baseadas na arquitetura centralizada, e entre elas encontra-se o NfSen/Nfdump. Esta ferramenta é amplamente utilizada pelos administradores de rede por possuir boa documentação e ser de código aberto. O modelo centralizado possui limitações associadas à escalabilidade que são inerentes à arquitetura. Entre elas está a falta de redundância, um ponto único de falha e a ausência de balanceamento de carga. Isto significa que as ferramentas com arquitetura centralizada estão sujeitas a essas limitações, ou seja, existem limites no volume de armazenamento bem como na sua capacidade de coleta e processamento. Na literatura, encontram-se soluções para este problema baseadas em compressão dos dados e armazenamento distribuído de dados. Nesta dissertação, é proposta uma arquitetura distribuída chamada DASFlow aplicada à ferramenta de monitoramento de rede NfSen/Nfdump, cujo o objetivo é prover escalabilidade de coleta, armazenamento e processamento. Para isso, a arquitetura define os módulos StoreDAS-Cliente e StoreDAS-Servidor que atuam em conjunto com o sistema de arquivos distribuído (SAD) para prover escalabilidade de coleta e armazenamento. A escalabilidade de processamento é fornecida pelos módulos QueryDAS-Cliente e QueryDAS-Servidor. A arquitetura também prevê a existência do módulo de Metadados responsável por manter as informações sobre o armazenamento e distribuição dos dados de monitoramento. Os resultados experimentais mostram o potencial da arquitetura proposta. O DASFlow obteve menores tempos de resposta para o processamento das consultas mais frequentes que variam entre 13% e 34%, se comparados à ferramenta NfSen/Nfdump. Adicionalmente, a adoção de um sistema de arquivos distribuído mostrase eficaz ao prover escalabilidade para o armazenamento dos dados de monitoramento de rede. === Abstract: Network monitoring is one of the activities of the network management field, in which one collects, stores, processes and analyzes monitoring data. It relies on tools that implement such functionalities. Many of these tools are based on a centralized architecture, and among them is NfSen/Nfdump. NfSen/Nfdump is widely used among network administrators, due to a good documentation and the fact that it is open source. The centralized model has some limitations with respect to scalability, which are inherent to the architecture. One of them is the lack of redundancy, single point of failure and the absence of load balancing. As a result, centralized architecture tools are subject to the some limitations. That is, storage capacity is limited as well as the ability to collect and process data. Solutions to solve these problems, based on data compression and distributed data storage, can be found in the literature. In this dissertation, we propose a distributed architecture called DASFlow, which provides scalability for data collection, storage and processing. In this regard, the architecture defines the StoreDAS-Cliente and StoreDASServidor modules, which work together with a distributed file system (DFS) in order to provide data collection and storage scalability. Processing scalability is provided by the QueryDAS-Cliente and QueryDAS-Servidor modules. The architecture also contains a Metadata module, responsible for keeping the information about storage and distribution of monitoring data. The architecture has been implemented with the NfSen/Nfdump network monitoring tool and Ceph distributed file system. The experimental results show that the DASFlow architecture has achieved shorter response times for the processing of the most frequent queries, which vary between 13% and 34%, if compared to the original NfSen/Nfdump tool. Additionally, the use of a distributed file system has proved to be efficient in providing scalability for the storage of network monitoring data.
author2 Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
author_facet Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
Hoss, Diego Jonathan
author Hoss, Diego Jonathan
author_sort Hoss, Diego Jonathan
title Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
title_short Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
title_full Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
title_fullStr Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
title_full_unstemmed Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
title_sort dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede
publishDate 2018
url http://hdl.handle.net/1884/40913
work_keys_str_mv AT hossdiegojonathan dasflowumaarquiteturadistribuidadearmazenamentoeprocessamentoparadadosdemonitoramentoderede
_version_ 1718647105885569024
spelling ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-409132018-05-23T18:29:32Z Dasflow : uma arquitetura distribuída de armazenamento e processamento para dados de monitoramento de rede Hoss, Diego Jonathan Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática Hara, Carmem Satie, 1964- Ciência da computação Metadados Processamento eletronico de dados - Processamento distribuido Teses Orientador : Prof. Dr. Carmem Satie Hara Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 24/09/2015 Inclui referências : f. 88-92 Resumo: O monitoramento de redes é uma atividade pertencente à área de gerência de redes, na qual efetua-se a coleta, armazenamento, processamento e análise dos dados de monitoramento. Para realizar esta atividade, existem ferramentas que implementam tais funcionalidades. Grande parte destas ferramentas são baseadas na arquitetura centralizada, e entre elas encontra-se o NfSen/Nfdump. Esta ferramenta é amplamente utilizada pelos administradores de rede por possuir boa documentação e ser de código aberto. O modelo centralizado possui limitações associadas à escalabilidade que são inerentes à arquitetura. Entre elas está a falta de redundância, um ponto único de falha e a ausência de balanceamento de carga. Isto significa que as ferramentas com arquitetura centralizada estão sujeitas a essas limitações, ou seja, existem limites no volume de armazenamento bem como na sua capacidade de coleta e processamento. Na literatura, encontram-se soluções para este problema baseadas em compressão dos dados e armazenamento distribuído de dados. Nesta dissertação, é proposta uma arquitetura distribuída chamada DASFlow aplicada à ferramenta de monitoramento de rede NfSen/Nfdump, cujo o objetivo é prover escalabilidade de coleta, armazenamento e processamento. Para isso, a arquitetura define os módulos StoreDAS-Cliente e StoreDAS-Servidor que atuam em conjunto com o sistema de arquivos distribuído (SAD) para prover escalabilidade de coleta e armazenamento. A escalabilidade de processamento é fornecida pelos módulos QueryDAS-Cliente e QueryDAS-Servidor. A arquitetura também prevê a existência do módulo de Metadados responsável por manter as informações sobre o armazenamento e distribuição dos dados de monitoramento. Os resultados experimentais mostram o potencial da arquitetura proposta. O DASFlow obteve menores tempos de resposta para o processamento das consultas mais frequentes que variam entre 13% e 34%, se comparados à ferramenta NfSen/Nfdump. Adicionalmente, a adoção de um sistema de arquivos distribuído mostrase eficaz ao prover escalabilidade para o armazenamento dos dados de monitoramento de rede. Abstract: Network monitoring is one of the activities of the network management field, in which one collects, stores, processes and analyzes monitoring data. It relies on tools that implement such functionalities. Many of these tools are based on a centralized architecture, and among them is NfSen/Nfdump. NfSen/Nfdump is widely used among network administrators, due to a good documentation and the fact that it is open source. The centralized model has some limitations with respect to scalability, which are inherent to the architecture. One of them is the lack of redundancy, single point of failure and the absence of load balancing. As a result, centralized architecture tools are subject to the some limitations. That is, storage capacity is limited as well as the ability to collect and process data. Solutions to solve these problems, based on data compression and distributed data storage, can be found in the literature. In this dissertation, we propose a distributed architecture called DASFlow, which provides scalability for data collection, storage and processing. In this regard, the architecture defines the StoreDAS-Cliente and StoreDASServidor modules, which work together with a distributed file system (DFS) in order to provide data collection and storage scalability. Processing scalability is provided by the QueryDAS-Cliente and QueryDAS-Servidor modules. The architecture also contains a Metadata module, responsible for keeping the information about storage and distribution of monitoring data. The architecture has been implemented with the NfSen/Nfdump network monitoring tool and Ceph distributed file system. The experimental results show that the DASFlow architecture has achieved shorter response times for the processing of the most frequent queries, which vary between 13% and 34%, if compared to the original NfSen/Nfdump tool. Additionally, the use of a distributed file system has proved to be efficient in providing scalability for the storage of network monitoring data. 2018-01-26T18:47:13Z 2018-01-26T18:47:13Z 2015 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1884/40913 por Disponível em formato digital info:eu-repo/semantics/openAccess 92 f. : il. algumas color. application/pdf reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná instacron:UFPR