Gerência de redes distribuída e confiável baseada em grupos de agentes

=== Network management systems are essential when parts of the network are non-operational. Particularly, fault management applications must be able to work correctly in the presence of network faults. Access to the management data of a crashed or unreachable network element may help to determine w...

Full description

Bibliographic Details
Main Author: Aldri Luiz dos Santos
Other Authors: Jose Marcos Silva Nogueira
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2004
Online Access:http://hdl.handle.net/1843/RVMR-6VZMN3
Description
Summary:=== Network management systems are essential when parts of the network are non-operational. Particularly, fault management applications must be able to work correctly in the presence of network faults. Access to the management data of a crashed or unreachable network element may help to determine why it is faulty. However, most network monitoringsystems only allow the examination of managed objects of fault-free agents. This work presents a strategy for the construction of highly available network management systems. The strategy employs data replication, a distributed and hierarchical organizational model,and the clustering approach, which allows a logical division of networks, in order to reduce the overhead of messages exchanged among network elements. The rst contribution of this thesis is the denition of an agent clustering architecture for object replication. The architecture is structured in three layers. The lower layer corresponds to typical agents at the network elements, which keep management objects at their local MIB's (Management Information Base). The middle layer corresponds tomanagement entities called cluster managers that have the task of monitoring agent's managed objects and replicating them in other clusters. The upper layer corresponds to the manager entity that denes each cluster of agents as well as the relationship among clusters. A cluster of agents provides fault-tolerant object functionality. In this way,replicated managed objects of a crashed or unreachable agent that belongs to a given cluster may be accessed through its cluster manager or one of its peer cluster managers. The second contribution of this thesis is an SNMP agent clustering framework for the Internet community. This SNMP framework describes a set of management objects that supports the replication of managed objects. The MIB called ReplicMiB specieshow to dene cluster members, replicated objects, and peer clusters of a given cluster. Furthermore, it introduces the compliance statements for the SNMP manager and cluster manager entities, i.e. which management objects need to be implemented in these SNMPentities. An example of the framework usage is introduced along with the description of the MIB objects.The third contribution of this thesis is a fault management tool based on the SNMP agent clustering framework. The tool extends the functionalities of SNMP agents to object replication and enables the access to management data replicated in the fault-free SNMP agents. The tool was built using the NET-SNMP package and the Ensemble group communication toolkit. Changes in the internal structure allow the SNMP agents to play the role of cluster managers. A group application called mcluster provides the insfrastructure for reliable communication among cluster managers and ensures the consistency of replicated managed objects. An extensive evaluation of the tool deployed at a local area network was carried out. The evaluation consisted of a resource consumption analysis, a performance analysis, and a brief study of the availability of managed objects in failure situations. === Sistemas de gerência de redes são essenciais principalmente quando partes de uma rede não estão operacionais. Em particular, aplicações de gerência de redes devem funcionar corretamente na presença de falhas na rede. O acesso aos dados de gerência de um elemento de rede falho ou inacessível pode ajudar a determinar o motivo de sua falha. Contudo, a maioria dos sistemas de monitoramento de redes apenas permite o acesso aos objetos de gerência de agentes livres de falhas. Este trabalho apresenta uma estratégia para a construção de sistemas de gerência de redes altamente disponíveis. A estratégia emprega replicação de dados, um modelo organizacional hierárquico e distribuído, e a uso da abordagem de agrupamento, que permite uma divisão lógica das redes, a fim de reduzir a sobrecarga de mensagens trocada entre os elementos da rede. A primeira contribuição da tese é a definição de uma arquitetura de agrupamento de agentes para a replicação de objetos de gerência. A arquitetura é estruturada em três camadas. A camada inferior corresponde aos tradicionais agentes nos elementos da rede, que mantêm os objetos de gerência nas suas MIB´s (Management Information Base) locais. A camada intermediária corresponde as entidades de gerência chamadas gerentes de cluster que têm a tarefa de monitorar os objetos de gerência dos agentes e replicar tais objetos em outros gerentes de cluster. A camada superior corresponde a entidade gerente que define cada cluster de agentes assim como a relação entre esses clusters. Um cluster de agentes oferece funcionalidade de objetos tolerante a falhas. Desta maneira, objetos de gerência replicados de um agente falho ou inalcançável que a pertença a um dado cluster podem ser acessados através de seu gerente de cluster ou através de um dos seus clusters pares.A segunda contribuição da tese é um framework de agrupamento de agentes SNMP para a comunidade Internet. Este framework SNMP descreve a conjunto de objetos de gerência que suporta a replicação dos objetos de gerência. A MIB chamada ReplicMIB especifica como definir os membros de cluster, os objetos replicados, e os clusters pares de um dado cluster. Um exemplo quanto ao uso do framework é mostrado junto com a descrição dos objetos da MIB. A terceira contribuição da tese é uma ferramenta de gerência de falhas baseada no framework no framework de agrupamento de agentes SNMP. A ferramenta estende as funcionalidades dos agentes SNMP a fim de replicar objetos de gerência, e também possibilita o acesso aos dados de gerência replicados em agentes SNMP livres de falhas. A ferramenta foi construída usando os softwares de domínio público NET-SNMP e Ensemble. Modificações na estrutura interna permitem que os agentes SNMP atuem como gerentes de cluster. Uma aplicação de comunicação de grupo chamada mcluster garante a infraestrutura para uma comunicação confiável entre os gerentes de cluster e assegura assim a consistência dos objetos de gerência replicados. Uma extensiva avaliação desta ferramenta foi realizada numa rede local. A avaliação consistiu de uma análise dos recursos consumidos, uma análise de desempenho, e um breve estudo da disponibilidade dos objetos de gerência em situações de falhas.