Redblock: a tool for online deduplication on large datasets
Online data deduplication aims to identify records that represent the same purpose on a continuous data flow environment. It must be able to process a range of information with high effectiveness and no delays. The purpose of this paper is to introduce a developed tool entitled Redblock, for real-ti...
Main Authors: | Luan Félix Pimentel, Igor Lemos Vicente, Guilherme Dal Bianco |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade de Passo Fundo (UPF)
2017-07-01
|
Series: | Revista Brasileira de Computação Aplicada |
Subjects: | |
Online Access: | http://seer.upf.br/index.php/rbca/article/view/7143 |
Similar Items
-
Dedupeer: um algoritmo para deduplicação de arquivos através de processamento particionado
by: Soares, Paulo Fernando Almeida
Published: (2015) -
Avaliação de diferentes estratégias de blocagem no relacionamento probabilístico de registros Evaluation of different blocking strategies in probabilistic record linkage
by: Cláudia Medina Coeli, et al.
Published: (2002-08-01) -
[en] A FRAMEWORK FOR THE CONSTRUCTION OF MEDIATORS OFFERING DEDUPLICATION
by: GUSTAVO LOPES MOURAD
Published: (2011) -
Reduzindo custos da deduplicação de dados utilizando heurísticas e computação em nuvem.
by: NASCIMENTO FILHO, Dimas Cassimiro do.
Published: (2017) -
Uma estratégia eficiente de treinamento para Programação Genética aplicada a deduplicação de registros
by: Silva, Davi Guimarães da
Published: (2017)