Delayed Transfer Entropy applied to Big Data

Recent popularization of technologies such as Smartphones, Wearables, Internet of Things, Social Networks and Video streaming increased data creation. Dealing with extensive data sets led the creation of term big data, often defined as when data volume, acquisition rate or representation demands...

Full description

Bibliographic Details
Main Author: Jonas Rossi Dourado
Other Authors: Carlos Dias Maciel
Language:English
Published: Universidade de São Paulo 2018
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/18/18153/tde-19022019-134228/
id ndltd-IBICT-oai-teses.usp.br-tde-19022019-134228
record_format oai_dc
spelling ndltd-IBICT-oai-teses.usp.br-tde-19022019-1342282019-03-17T15:33:40Z Delayed Transfer Entropy applied to Big Data Delayed Transfer Entropy aplicado a Big Data Jonas Rossi Dourado Carlos Dias Maciel Alexandre Cláudio Botazzo Delbem Ailton Akira Shinoda Análise de Big Data Causalidade Cluster heterogêneo de computadores Delayed Transfer Entropy Estratégias de paralelismo Surrogate Big Data analysis Causality Delayed Transfer Entropy Heterogeneous computer cluster Parallelism strategies Surrogate Recent popularization of technologies such as Smartphones, Wearables, Internet of Things, Social Networks and Video streaming increased data creation. Dealing with extensive data sets led the creation of term big data, often defined as when data volume, acquisition rate or representation demands nontraditional approaches to data analysis or requires horizontal scaling for data processing. Analysis is the most important Big Data phase, where it has the objective of extracting meaningful and often hidden information. One example of Big Data hidden information is causality, which can be inferred with Delayed Transfer Entropy (DTE). Despite DTE wide applicability, it has a high demanding processing power which is aggravated with large datasets as those found in big data. This research optimized DTE performance and modified existing code to enable DTE execution on a computer cluster. With big data trend in sight, this results may enable bigger datasets analysis or better statistical evidence. A recente popularização de tecnologias como Smartphones, Wearables, Internet das Coisas, Redes Sociais e streaming de Video aumentou a criação de dados. A manipulação de grande quantidade de dados levou a criação do termo Big Data, muitas vezes definido como quando o volume, a taxa de aquisição ou a representação dos dados demanda abordagens não tradicionais para analisar ou requer uma escala horizontal para o processamento de dados. A análise é a etapa de Big Data mais importante, tendo como objetivo extrair informações relevantes e às vezes escondidas. Um exemplo de informação escondida é a causalidade, que pode ser inferida utilizando Delayed Transfer Entropy (DTE). Apesar do DTE ter uma grande aplicabilidade, ele possui uma grande demanda computacional, esta última, é agravada devido a grandes bases de dados como as encontradas em Big Data. Essa pesquisa otimizou e modificou o código existente para permitir a execução de DTE em um cluster de computadores. Com a tendência de Big Data em vista, esse resultado pode permitir bancos de dados maiores ou melhores evidências estatísticas. 2018-11-30 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/18/18153/tde-19022019-134228/ eng info:eu-repo/semantics/openAccess Universidade de São Paulo Engenharia Elétrica USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP
collection NDLTD
language English
sources NDLTD
topic Análise de Big Data
Causalidade
Cluster heterogêneo de computadores
Delayed Transfer Entropy
Estratégias de paralelismo
Surrogate
Big Data analysis
Causality
Delayed Transfer Entropy
Heterogeneous computer cluster
Parallelism strategies
Surrogate
spellingShingle Análise de Big Data
Causalidade
Cluster heterogêneo de computadores
Delayed Transfer Entropy
Estratégias de paralelismo
Surrogate
Big Data analysis
Causality
Delayed Transfer Entropy
Heterogeneous computer cluster
Parallelism strategies
Surrogate
Jonas Rossi Dourado
Delayed Transfer Entropy applied to Big Data
description Recent popularization of technologies such as Smartphones, Wearables, Internet of Things, Social Networks and Video streaming increased data creation. Dealing with extensive data sets led the creation of term big data, often defined as when data volume, acquisition rate or representation demands nontraditional approaches to data analysis or requires horizontal scaling for data processing. Analysis is the most important Big Data phase, where it has the objective of extracting meaningful and often hidden information. One example of Big Data hidden information is causality, which can be inferred with Delayed Transfer Entropy (DTE). Despite DTE wide applicability, it has a high demanding processing power which is aggravated with large datasets as those found in big data. This research optimized DTE performance and modified existing code to enable DTE execution on a computer cluster. With big data trend in sight, this results may enable bigger datasets analysis or better statistical evidence. === A recente popularização de tecnologias como Smartphones, Wearables, Internet das Coisas, Redes Sociais e streaming de Video aumentou a criação de dados. A manipulação de grande quantidade de dados levou a criação do termo Big Data, muitas vezes definido como quando o volume, a taxa de aquisição ou a representação dos dados demanda abordagens não tradicionais para analisar ou requer uma escala horizontal para o processamento de dados. A análise é a etapa de Big Data mais importante, tendo como objetivo extrair informações relevantes e às vezes escondidas. Um exemplo de informação escondida é a causalidade, que pode ser inferida utilizando Delayed Transfer Entropy (DTE). Apesar do DTE ter uma grande aplicabilidade, ele possui uma grande demanda computacional, esta última, é agravada devido a grandes bases de dados como as encontradas em Big Data. Essa pesquisa otimizou e modificou o código existente para permitir a execução de DTE em um cluster de computadores. Com a tendência de Big Data em vista, esse resultado pode permitir bancos de dados maiores ou melhores evidências estatísticas.
author2 Carlos Dias Maciel
author_facet Carlos Dias Maciel
Jonas Rossi Dourado
author Jonas Rossi Dourado
author_sort Jonas Rossi Dourado
title Delayed Transfer Entropy applied to Big Data
title_short Delayed Transfer Entropy applied to Big Data
title_full Delayed Transfer Entropy applied to Big Data
title_fullStr Delayed Transfer Entropy applied to Big Data
title_full_unstemmed Delayed Transfer Entropy applied to Big Data
title_sort delayed transfer entropy applied to big data
publisher Universidade de São Paulo
publishDate 2018
url http://www.teses.usp.br/teses/disponiveis/18/18153/tde-19022019-134228/
work_keys_str_mv AT jonasrossidourado delayedtransferentropyappliedtobigdata
AT jonasrossidourado delayedtransferentropyaplicadoabigdata
_version_ 1719003765691908096