Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma

Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:45:31Z No. of bitstreams: 2 Dissertacao Gilliard Lopes.pdf: 2357528 bytes, checksum: fd0913ca03078329224a12a6dd90a678 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) === Made available in DSpace o...

Full description

Bibliographic Details
Main Author:	Lopes, Gilliard Alan de Melo
Other Authors:	Mello, Carlos Alexandre Barros de
Language:	br
Published:	Universidade Federal de Pernambuco 2015
Subjects:	Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens
Online Access:	https://repositorio.ufpe.br/handle/123456789/11995

id	ndltd-IBICT-oai-repositorio.ufpe.br-123456789-11995
record_format	oai_dc
spelling	ndltd-IBICT-oai-repositorio.ufpe.br-123456789-119952019-01-21T19:16:05Z Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma Lopes, Gilliard Alan de Melo Mello, Carlos Alexandre Barros de Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:45:31Z No. of bitstreams: 2 Dissertacao Gilliard Lopes.pdf: 2357528 bytes, checksum: fd0913ca03078329224a12a6dd90a678 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Made available in DSpace on 2015-03-11T17:47:35Z (GMT). No. of bitstreams: 2 Dissertacao Gilliard Lopes.pdf: 2357528 bytes, checksum: fd0913ca03078329224a12a6dd90a678 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-13 FACEPE Esta dissertação apresenta um novo algoritmo para segmentação de sinais de voz baseado em técnicas de processamento de imagem, tais como análise de espectrograma, morfologia matemática, componentes conectados, análise de projeção e binarização. O algoritmo proposto opera em dois ciclos: o primeiro age separando o sinal de voz do fundo (silêncio ou ruído). O segundo utiliza esse sinal de voz segmentado para realizar a segmentação de sílabas fonéticas (agrupamento de fonemas). A base de dados de áudio MIT (MIT Mobile Device Speaker Verification Corpus) e a TIMIT (Texas Instruments/Massachussets Institute of Technology) foram utilizadas para validação do algoritmo proposto. Os sinais de voz escolhidos variam desde o gênero do locutor, a regionalidade (sotaque), tipos de fonemas e ruídos de fundo, como: ruídos de apito, chuva, vento e de um cruzamento de ruas com tráfego intenso. A técnica proposta mostrou eficiência na segmentação, no que diz respeito aos segmentos fonéticos, em ambientes com ausência e presença de ruídos, utilizando os mesmos parâmetros em ambas as situações 2015-03-11T17:47:35Z 2015-03-11T17:47:35Z 2013-08-13 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis LOPES, Gilliard Alan de Melo. Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma. Recife, 2013. 60 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2013.. https://repositorio.ufpe.br/handle/123456789/11995 br Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE
collection	NDLTD
language	br
sources	NDLTD
topic	Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens
spellingShingle	Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens Lopes, Gilliard Alan de Melo Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
description	Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:45:31Z No. of bitstreams: 2 Dissertacao Gilliard Lopes.pdf: 2357528 bytes, checksum: fd0913ca03078329224a12a6dd90a678 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) === Made available in DSpace on 2015-03-11T17:47:35Z (GMT). No. of bitstreams: 2 Dissertacao Gilliard Lopes.pdf: 2357528 bytes, checksum: fd0913ca03078329224a12a6dd90a678 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-13 === FACEPE === Esta dissertação apresenta um novo algoritmo para segmentação de sinais de voz baseado em técnicas de processamento de imagem, tais como análise de espectrograma, morfologia matemática, componentes conectados, análise de projeção e binarização. O algoritmo proposto opera em dois ciclos: o primeiro age separando o sinal de voz do fundo (silêncio ou ruído). O segundo utiliza esse sinal de voz segmentado para realizar a segmentação de sílabas fonéticas (agrupamento de fonemas). A base de dados de áudio MIT (MIT Mobile Device Speaker Verification Corpus) e a TIMIT (Texas Instruments/Massachussets Institute of Technology) foram utilizadas para validação do algoritmo proposto. Os sinais de voz escolhidos variam desde o gênero do locutor, a regionalidade (sotaque), tipos de fonemas e ruídos de fundo, como: ruídos de apito, chuva, vento e de um cruzamento de ruas com tráfego intenso. A técnica proposta mostrou eficiência na segmentação, no que diz respeito aos segmentos fonéticos, em ambientes com ausência e presença de ruídos, utilizando os mesmos parâmetros em ambas as situações
author2	Mello, Carlos Alexandre Barros de
author_facet	Mello, Carlos Alexandre Barros de Lopes, Gilliard Alan de Melo
author	Lopes, Gilliard Alan de Melo
author_sort	Lopes, Gilliard Alan de Melo
title	Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
title_short	Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
title_full	Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
title_fullStr	Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
title_full_unstemmed	Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
title_sort	segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
publisher	Universidade Federal de Pernambuco
publishDate	2015
url	https://repositorio.ufpe.br/handle/123456789/11995
work_keys_str_mv	AT lopesgilliardalandemelo segmentacaodevozemambientesruidososutilizandoanalisedeimagemdoespectrograma
_version_	1718863255652270080

Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma

Similar Items