RHeSumaRST: um sumarizador automático de estruturas RST.

Made available in DSpace on 2016-06-02T19:06:27Z (GMT). No. of bitstreams: 1 DissERMS.pdf: 1350059 bytes, checksum: b053cbd6eaf16da40d372057cbe1d76d (MD5) Previous issue date: 2005-08-05 === This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST a...

Full description

Bibliographic Details
Main Author: Seno, Eloize Rossi Marques
Other Authors: Rino, Lúcia Helena Machado
Format: Others
Language:Portuguese
Published: Universidade Federal de São Carlos 2016
Subjects:
Online Access:https://repositorio.ufscar.br/handle/ufscar/623
id ndltd-IBICT-oai-repositorio.ufscar.br-ufscar-623
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufscar.br-ufscar-6232018-05-23T20:01:19Z RHeSumaRST: um sumarizador automático de estruturas RST. Seno, Eloize Rossi Marques Rino, Lúcia Helena Machado Processamento da linguagem natural (Computação) Sumarização automática Inteligência artificial CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Made available in DSpace on 2016-06-02T19:06:27Z (GMT). No. of bitstreams: 1 DissERMS.pdf: 1350059 bytes, checksum: b053cbd6eaf16da40d372057cbe1d76d (MD5) Previous issue date: 2005-08-05 This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration. Este trabalho apresenta um modelo de sumarização automática que se baseia no modelo de estruturação de discurso Rhetorical Structure Theory RST e no modelo de coerência global do discurso Veins Theory VT. A RST permite a estruturação de um discurso relacionando-se unidades discursivas com base em relações retóricas, isto é, permitindo recuperar as relações de significados entre tais unidades. Com base na estruturação RST, a Veins Theory delimita o domínio de acessibilidade referencial para cada unidade do discurso na forma de veias , indicando os limites nos quais os antecedentes de uma anáfora podem ocorrer ao longo do discurso. Além dessas teorias, o modelo também incorpora o modelo de classificação de saliência de unidades discursivas proposto por Marcu (1997a), que obtém uma ordem de importância das unidades discursivas de uma estrutura RST. O modelo de sumarização proposto consiste em um elenco de heurísticas que visam identificar informações supérfluas em uma estrutura RST de um texto, para exclusão durante a construção do seu sumário, tendo sempre como foco a preservação dos elos coreferenciais. Dessa forma, as heurísticas são guiadas por características específicas das relações retóricas da RST e por restrições de acessibilidade referencial da Veins Theory. Assim, o sumarizador proposto se resume à poda de segmentos discursivos irrelevantes das estruturas RST de textos, resultando em seus correspondentes sumários. As principais contribuições deste trabalho são a proposta de um novo modelo de sumarização automática e um protótipo para a sua aplicação automática. 2016-06-02T19:06:27Z 2007-07-10 2016-06-02T19:06:27Z 2005-08-05 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005. https://repositorio.ufscar.br/handle/ufscar/623 por info:eu-repo/semantics/openAccess application/pdf Universidade Federal de São Carlos Programa de Pós-graduação em Ciência da Computação UFSCar BR reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos instacron:UFSCAR
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Processamento da linguagem natural (Computação)
Sumarização automática
Inteligência artificial
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle Processamento da linguagem natural (Computação)
Sumarização automática
Inteligência artificial
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Seno, Eloize Rossi Marques
RHeSumaRST: um sumarizador automático de estruturas RST.
description Made available in DSpace on 2016-06-02T19:06:27Z (GMT). No. of bitstreams: 1 DissERMS.pdf: 1350059 bytes, checksum: b053cbd6eaf16da40d372057cbe1d76d (MD5) Previous issue date: 2005-08-05 === This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration. === Este trabalho apresenta um modelo de sumarização automática que se baseia no modelo de estruturação de discurso Rhetorical Structure Theory RST e no modelo de coerência global do discurso Veins Theory VT. A RST permite a estruturação de um discurso relacionando-se unidades discursivas com base em relações retóricas, isto é, permitindo recuperar as relações de significados entre tais unidades. Com base na estruturação RST, a Veins Theory delimita o domínio de acessibilidade referencial para cada unidade do discurso na forma de veias , indicando os limites nos quais os antecedentes de uma anáfora podem ocorrer ao longo do discurso. Além dessas teorias, o modelo também incorpora o modelo de classificação de saliência de unidades discursivas proposto por Marcu (1997a), que obtém uma ordem de importância das unidades discursivas de uma estrutura RST. O modelo de sumarização proposto consiste em um elenco de heurísticas que visam identificar informações supérfluas em uma estrutura RST de um texto, para exclusão durante a construção do seu sumário, tendo sempre como foco a preservação dos elos coreferenciais. Dessa forma, as heurísticas são guiadas por características específicas das relações retóricas da RST e por restrições de acessibilidade referencial da Veins Theory. Assim, o sumarizador proposto se resume à poda de segmentos discursivos irrelevantes das estruturas RST de textos, resultando em seus correspondentes sumários. As principais contribuições deste trabalho são a proposta de um novo modelo de sumarização automática e um protótipo para a sua aplicação automática.
author2 Rino, Lúcia Helena Machado
author_facet Rino, Lúcia Helena Machado
Seno, Eloize Rossi Marques
author Seno, Eloize Rossi Marques
author_sort Seno, Eloize Rossi Marques
title RHeSumaRST: um sumarizador automático de estruturas RST.
title_short RHeSumaRST: um sumarizador automático de estruturas RST.
title_full RHeSumaRST: um sumarizador automático de estruturas RST.
title_fullStr RHeSumaRST: um sumarizador automático de estruturas RST.
title_full_unstemmed RHeSumaRST: um sumarizador automático de estruturas RST.
title_sort rhesumarst: um sumarizador automático de estruturas rst.
publisher Universidade Federal de São Carlos
publishDate 2016
url https://repositorio.ufscar.br/handle/ufscar/623
work_keys_str_mv AT senoeloizerossimarques rhesumarstumsumarizadorautomaticodeestruturasrst
_version_ 1718648480528859136