Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs

CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior === A presente tese descreve a elaboraÃÃo de uma gramÃtica da frase do PortuguÃs Brasileiro, desenvolvida no quadro de um modelo teÃrico de sofisticado formalismo computacional, a Lexical Functional Grammar (LFG) e implementada no sistema q...

Full description

Bibliographic Details
Main Author: AndrÃa Feitosa dos Santos
Other Authors: Leonel Figueiredo de Alencar Araripe
Format: Others
Language:Portuguese
Published: Universidade Federal do Cearà 2014
Subjects:
Online Access:http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=13867
id ndltd-IBICT-oai-www.teses.ufc.br-9201
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic GramÃtica LFG-XLE
AnÃlise sintÃtica profunda
LinguÃstica computacional
Processamento de linguagem natural
ParGram
GramÃtica LFG-XLE
AnÃlise sintÃtica profunda
LinguÃstica computacional
Processamento de linguagem natural
ParGram
LFG-XLE Grammar
AnÃlise sintÃtica profunda
ParGram
Computational linguistics
Natural Language Processing
LFG-XLE Grammar
AnÃlise sintÃtica profunda
ParGram
Computational linguistics
Natural Language Processing
LINGUISTICA APLICADA
LINGUISTICA APLICADA
spellingShingle GramÃtica LFG-XLE
AnÃlise sintÃtica profunda
LinguÃstica computacional
Processamento de linguagem natural
ParGram
GramÃtica LFG-XLE
AnÃlise sintÃtica profunda
LinguÃstica computacional
Processamento de linguagem natural
ParGram
LFG-XLE Grammar
AnÃlise sintÃtica profunda
ParGram
Computational linguistics
Natural Language Processing
LFG-XLE Grammar
AnÃlise sintÃtica profunda
ParGram
Computational linguistics
Natural Language Processing
LINGUISTICA APLICADA
LINGUISTICA APLICADA
AndrÃa Feitosa dos Santos
Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
description CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior === A presente tese descreve a elaboraÃÃo de uma gramÃtica da frase do PortuguÃs Brasileiro, desenvolvida no quadro de um modelo teÃrico de sofisticado formalismo computacional, a Lexical Functional Grammar (LFG) e implementada no sistema que constitui o estado da arte em ambiente de processamento sintÃtico profundo no modelo gerativo da LFG, o robusto Xerox Linguistic Environment (XLE). A principal caracterÃstica da gramÃtica à que adota o sistema de anotaÃÃo do ParGram e a metodologia convencionada por desenvolvedores de gramÃtica XLE. No fragmento de gramÃtica estÃo modelados diversificados elementos da sintaxe frasal. Em nossa gramÃtica, foram modelados constituintes oracionais como IP e CP, elementos que encabeÃam as sentenÃas do portuguÃs. TambÃm foram modelados determinados aspectos da subcategorizaÃÃo verbal e da estrutura argumental. Dos elementos verbais, nossa gramÃtica contempla alguns casos de complexos verbais constituÃdos de verbos modais e verbos de controle. Os elementos nominais tratados na gramÃtica, de modo central, foram os pronomes expletivos e reflexivos, e os casos de sintagmas nominais e determinantes com pronomes demonstrativos e interrogativos. Os demais aspectos modelados na gramÃtica sÃo os sintagmas preposicionados, cuja complexidade se dà na distinÃÃo entre preposiÃÃes semÃnticas e nÃo semÃnticas; os sintagmas adjetivais, cuja projeÃÃo na sentenÃa pode ocorrer a partir de formas adjetivais atributivas, de formas ordinais ou cardinais e na forma de intensificadores; e os sintagmas adverbiais, cuja estrutura interna foi modelada levando-se em consideraÃÃo tanto advÃrbios intransitivos quanto transitivos com complemento PP. A nossa avaliaÃÃo demonstra que das 40 sentenÃas testadas, a nossa gramÃtica atribui, para todas elas, anÃlises consistentes e bem fundamentadas, ao passo que o parser Palavras, o atual estado da arte em processamento sintÃtico profundo do portuguÃs, atribui, a 9 sentenÃas, anÃlises incorretas. Uma outra avaliaÃÃo demonstra que, das 20 sentenÃas agramaticais testadas tanto em nossa gramÃtica, quanto no Palavras, somente 2 receberam anÃlises por parte de nossa gramÃtica, enquanto o Palavras fornece anÃlises para 19 sentenÃas. O trabalho tem, essencialmente, o objetivo de fazer uma descriÃÃo formal e fundamentada de um amplo leque de fenÃmenos do portuguÃs brasileiro, mas, sobretudo, tem o objetivo de contribuir com uma gramÃtica nÃo trivial da frase do portuguÃs no formalismo LFG-XLE, disponibilizando efetivamente um recurso gramatical do portuguÃs voltado para o processamento de linguagem natural. === The present thesis describes the development of a Brazilian Portuguese sentence grammar, developed in the framework of a sophisticated computational formalism, named Lexical Functional Grammar, and implemented on a system that is state of the art in deep parsing environment in LFG generative model, the robust XLE. The main feature of the grammar is that it adopts the ParGram annotation system and the methodology agreed by XLE grammar developers. In the grammar fragment are modeled diverse elements of phrasal syntax. In our grammar were modeled constituents as IP and CP, elements that are head the sentences of the Portuguese. Also were modeled certain aspects of verbal subcategorization and argument structure. In terms of verbal elements, our grammar includes some cases of verbal complex made up of modal verbs and control verbs. The nominal elements treated in grammar, centrally, were the expletives and reflexive pronouns, and cases of nominal and determiners phrases with demonstrative pronouns and interrogative. The other aspects modeled in the grammar are PPs, whose complexity is given the distinction between semantic and nonstandard prepositions; the adjectival phrases, whose projection in the sentence can occur from attributive adjectival forms of ordinal or cardinal forms and as intensifiers; and adverbial phrases, whose internal structure was modeled taking into account both adverbs as intransitive and as transitive, with PP complement. Our evaluation shows that of the 40 tested sentences, our grammar assigns, for all of them, consistent and well-founded analysis, while the parser Palavras, the current state of the art in deep syntactic processing of Portuguese, assigns incorrect analysis for 9 sentences. Another evaluation shows that, of the 20 ungrammatical sentences tested both in our grammar, as in Palavras, only 2 received analysis by our grammar, while the Palavras provides analysis to 19 sentences. The work has essentially the goal of making a formal and grounded description in a broad range of phenomena in Brazilian Portuguese, but mainly aims to collaborate with a not trivial grammar of the sentence in the LFG-XLE formalism, effectively contributing to a grammatical resource turned to the natural language processing.
author2 Leonel Figueiredo de Alencar Araripe
author_facet Leonel Figueiredo de Alencar Araripe
AndrÃa Feitosa dos Santos
author AndrÃa Feitosa dos Santos
author_sort AndrÃa Feitosa dos Santos
title Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
title_short Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
title_full Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
title_fullStr Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
title_full_unstemmed Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs
title_sort uma gramãtica lfg-xle para o processamento sintãtico profunda do portuguãs
publisher Universidade Federal do CearÃ
publishDate 2014
url http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=13867
work_keys_str_mv AT andraafeitosadossantos umagramaticalfgxleparaoprocessamentosintaticoprofundadoportuguas
AT andraafeitosadossantos alfgxlegrammarforbrazilianportuguesedeepparser
_version_ 1718901772624330752
spelling ndltd-IBICT-oai-www.teses.ufc.br-92012019-01-21T23:04:47Z Uma gramÃtica LFG-XLE para o processamento sintÃtico profunda do portuguÃs A LFG-XLE grammar for Brazilian Portuguese deep parser AndrÃa Feitosa dos Santos Leonel Figueiredo de Alencar Araripe VlÃdia CÃlia Monteiro Pinheiro Francisco de Assis Tavares Ferreira da Silva Maria Elias Soares MÃrcia Teixeira Nogueira GramÃtica LFG-XLE AnÃlise sintÃtica profunda LinguÃstica computacional Processamento de linguagem natural ParGram GramÃtica LFG-XLE AnÃlise sintÃtica profunda LinguÃstica computacional Processamento de linguagem natural ParGram LFG-XLE Grammar AnÃlise sintÃtica profunda ParGram Computational linguistics Natural Language Processing LFG-XLE Grammar AnÃlise sintÃtica profunda ParGram Computational linguistics Natural Language Processing LINGUISTICA APLICADA LINGUISTICA APLICADA CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior A presente tese descreve a elaboraÃÃo de uma gramÃtica da frase do PortuguÃs Brasileiro, desenvolvida no quadro de um modelo teÃrico de sofisticado formalismo computacional, a Lexical Functional Grammar (LFG) e implementada no sistema que constitui o estado da arte em ambiente de processamento sintÃtico profundo no modelo gerativo da LFG, o robusto Xerox Linguistic Environment (XLE). A principal caracterÃstica da gramÃtica à que adota o sistema de anotaÃÃo do ParGram e a metodologia convencionada por desenvolvedores de gramÃtica XLE. No fragmento de gramÃtica estÃo modelados diversificados elementos da sintaxe frasal. Em nossa gramÃtica, foram modelados constituintes oracionais como IP e CP, elementos que encabeÃam as sentenÃas do portuguÃs. TambÃm foram modelados determinados aspectos da subcategorizaÃÃo verbal e da estrutura argumental. Dos elementos verbais, nossa gramÃtica contempla alguns casos de complexos verbais constituÃdos de verbos modais e verbos de controle. Os elementos nominais tratados na gramÃtica, de modo central, foram os pronomes expletivos e reflexivos, e os casos de sintagmas nominais e determinantes com pronomes demonstrativos e interrogativos. Os demais aspectos modelados na gramÃtica sÃo os sintagmas preposicionados, cuja complexidade se dà na distinÃÃo entre preposiÃÃes semÃnticas e nÃo semÃnticas; os sintagmas adjetivais, cuja projeÃÃo na sentenÃa pode ocorrer a partir de formas adjetivais atributivas, de formas ordinais ou cardinais e na forma de intensificadores; e os sintagmas adverbiais, cuja estrutura interna foi modelada levando-se em consideraÃÃo tanto advÃrbios intransitivos quanto transitivos com complemento PP. A nossa avaliaÃÃo demonstra que das 40 sentenÃas testadas, a nossa gramÃtica atribui, para todas elas, anÃlises consistentes e bem fundamentadas, ao passo que o parser Palavras, o atual estado da arte em processamento sintÃtico profundo do portuguÃs, atribui, a 9 sentenÃas, anÃlises incorretas. Uma outra avaliaÃÃo demonstra que, das 20 sentenÃas agramaticais testadas tanto em nossa gramÃtica, quanto no Palavras, somente 2 receberam anÃlises por parte de nossa gramÃtica, enquanto o Palavras fornece anÃlises para 19 sentenÃas. O trabalho tem, essencialmente, o objetivo de fazer uma descriÃÃo formal e fundamentada de um amplo leque de fenÃmenos do portuguÃs brasileiro, mas, sobretudo, tem o objetivo de contribuir com uma gramÃtica nÃo trivial da frase do portuguÃs no formalismo LFG-XLE, disponibilizando efetivamente um recurso gramatical do portuguÃs voltado para o processamento de linguagem natural. The present thesis describes the development of a Brazilian Portuguese sentence grammar, developed in the framework of a sophisticated computational formalism, named Lexical Functional Grammar, and implemented on a system that is state of the art in deep parsing environment in LFG generative model, the robust XLE. The main feature of the grammar is that it adopts the ParGram annotation system and the methodology agreed by XLE grammar developers. In the grammar fragment are modeled diverse elements of phrasal syntax. In our grammar were modeled constituents as IP and CP, elements that are head the sentences of the Portuguese. Also were modeled certain aspects of verbal subcategorization and argument structure. In terms of verbal elements, our grammar includes some cases of verbal complex made up of modal verbs and control verbs. The nominal elements treated in grammar, centrally, were the expletives and reflexive pronouns, and cases of nominal and determiners phrases with demonstrative pronouns and interrogative. The other aspects modeled in the grammar are PPs, whose complexity is given the distinction between semantic and nonstandard prepositions; the adjectival phrases, whose projection in the sentence can occur from attributive adjectival forms of ordinal or cardinal forms and as intensifiers; and adverbial phrases, whose internal structure was modeled taking into account both adverbs as intransitive and as transitive, with PP complement. Our evaluation shows that of the 40 tested sentences, our grammar assigns, for all of them, consistent and well-founded analysis, while the parser Palavras, the current state of the art in deep syntactic processing of Portuguese, assigns incorrect analysis for 9 sentences. Another evaluation shows that, of the 20 ungrammatical sentences tested both in our grammar, as in Palavras, only 2 received analysis by our grammar, while the Palavras provides analysis to 19 sentences. The work has essentially the goal of making a formal and grounded description in a broad range of phenomena in Brazilian Portuguese, but mainly aims to collaborate with a not trivial grammar of the sentence in the LFG-XLE formalism, effectively contributing to a grammatical resource turned to the natural language processing. 2014-12-19 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=13867 por info:eu-repo/semantics/openAccess application/pdf Universidade Federal do Cearà Programa de PÃs-GraduaÃÃo em LingÃÃstica UFC BR reponame:Biblioteca Digital de Teses e Dissertações da UFC instname:Universidade Federal do Ceará instacron:UFC