Representação de Léxicos Através de Autômatos Finitos

Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente u...

Full description

Bibliographic Details
Main Author: Jesus, Marcelo Alexandre Couto de
Other Authors: Nunes, Maria das Graças Volpe
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 1999
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/
id ndltd-usp.br-oai-teses.usp.br-tde-06032018-160704
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-06032018-1607042019-05-09T18:13:24Z Representação de Léxicos Através de Autômatos Finitos Not available Jesus, Marcelo Alexandre Couto de Não disponível Not available Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico. Natural Language Processing (NLP) applications, such as speller and grammar checkers and translation systems, need to search very larga dictionaries which contab.\' morphosyntactical and/or semantic information of severa] hundreds of thousand words of a given language. Finite Automata are often used in efficient scanners for compilers and are also good candidates for representing dictionaries. This work has investigated methods for representing dictionaries using finite automata, techniques for minimizing acyclic deterministic finite automaton, and adequate data structures for a compact representation. The resulting system is able to represent a dictionary of 430,000 Brazilian Portuguese words in a 220Kb automaton, by using a standard home computer and spending less than five minutes. Biblioteca Digitais de Teses e Dissertações da USP Nunes, Maria das Graças Volpe 1999-12-20 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic Não disponível
Not available
spellingShingle Não disponível
Not available
Jesus, Marcelo Alexandre Couto de
Representação de Léxicos Através de Autômatos Finitos
description Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico. === Natural Language Processing (NLP) applications, such as speller and grammar checkers and translation systems, need to search very larga dictionaries which contab.\' morphosyntactical and/or semantic information of severa] hundreds of thousand words of a given language. Finite Automata are often used in efficient scanners for compilers and are also good candidates for representing dictionaries. This work has investigated methods for representing dictionaries using finite automata, techniques for minimizing acyclic deterministic finite automaton, and adequate data structures for a compact representation. The resulting system is able to represent a dictionary of 430,000 Brazilian Portuguese words in a 220Kb automaton, by using a standard home computer and spending less than five minutes.
author2 Nunes, Maria das Graças Volpe
author_facet Nunes, Maria das Graças Volpe
Jesus, Marcelo Alexandre Couto de
author Jesus, Marcelo Alexandre Couto de
author_sort Jesus, Marcelo Alexandre Couto de
title Representação de Léxicos Através de Autômatos Finitos
title_short Representação de Léxicos Através de Autômatos Finitos
title_full Representação de Léxicos Através de Autômatos Finitos
title_fullStr Representação de Léxicos Através de Autômatos Finitos
title_full_unstemmed Representação de Léxicos Através de Autômatos Finitos
title_sort representação de léxicos através de autômatos finitos
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 1999
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/
work_keys_str_mv AT jesusmarceloalexandrecoutode representacaodelexicosatravesdeautomatosfinitos
AT jesusmarceloalexandrecoutode notavailable
_version_ 1719053518438924288