[en] EFFICIENT METHODS FOR INFORMATION EXTRACTION IN NEWS WEBPAGES

[pt] Nós abordamos a tarefa de segmentação de páginas de notícias; mais especificamente identificação do título, data de publicação e corpo da notícia. Embora existam resultados muito bons na literatura, a maioria deles depende da renderização da página, que é uma tarefa muito demorada. Nós focamos...

Full description

Bibliographic Details
Main Author: EDUARDO TEIXEIRA CARDOSO
Other Authors: EDUARDO SANY LABER
Language:en
Published: MAXWELL 2017
Subjects:
Online Access:https://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=28984@1
https://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=28984@2
http://doi.org/10.17771/PUCRio.acad.28984