Metody statystyczne w komputerowym przetwarzaniu języka naturalnego

Artykuł wprowadza w problematykę wykorzystania metod statystycznych w komputerowym przetwarzaniu tekstów języka naturalnego. Została w nim zaprezentowana lingwistyka kwantytatywna oraz jednostki tekstu podlegające badaniom statystycznym. Przyjęte definicje jednostek leksykalnych poddane zostały dysk...

Full description

Bibliographic Details
Main Author: Piotr Malak
Format: Article
Language:English
Published: Wydawnictwo Naukowe Uniwersytetu Mikołaja Kopernika 2011-05-01
Series:Toruńskie Studia Bibliologiczne
Subjects:
Online Access:https://apcz.umk.pl/czasopisma/index.php/TSB/article/view/1736
Description
Summary:Artykuł wprowadza w problematykę wykorzystania metod statystycznych w komputerowym przetwarzaniu tekstów języka naturalnego. Została w nim zaprezentowana lingwistyka kwantytatywna oraz jednostki tekstu podlegające badaniom statystycznym. Przyjęte definicje jednostek leksykalnych poddane zostały dyskusji ze względu na ich przydatność w komputerowym, statystycznym przetwarzaniu języka naturalnego, z uwzględnieniem różnic terminologicznych występujących w polsko- i angielskojęzycznej literaturze przedmiotu. Omówione zostały również cechy statystyczne jednostek leksykalnych oraz kategorie i miary stosowane do ich badań kwantytatywnych.
ISSN:2080-1807