Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai

Šiame darbe aptariamas natūralios kalbos apdorojimo terminų ontologijos kūrimas, kūrimo problemos ir jų sprendimo būdai. Tam, iš skirtingų šaltinių surinkta 217 NLP terminų. Terminai išversti į lietuvių kalbą. Trumpai aptartos problemos verčiant. Aprašytos tiek kompiuterinės, tiek filosofinės ontolo...

Full description

Bibliographic Details
Main Author: Ramonas, Vilmantas
Other Authors: Utka, Andrius
Format: Dissertation
Language:Lithuanian
Published: Lithuanian Academic Libraries Network (LABT) 2010
Subjects:
Online Access:http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2010~D_20100617_110058-43397/DS.005.0.01.ETD
id ndltd-LABT_ETD-oai-elaba.lt-LT-eLABa-0001-E.02~2010~D_20100617_110058-43397
record_format oai_dc
spelling ndltd-LABT_ETD-oai-elaba.lt-LT-eLABa-0001-E.02~2010~D_20100617_110058-433972014-01-17T03:47:07Z2010-06-17litPhilologyRamonas, VilmantasNatūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdaiOntology of natural language processing terms: development issues and their solutionsLithuanian Academic Libraries Network (LABT)Šiame darbe aptariamas natūralios kalbos apdorojimo terminų ontologijos kūrimas, kūrimo problemos ir jų sprendimo būdai. Tam, iš skirtingų šaltinių surinkta 217 NLP terminų. Terminai išversti į lietuvių kalbą. Trumpai aptartos problemos verčiant. Aprašytos tiek kompiuterinės, tiek filosofinės ontologijos, paminėti jų panašumai ir skirtumai. Išsamiau aptartas filosofinis požiūris į sąvokų ir daiktų panašumą, ką reikia žinoti, siekiant kiek galima geriau suprasti kompiuterinių ontologijų sudarymo principus. Išnagrinėtas pats NLP terminas, kas sudaro NLP, kokios natūralios kalbos apdorojimo technologijos jau sukurtos, kokios dar kuriamos. NLP terminų ontologijos sudarymui pasirinkus Teminių žemėlapių ontologijos struktūrą ir principus, plačiai aprašyti Teminių žemėlapių (TM) sudarymo principai, pagrindinės TM sudedamosios dalys: temos, temų vardai, asociacijos, vaidmenys asociacijose ir kiti. Vėliau, iš turimų terminų, paliekant tokią struktūrą, kokia rasta šaltinyje, nubraižytas medis. Prieita išvados, jog terminų skaičių reikia mažinti ir atsisakyti pirminės iš šaltinių atsineštos struktūros. Tad palikti tik 69 terminai, darant prielaidą, jog šie svarbiausi. Šiems terminams priskirta keliolika tipų, taip juos suskirstant į grupes. Ieškant dar geresnio skirstymo būdo, kiekvienam iš terminų priskirtas vienas ar keli jį geriausiai nusakantys meta aprašymai, pvz.: mašininis vertimas – vertimas, aukštas automatizavimo lygis. Visi meta aprašymai suskirstyti į 7 stambiausias grupes... [toliau žr. visą tekstą]In this work it is discussed the development of ontology of natural language processing terms, developmental problems and their solutions. In order to reveal the topic of this work was gathered a collection of 217 NLP terms from different sources. The terms were translated into Lithuanian language. Briefly were revealed the problems of translation. There were described both the computer and philosophical ontology, mentioned their similarities and differences. There was discussed in detail the philosophical approach to the similarity of concepts and objects which is needed to know seeking to understand the ontology of computer principles as much as possible. There was examined the term of NLP, what is the NLP, which natural language processing technologies have already been developed, which are still being developed. For the composition of ontology of NLP terms were chosen the structure and principles of the Topic Maps in order to describe in broad the principles of composition of Topic Maps (TM), the main components of TM: theme, topic names, associations, role in association and others. Later from the got terms there was drawn the tree leaving the structure which was found in the source. It was found that the number of terms should be reduced and it is needed to refuse the primary structure taken from the sources. So, there were left only 69 terms, assuming that they are the most important. There were assigned several types for these terms dividing them into the groups... [to full text]OntologijaNatūralios kalbos apdorojimasTeminiai žemėlapiaiOntologyNatural language processingTopic mapsMaster thesisUtka, AndriusBoizou, LoicVytautas Magnus UniversityVytautas Magnus Universityhttp://vddb.laba.lt/obj/LT-eLABa-0001:E.02~2010~D_20100617_110058-43397LT-eLABa-0001:E.02~2010~D_20100617_110058-43397VDU-nmdbneeoxjq-20100525-064841http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2010~D_20100617_110058-43397/DS.005.0.01.ETDUnrestrictedapplication/pdf
collection NDLTD
language Lithuanian
format Dissertation
sources NDLTD
topic Philology
Ontologija
Natūralios kalbos apdorojimas
Teminiai žemėlapiai
Ontology
Natural language processing
Topic maps
spellingShingle Philology
Ontologija
Natūralios kalbos apdorojimas
Teminiai žemėlapiai
Ontology
Natural language processing
Topic maps
Ramonas, Vilmantas
Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
description Šiame darbe aptariamas natūralios kalbos apdorojimo terminų ontologijos kūrimas, kūrimo problemos ir jų sprendimo būdai. Tam, iš skirtingų šaltinių surinkta 217 NLP terminų. Terminai išversti į lietuvių kalbą. Trumpai aptartos problemos verčiant. Aprašytos tiek kompiuterinės, tiek filosofinės ontologijos, paminėti jų panašumai ir skirtumai. Išsamiau aptartas filosofinis požiūris į sąvokų ir daiktų panašumą, ką reikia žinoti, siekiant kiek galima geriau suprasti kompiuterinių ontologijų sudarymo principus. Išnagrinėtas pats NLP terminas, kas sudaro NLP, kokios natūralios kalbos apdorojimo technologijos jau sukurtos, kokios dar kuriamos. NLP terminų ontologijos sudarymui pasirinkus Teminių žemėlapių ontologijos struktūrą ir principus, plačiai aprašyti Teminių žemėlapių (TM) sudarymo principai, pagrindinės TM sudedamosios dalys: temos, temų vardai, asociacijos, vaidmenys asociacijose ir kiti. Vėliau, iš turimų terminų, paliekant tokią struktūrą, kokia rasta šaltinyje, nubraižytas medis. Prieita išvados, jog terminų skaičių reikia mažinti ir atsisakyti pirminės iš šaltinių atsineštos struktūros. Tad palikti tik 69 terminai, darant prielaidą, jog šie svarbiausi. Šiems terminams priskirta keliolika tipų, taip juos suskirstant į grupes. Ieškant dar geresnio skirstymo būdo, kiekvienam iš terminų priskirtas vienas ar keli jį geriausiai nusakantys meta aprašymai, pvz.: mašininis vertimas – vertimas, aukštas automatizavimo lygis. Visi meta aprašymai suskirstyti į 7 stambiausias grupes... [toliau žr. visą tekstą] === In this work it is discussed the development of ontology of natural language processing terms, developmental problems and their solutions. In order to reveal the topic of this work was gathered a collection of 217 NLP terms from different sources. The terms were translated into Lithuanian language. Briefly were revealed the problems of translation. There were described both the computer and philosophical ontology, mentioned their similarities and differences. There was discussed in detail the philosophical approach to the similarity of concepts and objects which is needed to know seeking to understand the ontology of computer principles as much as possible. There was examined the term of NLP, what is the NLP, which natural language processing technologies have already been developed, which are still being developed. For the composition of ontology of NLP terms were chosen the structure and principles of the Topic Maps in order to describe in broad the principles of composition of Topic Maps (TM), the main components of TM: theme, topic names, associations, role in association and others. Later from the got terms there was drawn the tree leaving the structure which was found in the source. It was found that the number of terms should be reduced and it is needed to refuse the primary structure taken from the sources. So, there were left only 69 terms, assuming that they are the most important. There were assigned several types for these terms dividing them into the groups... [to full text]
author2 Utka, Andrius
author_facet Utka, Andrius
Ramonas, Vilmantas
author Ramonas, Vilmantas
author_sort Ramonas, Vilmantas
title Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
title_short Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
title_full Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
title_fullStr Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
title_full_unstemmed Natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
title_sort natūralios kalbos apdorojimo terminų ontologija: kūrimo problemos ir jų sprendimo būdai
publisher Lithuanian Academic Libraries Network (LABT)
publishDate 2010
url http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2010~D_20100617_110058-43397/DS.005.0.01.ETD
work_keys_str_mv AT ramonasvilmantas naturalioskalbosapdorojimoterminuontologijakurimoproblemosirjusprendimobudai
AT ramonasvilmantas ontologyofnaturallanguageprocessingtermsdevelopmentissuesandtheirsolutions
_version_ 1716626168721965056