以型態辨識為主的中文資訊擷取技術研究
隨著網際網路的蓬勃發展,資訊擷取(Information Extraction)已經成為一個非常重要的技術。資訊擷取的目標為從非結構化的文字資料中,為特定的主題整理出相關之結構化資訊,其所牽涉的問題,包括分析文件的內容,篩選、擷取出相關的文字及其對應的意義。到目前為止,大部份的資訊擷取系統都著重在英文文件上,對於中文文件資訊擷取技術的研究才正在如火如荼的展開,加上全世界至少超過1/5的人說中文,積極投入中文資訊擷取的研究就顯得非常重要。 中文的描述方式與英文有著很大的不同。在英文,詞跟詞之間有著明顯的『空白』,電腦可以很輕易的區隔輸入字串中每個詞。但是在中文,詞跟詞之間並沒有明顯的界...
Main Authors: | 翁嘉緯, Chia-Wei Weng |
---|---|
Language: | 中文 |
Published: |
國立政治大學
|
Subjects: | |
Online Access: | http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22G0090753018%22. |
Similar Items
-
中文繁簡等義詞自動辨識之研究
by: 黃群弼 -
人機介面中的形狀辨識及其應用
by: 鄭聖耀, et al. -
中文資訊擷取結果之錯誤偵測
by: 鄭雍瑋, et al. -
應用資訊擷取技術於企業評價財務項資料之取得
by: 賴哲霆, et al. -
以型態組合為主的關鍵詞擷取技術在學術寫作字彙上的研究
by: 邵智捷, et al.