以型態辨識為主的中文資訊擷取技術研究

隨著網際網路的蓬勃發展，資訊擷取(Information Extraction)已經成為一個非常重要的技術。資訊擷取的目標為從非結構化的文字資料中，為特定的主題整理出相關之結構化資訊，其所牽涉的問題，包括分析文件的內容，篩選、擷取出相關的文字及其對應的意義。到目前為止，大部份的資訊擷取系統都著重在英文文件上，對於中文文件資訊擷取技術的研究才正在如火如荼的展開，加上全世界至少超過1/5的人說中文，積極投入中文資訊擷取的研究就顯得非常重要。中文的描述方式與英文有著很大的不同。在英文，詞跟詞之間有著明顯的『空白』，電腦可以很輕易的區隔輸入字串中每個詞。但是在中文，詞跟詞之間並沒有明顯的界...

Full description

Bibliographic Details
Main Authors:	翁嘉緯, Chia-Wei Weng
Language:	中文
Published:	國立政治大學
Subjects:	資訊擷取型態辨識有限狀態自動機 Information Extraction Pattern based Finite State Automata
Online Access:	http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22G0090753018%22.

Internet

http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22G0090753018%22.

以型態辨識為主的中文資訊擷取技術研究

Internet

Similar Items