題名: | 中文文本中長句的主題詞辨識與其應用 |
作者: | 梁, 婷 Jr 潘, 善均 Jr 陳, 冠熙 Jr |
關鍵字: | 中文文本 主題詞辨識 離題偵測 主題特徵 重心理論 |
期刊名/會議名稱: | NCS 2009 |
摘要: | 主題詞辨識可釐清文本的核心敘述,是文本理解中的一項重要工作。本論文提出一個中文文本語句主題詞之辨識法。此法乃利用重心理論並考量中文語句結構的特性,使之可應用於作文評分中的離題偵測、主題連貫性和語義概念結構分析。我們以長句中每小句重心為基礎,分別就其頻率、位置、主題延伸性、前後句之一致性、主題概念等特徵,進行權重設計以辨識每一完整長句的主題詞。從實驗結果顯示此法在長句主題詞的辨識上,在9篇報紙社論可達86.84%正確率,在22篇高中生作文可達80.86%正確率。另在83篇高中生作文的離題偵測實驗上,所提的方法也較前人所用的詞彙方法得到較佳的偵測,辨識效果可達63%正確率。 |
日期: | 2011-03-24T19:57:10Z |
分類: | 2009年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
AFU 5-2.pdf | 310.04 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。