題名: 基於大字符集柏洛菲勒轉換之中文文本資料壓縮方法
其他題名: A Chinese Text Compression Scheme Based on Large-Alphabet BW-Transform
作者: 古鴻炎
劉景民
關鍵字: 文本資料壓縮
大字符集
BWT文字轉換
算術編碼
期刊名/會議名稱: 中華民國92年全國計算機會議
摘要: 本論文提出一種基於大字符集柏洛-菲勒 轉換(Burrows-Wheelers Transform, BWT) 之 中文文本資料的壓縮方法,先以Big-5 加上 ASCII 形成的大字符集(alphabet)來剖析輸入 的中文文字檔案,再接著進行BWT、 MTF(Move to Front)、和算術編碼的處裡。我 們也研究了,在大字符集要求下能夠適用於 BWT、MTF 和算術編碼處裡上的實作方法, 以提升處理的速度。我們已經將這個壓縮方法 製作成可以實際使用之軟體程式,對於中文文 字檔案的測試實驗,結果顯示我們方法獲得的 壓縮率,比一般常被使用的Win-ZIP 好約 12%,比Win-RAR好約4%,而比原始的基於 BWT 的壓縮軟體BZIP2 的壓縮率好約 1%~2%。
日期: 2006-06-14T01:13:38Z
分類:2003年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
OT_1252003230.pdf274.23 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。