中文分詞的結果是影響搜索引擎中文檢索結果質量的重要因素,能否準確有效的分詞對提高搜索結果的相關性" u# t) [9 q- ]/ V2 r1 @: |
和用戶滿意度都至關重要.本文回顧和整理了中文分詞評估所依的理論依據,同時建立了一套完整的基於
" m; }: U% ~# W" ?* H5 P搜索引擎中文分詞評估方法.這套評估方法涵蓋了評估樣本的提取、評估人員選取、評估標準的制定、以及
3 h" v/ Z$ m3 R7 O評估流程的設置等各個方面.實例分析的結果表明此方法是行之有效的.在此基礎上,作者進一步對實驗評估8 z" w4 c, C0 b9 p9 Z7 B# D7 U4 P
的結果進行了深入討論,並提出了提高評估效果的幾條建議,包括如何考慮評估人員背景、取捨評估項目等. |
|