中文分詞的結果是影響搜索引擎中文檢索結果質量的重要因素,能否準確有效的分詞對提高搜索結果的相關性
% o5 t7 m# G; z& b" C% C3 R和用戶滿意度都至關重要.本文回顧和整理了中文分詞評估所依的理論依據,同時建立了一套完整的基於
3 ], l/ m7 }+ H# E* O* C! |搜索引擎中文分詞評估方法.這套評估方法涵蓋了評估樣本的提取、評估人員選取、評估標準的制定、以及
2 [6 \: S! H6 V& v2 {! y$ P+ ?評估流程的設置等各個方面.實例分析的結果表明此方法是行之有效的.在此基礎上,作者進一步對實驗評估
4 u# U& h8 k" a/ A' r的結果進行了深入討論,並提出了提高評估效果的幾條建議,包括如何考慮評估人員背景、取捨評估項目等. |
|