期刊文献+

汉语分词和词性标注一体化分析的方法研究 被引量:4

Research on the Approach of Integratng Chinese Word Segmentation with Part-of-speech Tagging
下载PDF
导出
摘要 提出了一种汉语文本切分和词性标注相融合的一体化分析的统计模型,并应用动态规划算法与A*解码算法相结合的二次搜索算法,实现了一个基于该模型的汉语词法分析器。初步的开放测试表明,该分析器的分词准确率和词性标注正确率分别可达98.67%和95.49%。 In this paper,we present a stochastic model integrating Chinese word segmentation with part-of-speech tagging.We also develop a Chinese lexical analyzer using a two-way searching algorithm which incorporates backward dynamic programming algorithm into A*decode algorithm.The primary experiment proved that the overall accuracy of the proposed analyzer is 98.67% for segmentation and 95.49% for POS tagging respectively.
出处 《计算机应用研究》 CSCD 北大核心 2001年第7期24-26,共3页 Application Research of Computers
基金 国家"863"计划资助项目(863-ZT-03-02-3)
关键词 汉语分词 词性标注 A^*解码算法 一体化分析 自然语言处理 Chinese word segmentation Part-of-speech tagging A* decode algorithm
  • 相关文献

参考文献1

二级参考文献2

共引文献29

同被引文献50

引证文献4

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部