期刊文献+

中文分词中组合型切分歧义的消解研究 被引量:1

Research on combinational ambiguity strings in Chinese word segmentation
下载PDF
导出
摘要 针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1998年1月《人民日报》语料中出现的组合型歧义字段进行训练和测试,实验显示消歧的平均准确率达89.33%。 Combinational ambiguity is one of the most difficult problems in Chinese word segmentation.The paper discusses a new segmentation algorithm to solve the combinational ambiguity.The algorithm automatically extracts contextual information of the combinational ambiguity to establish rules,then uses the C-SVM model and these rules to solve the combinational ambiguity.The People Daily corpus of January 1998 is used in training and testing,and the average accuracy is 89.33%.
出处 《计算机工程与应用》 CSCD 北大核心 2011年第31期125-127,134,共4页 Computer Engineering and Applications
关键词 中文自动分词 组合型歧义 上下文信息 C-支持向量机 Chinese word segmentation combinational ambiguity contextual information C-Support Vector Machine(C-SVM)
  • 相关文献

参考文献9

二级参考文献36

共引文献39

同被引文献11

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部