-
题名基于渐进式丰富词典的分词方法研究
被引量:1
- 1
-
-
作者
杨柳
袁方
霍亮
-
机构
河北大学数学与计算机科学学院
河北大学经济学院
保定金融高等专科学校计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第32期164-166,共3页
-
基金
河北省科技攻关计划项目(05213573)
河北省教育厅科研计划项目(2004406)。
-
文摘
由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来。由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频的方法记录下来,如果词频达到一定阈值,就可以把它认为是新词,可以把它加入到词典中,使得词典动态的增加。实验证明,该方法在保证分词速度不受影响的基础上,可以提高分词的精度。
-
关键词
渐进式丰富词典
字符串匹配分词方法
统计分词方法
-
Keywords
enriching dictionary
gradually the matching method
the statistic method
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-