期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
HDP与互信息相结合的中文无指导分词 被引量:2
1
作者 曹自强 李素建 《中文信息学报》 CSCD 北大核心 2013年第6期1-5,44,共6页
该文探讨了无指导条件下的中文分词,这对构建语言无关的健壮分词系统大有裨益。互信息与HDP(Hierarchical Dirichlet Process)是无指导情况下常用的分词模型,该文将两者结合,并改进了采样算法。不考虑标点符号,在两份大小不同的测试语... 该文探讨了无指导条件下的中文分词,这对构建语言无关的健壮分词系统大有裨益。互信息与HDP(Hierarchical Dirichlet Process)是无指导情况下常用的分词模型,该文将两者结合,并改进了采样算法。不考虑标点符号,在两份大小不同的测试语料上获得的F值为0.693与0.741,相比baseline的HDP分别提升了5.8%和3.9%。该文还用该模型进行了半指导分词,实验结果比常用的CRF有指导分词提升了2.6%。 展开更多
关键词 HDP 互信息 无指导分词
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部