期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于统计的汉语叠词自动识别研究
1
作者 杨帆 刘亮亮 《重庆理工大学学报(自然科学)》 CAS 2016年第7期123-128,共6页
提出一种汉语叠词的自动获取方法。首先利用结构合理的五元组模型对分词后的语料进行统计以获得各类叠词候选集;在此基础上,通过叠词度的运算判断实现"AAB"式、"ABB"式、"ABA"式、"ABAB"式、&q... 提出一种汉语叠词的自动获取方法。首先利用结构合理的五元组模型对分词后的语料进行统计以获得各类叠词候选集;在此基础上,通过叠词度的运算判断实现"AAB"式、"ABB"式、"ABA"式、"ABAB"式、"AABB"式叠词的自动获取;在叠词度判断的基础上,通过左、右邻接熵的运算判断实现"AA"式叠词的自动获取。该方法根据结构合理的五元组模型获得的统计信息,结合叠词度和信息熵的判断,实现了叠词的量化判断和自动获取。实验结果证明:该方法能有效实现汉语叠词的自动获取,且准确率高。 展开更多
关键词 汉语叠词 五元组模型 叠词度 左、右邻接熵
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部