期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于大规模语料的新词识别方法 被引量:24
1
作者 贺敏 龚才春 +1 位作者 张华平 程学旗 《计算机工程与应用》 CSCD 北大核心 2007年第21期157-159,共3页
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方... 提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。 展开更多
关键词 邻接类别 单字成词概率 双字耦合度
下载PDF
基于词内部模式的新词识别 被引量:17
2
作者 林自芳 蒋秀凤 《计算机与现代化》 2010年第11期162-164,167,共4页
提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程... 提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程度上能有效提取新词。 展开更多
关键词 内部模式 语识别 改进位置概率 首尾单字成词概率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部