期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于成词率和谱聚类的电力文本领域词发现方法 被引量:1
1
作者 杨政 尹春林 +1 位作者 蔡迪 李慧斌 《电子技术应用》 2021年第10期29-32,37,共5页
考虑到当前电力行业仍缺少有效的领域词发现方法,以电力行业科技项目文本为原始语料库,将基于互信息与左右熵的统计特征与传统语言构词规则特征相融合,提出了电力文本成词率的概念。所提方法首先利用成词率对电力文本进行无监督筛选得... 考虑到当前电力行业仍缺少有效的领域词发现方法,以电力行业科技项目文本为原始语料库,将基于互信息与左右熵的统计特征与传统语言构词规则特征相融合,提出了电力文本成词率的概念。所提方法首先利用成词率对电力文本进行无监督筛选得到初始候选词集,然后对候选词集进行文本切片算法和常用词过滤操作,最后进行词嵌入和谱聚类得到最终所需的电力文本领域词。实验结果表明,所提出的方法准确有效,为电力文本的领域词发现提供了一种新方法。 展开更多
关键词 成词率 谱聚类 领域词发现 电力文本
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部