期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多策略融合的专利术语自动抽取 被引量:4
1
作者 周绍钧 吕学强 +1 位作者 李卓 都云程 《计算机应用与软件》 CSCD 2015年第2期28-32,共5页
专利术语自动抽取是知识抽取与文本挖掘的关键环节。在构建专利文献停用词表以及提取特定规则的基础上,抽取候选专利术语;通过分析专利术语与其所在句子的关联关系、相邻专利术语之间的影响以及常识性词语对专利术语抽取的干扰,分别提... 专利术语自动抽取是知识抽取与文本挖掘的关键环节。在构建专利文献停用词表以及提取特定规则的基础上,抽取候选专利术语;通过分析专利术语与其所在句子的关联关系、相邻专利术语之间的影响以及常识性词语对专利术语抽取的干扰,分别提出基于PageRank思想的STRank权重计算方法、专利术语区别度计算方法以及知网义原信息降权方法,并融合上述方法对专利术语进行抽取。采用传感器领域的专利文献进行实验,在top-1400、top-1600级别上正确率为80.5%、79.7%,相对比CS+CC+CD方法分别提高了11.4%、9.5%。实验结果证明该多策略融合方法的有效性。 展开更多
关键词 专利术语 术语抽取 PAGERANK 术语区别度 义原信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部