期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进C-value方法的中文术语抽取 被引量:23
1
作者 胡阿沛 张静 刘俊丽 《现代图书情报技术》 CSSCI 北大核心 2013年第2期24-29,共6页
提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进C-value方法得到IC-value... 提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进C-value方法得到IC-value方法,并用来计算候选术语的术语度。以1 000篇乙型肝炎相关论文摘要进行实证研究,结果证明IC-value方法在准确率和召回率方面都要优于C-value、TF-IDF和V-value,有较强的长术语发现能力,且识别破碎子串的效果十分明显。 展开更多
关键词 术语抽取 串频统计 语言规则 术语度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部