期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
上下文分析与统计特征相结合的英文术语抽取研究
被引量:
1
1
作者
许德山
张智雄
+1 位作者
王峰
邢美凤
《现代图书情报技术》
CSSCI
北大核心
2010年第12期28-33,共6页
介绍术语的基本特征,探讨科技术语的自动识别方法,并结合文本特征对TF-IDF和C-value两种主流统计指标进行改进。为了区分词汇位置对文档内容的影响,分别对不同位置的候选词设置不同的权重。最后设计并实现一个统计与规则相结合的科技术...
介绍术语的基本特征,探讨科技术语的自动识别方法,并结合文本特征对TF-IDF和C-value两种主流统计指标进行改进。为了区分词汇位置对文档内容的影响,分别对不同位置的候选词设置不同的权重。最后设计并实现一个统计与规则相结合的科技术语自动抽取系统,通过位置权重、C-value、TF-IDF指标的联合计算来识别术语,提高抽取的准确率。
展开更多
关键词
术语
抽取
多词术语识别
加权TF-IDF
C-value计算
原文传递
题名
上下文分析与统计特征相结合的英文术语抽取研究
被引量:
1
1
作者
许德山
张智雄
王峰
邢美凤
机构
中国科学院国家科学图书馆
中国科学院研究生院
中北大学电子测试技术国家重点实验室
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第12期28-33,共6页
基金
“十一五”科技支撑计划课题“网络科技信息监测与评价”(项目编号:2006BAH03B05)的研究成果之一
文摘
介绍术语的基本特征,探讨科技术语的自动识别方法,并结合文本特征对TF-IDF和C-value两种主流统计指标进行改进。为了区分词汇位置对文档内容的影响,分别对不同位置的候选词设置不同的权重。最后设计并实现一个统计与规则相结合的科技术语自动抽取系统,通过位置权重、C-value、TF-IDF指标的联合计算来识别术语,提高抽取的准确率。
关键词
术语
抽取
多词术语识别
加权TF-IDF
C-value计算
Keywords
Term extraction Multi-word recognition Weighted TF-IDF C-value computing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
上下文分析与统计特征相结合的英文术语抽取研究
许德山
张智雄
王峰
邢美凤
《现代图书情报技术》
CSSCI
北大核心
2010
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部