-
题名基于中文专利的新技术术语识别研究
被引量:6
- 1
-
-
作者
谷俊
严明
-
机构
南京大学信息管理系
上海宝山钢铁股份有限公司
南京政治学院基础部
-
出处
《情报科学》
CSSCI
北大核心
2013年第2期144-149,共6页
-
文摘
首先利用ICTCLAS分词系统和停用词表抽取文档词元,通过改进的TFIDF模型计算词元权重并筛选出热点词元,再通过词间距测算对热点词元按顺序进行组配,经权重计算和阈值筛选后得到术语集,由专家人工判定识别出有效的新技术术语。最后给出了应用实例并进行分析,验证了方法的有效性。
-
关键词
技术生命周期
术语识别
热点词元
-
Keywords
technology life cycle
term detection
hot elements of terms
-
分类号
G306
[文化科学]
-
-
题名专利文献中新技术术语识别研究
被引量:5
- 2
-
-
作者
谷俊
-
机构
宝山钢铁股份有限公司
-
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第11期53-59,共7页
-
文摘
主要介绍从中文专利文本中识别新技术术语的方法。利用ICTCLAS分词系统和停用词表抽取文档词元,通过改进的TFIDF模型计算词元权重并筛选出热点词元,再通过词间距测算对热点词元按顺序进行组配,经权重计算和阈值筛选后得到术语集,由专家人工判定识别出有效的新技术术语。最后给出应用实例并进行分析,验证该方法的有效性。
-
关键词
技术生命周期
术语识别热点词元
-
Keywords
technology life cycle term detection hot elements of terms
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
G306
[文化科学]
-