-
题名基于文本挖掘的专利技术主题分析研究综述
被引量:42
- 1
-
-
作者
胡阿沛
张静
雷孝平
张晓宇
-
机构
中国科学技术信息研究所北京
-
出处
《情报杂志》
CSSCI
北大核心
2013年第12期88-92,61,共6页
-
文摘
为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括主题词词频分析、共词分析、文本聚类分析和与引文聚类结合的分析方法,总结其常用的分析工具并介绍新的科学图谱分析软件——SciMAT。最后总结基于文本挖掘的专利技术主题分析方法的优点与不足,为其将来的研究提供建议。
-
关键词
文本挖掘
技术主题
专利分析
词频分析
共词分
析文本聚类
-
Keywords
text mining technical topic patent analysis word frequency analysis co-word analysis text clustering
-
分类号
G353.1
[文化科学—情报学]
-
-
题名基于专利文献的技术演化分析方法评述
被引量:16
- 2
-
-
作者
胡阿沛
张静
张晓宇
-
机构
中国科学技术信息研究所
-
出处
《现代情报》
CSSCI
2013年第10期172-176,共5页
-
文摘
技术演化分析是专利分析的重要内容之一,为国家科技规划、企业研发战略提供决策支持。首先总结了技术演化分析方法的现状,根据分析对象将其大致分为3类:基于专利分类号的技术演化分析、基于专利引用关系的技术演化分析和基于专利文本内容的技术演化分析。接着分析了各种方法的优缺点,在此基础上提出专利文本与引文结合的技术演化分析的观点,并进行了可行性探讨。最后就专利文本与引文结合的技术演化分析方法的研究思路提出建议。
-
关键词
技术演化
专利文本挖掘
专利引文分析
专利分析
-
Keywords
technological evolution
patent text mining
patent citation analysis
patent analysis
-
分类号
G250.2
[文化科学—图书馆学]
-
-
题名共词网络分析中E指数的改进研究
被引量:7
- 3
-
-
作者
胡阿沛
张静
张晓宇
-
机构
中国科学技术信息研究所
-
出处
《情报理论与实践》
CSSCI
北大核心
2014年第1期46-50,共5页
-
文摘
选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E指数较低权值。采用该方法无需选择高频词,可直接对所有词进行共词网络分析。为验证该方法的有效性,以电动汽车动力电池专利文献为数据源进行实证对比研究。
-
关键词
共词分析
E指数
共词网络
-
Keywords
co-word analysis
E-index
co-word network
-
分类号
G350
[文化科学—情报学]
-
-
题名生物燃料电池技术专利计量分析
被引量:2
- 4
-
-
作者
胡阿沛
张静
雷孝平
张晓宇
-
机构
中国科学技术信息研究所
-
出处
《全球科技经济瞭望》
2013年第8期51-58,共8页
-
文摘
专利文献是科学技术的宝库,它能够反映科学技术的发展动态。以德温特专利数据库收录的生物燃料电池相关专利为分析对象,从时间、技术领域、国家和主要专利权人的角度对其进行专利计量分析,并利用社会网络分析软件Ucinet绘制合作网络图,对生物燃料电池专利的合作研发情况进一步分析,以为政府和科研机构以及企业制定生物燃料电池科技发展计划、研发计划、寻找合作伙伴、了解竞争格局以及把握产业发展趋势提供对策建议。
-
关键词
生物燃料电池
专利计量
专利分析
合作网络
德温特创新索引
-
Keywords
biofuel cell
patent bibliometrics
patent analysis
collaboration network
Derwent InnovationIndex
-
分类号
TM911.45
[电气工程—电力电子与电力传动]
-
-
题名基于改进C-value方法的中文术语抽取
被引量:23
- 5
-
-
作者
胡阿沛
张静
刘俊丽
-
机构
中国科学技术信息研究所
-
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第2期24-29,共6页
-
文摘
提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进C-value方法得到IC-value方法,并用来计算候选术语的术语度。以1 000篇乙型肝炎相关论文摘要进行实证研究,结果证明IC-value方法在准确率和召回率方面都要优于C-value、TF-IDF和V-value,有较强的长术语发现能力,且识别破碎子串的效果十分明显。
-
关键词
术语抽取
串频统计
语言规则
术语度
-
Keywords
Term extraction Statistics of string frequency Linguistical rules Termhood
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于人人网的社交网站信息组织研究
被引量:1
- 6
-
-
作者
胡阿沛
-
机构
中国科学技术信息研究所
-
出处
《图书情报工作》
CSSCI
北大核心
2013年第S2期249-251,243,共4页
-
文摘
认为社交网站已成为当今互联网的新星,社交网站信息组织在一定程度上影响到其用户进行网络社交的效率。分析社交网站信息资源的特点;以人人网站为例,分析其信息组织状况、信息组织优点,并着重分析信息组织存在的不足,包括类目设置缺乏规律、部分类名设置不合理;最后,根据提出的问题,给出改进人人网信息组织的建议,如设置类目导航、为类名添加注释等。
-
关键词
人人网
社交网站
信息组织
-
分类号
G201
[文化科学—传播学]
-