期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于文本挖掘的专利技术主题分析研究综述 被引量:42
1
作者 胡阿沛 张静 +1 位作者 雷孝平 张晓宇 《情报杂志》 CSSCI 北大核心 2013年第12期88-92,61,共6页
为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括... 为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括主题词词频分析、共词分析、文本聚类分析和与引文聚类结合的分析方法,总结其常用的分析工具并介绍新的科学图谱分析软件——SciMAT。最后总结基于文本挖掘的专利技术主题分析方法的优点与不足,为其将来的研究提供建议。 展开更多
关键词 文本挖掘 技术主题 专利分析 词频分析 共词分 析文本聚类
下载PDF
基于专利文献的技术演化分析方法评述 被引量:16
2
作者 胡阿沛 张静 张晓宇 《现代情报》 CSSCI 2013年第10期172-176,共5页
技术演化分析是专利分析的重要内容之一,为国家科技规划、企业研发战略提供决策支持。首先总结了技术演化分析方法的现状,根据分析对象将其大致分为3类:基于专利分类号的技术演化分析、基于专利引用关系的技术演化分析和基于专利文本内... 技术演化分析是专利分析的重要内容之一,为国家科技规划、企业研发战略提供决策支持。首先总结了技术演化分析方法的现状,根据分析对象将其大致分为3类:基于专利分类号的技术演化分析、基于专利引用关系的技术演化分析和基于专利文本内容的技术演化分析。接着分析了各种方法的优缺点,在此基础上提出专利文本与引文结合的技术演化分析的观点,并进行了可行性探讨。最后就专利文本与引文结合的技术演化分析方法的研究思路提出建议。 展开更多
关键词 技术演化 专利文本挖掘 专利引文分析 专利分析
下载PDF
共词网络分析中E指数的改进研究 被引量:7
3
作者 胡阿沛 张静 张晓宇 《情报理论与实践》 CSSCI 北大核心 2014年第1期46-50,共5页
选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E... 选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E指数较低权值。采用该方法无需选择高频词,可直接对所有词进行共词网络分析。为验证该方法的有效性,以电动汽车动力电池专利文献为数据源进行实证对比研究。 展开更多
关键词 共词分析 E指数 共词网络
下载PDF
生物燃料电池技术专利计量分析 被引量:2
4
作者 胡阿沛 张静 +1 位作者 雷孝平 张晓宇 《全球科技经济瞭望》 2013年第8期51-58,共8页
专利文献是科学技术的宝库,它能够反映科学技术的发展动态。以德温特专利数据库收录的生物燃料电池相关专利为分析对象,从时间、技术领域、国家和主要专利权人的角度对其进行专利计量分析,并利用社会网络分析软件Ucinet绘制合作网络图,... 专利文献是科学技术的宝库,它能够反映科学技术的发展动态。以德温特专利数据库收录的生物燃料电池相关专利为分析对象,从时间、技术领域、国家和主要专利权人的角度对其进行专利计量分析,并利用社会网络分析软件Ucinet绘制合作网络图,对生物燃料电池专利的合作研发情况进一步分析,以为政府和科研机构以及企业制定生物燃料电池科技发展计划、研发计划、寻找合作伙伴、了解竞争格局以及把握产业发展趋势提供对策建议。 展开更多
关键词 生物燃料电池 专利计量 专利分析 合作网络 德温特创新索引
下载PDF
基于改进C-value方法的中文术语抽取 被引量:23
5
作者 胡阿沛 张静 刘俊丽 《现代图书情报技术》 CSSCI 北大核心 2013年第2期24-29,共6页
提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进C-value方法得到IC-value... 提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进C-value方法得到IC-value方法,并用来计算候选术语的术语度。以1 000篇乙型肝炎相关论文摘要进行实证研究,结果证明IC-value方法在准确率和召回率方面都要优于C-value、TF-IDF和V-value,有较强的长术语发现能力,且识别破碎子串的效果十分明显。 展开更多
关键词 术语抽取 串频统计 语言规则 术语度
原文传递
基于人人网的社交网站信息组织研究 被引量:1
6
作者 胡阿沛 《图书情报工作》 CSSCI 北大核心 2013年第S2期249-251,243,共4页
认为社交网站已成为当今互联网的新星,社交网站信息组织在一定程度上影响到其用户进行网络社交的效率。分析社交网站信息资源的特点;以人人网站为例,分析其信息组织状况、信息组织优点,并着重分析信息组织存在的不足,包括类目设置缺乏... 认为社交网站已成为当今互联网的新星,社交网站信息组织在一定程度上影响到其用户进行网络社交的效率。分析社交网站信息资源的特点;以人人网站为例,分析其信息组织状况、信息组织优点,并着重分析信息组织存在的不足,包括类目设置缺乏规律、部分类名设置不合理;最后,根据提出的问题,给出改进人人网信息组织的建议,如设置类目导航、为类名添加注释等。 展开更多
关键词 人人网 社交网站 信息组织
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部