期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
“主题词簇”方法研究--英文科技文献主题词清洗、合并与聚类
被引量:
17
1
作者
张嶷
汪雪锋
+1 位作者
朱东华
周潇
《科学学研究》
CSSCI
北大核心
2013年第11期1615-1622,共8页
如何从科技文献数据中获取有效的信息,提升知识发现的能力是当前科学学研究中甚为关注的热点问题。大量相关的分析技术与方法均围绕自然语言处理技术所获取的"主题词"展开。然而,一般情况下,从科技文献数据中获取的主题词数...
如何从科技文献数据中获取有效的信息,提升知识发现的能力是当前科学学研究中甚为关注的热点问题。大量相关的分析技术与方法均围绕自然语言处理技术所获取的"主题词"展开。然而,一般情况下,从科技文献数据中获取的主题词数量庞大,人工清洗几无可能,软件清洗亦缺乏可信度。本文以文献计量学方法为基础,构建了包括停词表、模糊语义处理、关联规则、词频与文档频次转换以及聚类分析在内的半自动化"主题词簇"方法体系,实现了以定量方法为主、定性方法为辅的主题词清洗、合并与聚类方案,旨在为技术竞争情报分析提供更为精准的主题词词表。本文以Derwent专利数据库中国"光伏电池"领域的科技文献为例,展开实证研究,验证了方法的科学性与有效性。
展开更多
关键词
文本分析
文献计量学
文本挖掘
主题词簇
光伏电池
原文传递
基于语法树的SAO结构识别方法研究
被引量:
5
2
作者
杨超
朱东华
+1 位作者
衡晓帆
汪雪锋
《图书情报工作》
CSSCI
北大核心
2016年第21期113-121,共9页
[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO...
[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和"主题词簇"方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系较强,且矩阵稀疏性也得到较好改善,可有效应用于相关文献计量分析。
展开更多
关键词
“主语-行为-宾语”(SAO)识别
语法树
语义分析
共现算法
主题词簇
原文传递
题名
“主题词簇”方法研究--英文科技文献主题词清洗、合并与聚类
被引量:
17
1
作者
张嶷
汪雪锋
朱东华
周潇
机构
北京理工大学管理与经济学院
出处
《科学学研究》
CSSCI
北大核心
2013年第11期1615-1622,共8页
基金
科技部创新方法工作专项(2011IM010500)
科技情报项目(Q172011A001)
文摘
如何从科技文献数据中获取有效的信息,提升知识发现的能力是当前科学学研究中甚为关注的热点问题。大量相关的分析技术与方法均围绕自然语言处理技术所获取的"主题词"展开。然而,一般情况下,从科技文献数据中获取的主题词数量庞大,人工清洗几无可能,软件清洗亦缺乏可信度。本文以文献计量学方法为基础,构建了包括停词表、模糊语义处理、关联规则、词频与文档频次转换以及聚类分析在内的半自动化"主题词簇"方法体系,实现了以定量方法为主、定性方法为辅的主题词清洗、合并与聚类方案,旨在为技术竞争情报分析提供更为精准的主题词词表。本文以Derwent专利数据库中国"光伏电池"领域的科技文献为例,展开实证研究,验证了方法的科学性与有效性。
关键词
文本分析
文献计量学
文本挖掘
主题词簇
光伏电池
Keywords
text analysis
bibliometrics
text Mining
term clumping
photovohaic cell
分类号
G306 [文化科学]
原文传递
题名
基于语法树的SAO结构识别方法研究
被引量:
5
2
作者
杨超
朱东华
衡晓帆
汪雪锋
机构
北京理工大学管理与经济学院
出处
《图书情报工作》
CSSCI
北大核心
2016年第21期113-121,共9页
基金
国家自然科学基金面上项目"基于语义TRIZ的新兴技术创新路径预测研究"(项目编号:71373019)
国家高技术研究发展计划"面向政府管理的大数据智能服务系统及应用示范"(项目编号:2014AA015105)研究成果之一
文摘
[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和"主题词簇"方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系较强,且矩阵稀疏性也得到较好改善,可有效应用于相关文献计量分析。
关键词
“主语-行为-宾语”(SAO)识别
语法树
语义分析
共现算法
主题词簇
Keywords
subject-action-object (SAO) identification
parse tree
semantic analysis
co-word algorithm
termclumping
分类号
G353.1 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
“主题词簇”方法研究--英文科技文献主题词清洗、合并与聚类
张嶷
汪雪锋
朱东华
周潇
《科学学研究》
CSSCI
北大核心
2013
17
原文传递
2
基于语法树的SAO结构识别方法研究
杨超
朱东华
衡晓帆
汪雪锋
《图书情报工作》
CSSCI
北大核心
2016
5
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部