-
题名科技文献搜索引擎元数据仓储建设实践
被引量:2
- 1
-
-
作者
甘大广
苏学
张正峰
-
机构
北京万方数据股份有限公司
-
出处
《数字图书馆论坛》
2013年第6期39-43,共5页
-
基金
国家高科技发展计划(863计划)“云计算一期”重大专项课题“以科技文献为主的搜索引擎研制”子课题(编号:2011AA01A206)成果之一
-
文摘
文章分析了用户查询行为、行业资源出版模式等变化对数字资源整合的机遇与挑战,重点结合实际工作介绍了科技文献搜索引擎底层元数据仓储的建设过程,包括元数据采集,元数据规范、元数据整合等环节。
-
关键词
元数据仓储
元数据整合
数字资源
-
Keywords
Metadata repository, Metadata integration, Metadata repository
-
分类号
G276
[文化科学—档案学]
-
-
题名知识服务论文的计量分析研究
被引量:2
- 2
-
-
作者
甘大广
吴广印
-
机构
中国科学技术信息研究所
北京万方数据股份有限公司
-
出处
《数字图书馆论坛》
2008年第1期62-66,共5页
-
文摘
分析一段时间内某主题领域文献发表数量,可以了解该专题的研究水平和研究方向。知识服务(Knowledge Service)兴起于21世纪初期国际图书情报界,目前还处于实践探索阶段,理论研究体系也尚待完善。因此,文章对我国知识服务研究领域的期刊论文进行统计分析,并对该研究领域的载文、著者、期刊分布和基金情况等进行分析,以期能够客观真实地反映当前我国知识服务领域的研究状况,把握其研究的发展趋势和走向,并为今后的相关研究提供一些参考。
-
关键词
知识服务
期刊论文
计量分析
-
Keywords
Knowledge Service, Paper of journal, Bibliometrics
-
分类号
G252
[文化科学—图书馆学]
G350
[文化科学—情报学]
-
-
题名基于HTTP协议的OA期刊元数据动态收割研究
被引量:1
- 3
-
-
作者
吴广印
苏学
甘大广
-
机构
中国科学技术信息研究所
北京万方数据股份有限公司
-
出处
《数字图书馆论坛》
2011年第9期43-47,共5页
-
文摘
文章针对基于HTTP协议的OA期刊元数据动态收割提出了解决方案,并以Open J—Gare元数据动态收割为例对解决方案进行了实证研究,以解决基于HTTP协议的OA期刊元数据的动态跟踪维护问题。
-
关键词
OA期刊
元数据收割
信息抽取
-
Keywords
OA journals, Metadata harvesting. Information extraction
-
分类号
G255.2
[文化科学—图书馆学]
-
-
题名我国博士学位论文被引状况计量分析
被引量:14
- 4
-
-
作者
杨奕虹
甘大广
林霄剑
武夷山
-
机构
中国科学技术信息研究所
北京万方软件股份有限公司
-
出处
《情报杂志》
CSSCI
北大核心
2015年第1期100-104,115,共6页
-
基金
国家自然科学基金项目"论文零被引的时间演化规律
影响因素及其应用研究"(编号:71373252)
-
文摘
采用文献计量方法,统计分析了我国45万篇博士学位论文的被引状况,全面了解我国博士学位论文的学术影响力。通过研究,得出以下结论:我国的博士学位论文不到40%被引用,其中将近50%是被硕士作者引用;博士学位论文在答辩通过后的第3年被引次数最高;"医学"博士学位论文在各学科门类中"被引论文"百分比最低,仅为16.77%,"篇均被引次数"也是最低,仅为0.33次;40%的高校的博士论文被引,科研院所的博士论文不足25%被引;通过设立"5年被引频次""5年影响因子""即年指标""他引率""H指数"等7个指标,衡量我国培养博士人数在平均值以上的77所高校的博士论文被引情况,有7所高校在7个指标中进入了5项指标的前20名:吉林大学、华中科技大学、浙江大学、复旦大学、天津大学、华东师范大学和大连理工大学。
-
关键词
博士学位论文
被引统计
文献计量分析
-
Keywords
doctoral dissertations citation statistics bibliometrics analysis
-
分类号
G643
[文化科学—高等教育学]
G35
[文化科学—情报学]
-
-
题名基于知识图谱的技术转移服务平台的研究与实践
- 5
-
-
作者
王灏
张正锋
甘大广
-
机构
北京万方软件有限公司
-
出处
《科学与信息化》
2024年第13期55-58,共4页
-
基金
宁波市科技创新2025重大专项,项目名称:基于知识图谱的技术转移服务平台研发及应用,项目编号:2021Z014。
-
文摘
本文结合技术转移服务机构数字化转型要求,以知识图谱技术重构科技创新资源,设计开发数字化的模型工具和服务平台,实现了企业需求与高校技术研发团队的智能匹配,帮助技术经纪人利用数据分析工具挖掘技术转移线索,缩短企业与专家型人才的对接周期。
-
关键词
技术转移
知识图谱
智能匹配
数智化
赋能
-
Keywords
technology transfer
knowledge graph
intelligent matching
digital intelligence
empower
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名京津冀协同创新现状实证分析
被引量:2
- 6
-
-
作者
张英杰
王成刚
甘大广
-
机构
中国科学技术信息研究所
龙信数据(北京)有限公司
北京万方软件股份有限公司
-
出处
《中国科技资源导刊》
2016年第3期21-32,共12页
-
基金
国家十二五支撑计划项目"面向科技情报分析的信息服务系统研发与应用示范"(2015BAH25F02)
中国博士后基金项目"大数据环境下基于网络演化的领域知识动态剖会研究"(2015M570132)
-
文摘
本文以京津冀三地协同创新为研究对象,通过分析三地科技孵化器、创客空间网站链接网络,三地共同发表科技论文及专利申请情况,三地企业互相投资情况,揭示《京津冀协同发展规划纲要》颁布前后京津冀三地协同创新的演变,分析大科学时代区域内科技资源共享的基本态势,从而服务于北京作为"科技创新中心"战略定位的实施。
-
关键词
京津冀城市圈
协同创新
实证研究
区域创新
科技资源配置
-
Keywords
Beijing Tianjin Hebei city circle, collaborative innovation, empirical research, regional innovation,S&T resources allocation
-
分类号
P967
[天文地球—自然地理学]
-
-
题名《情报学报》的五要素数据挖掘与分析
被引量:2
- 7
-
-
作者
温有奎
吴广印
甘大广
-
机构
北京万方软件有限公司
中国科学技术信息研究所
-
出处
《情报学报》
CSSCI
北大核心
2013年第9期990-999,共10页
-
基金
国家高技术研究发展计划(863计划)的资助,项目编号为:2011AA01A206
-
文摘
本文采用数据挖掘与分析方法考察《情报学报》办刊的主导方向、前沿性、研究热点、引导者、作者群分布。本文的方法基于“知识获取五要素”的理论,数据来源于万方数据库1989~2011年《情报学报》公开发表的文献数据的清洗和处理。研究结果印证了《情报学报》成为中国管理科学领域知识组织与服务的引领期刊。研究发现,学科要素能宏观的反映《情报学报》的主导方向,主题要素能微观的反映《情报学报》研究焦点,基金要素能反映《情报学报》的创新领域,作者要素能反映《情报学报》的引领者,机构要素能反映《情报学报》研究者的类型。
-
关键词
数据挖掘
情报学报
五要素
统计分析
-
Keywords
data mining, "JCSSTI", the five elements, statistical analysis
-
分类号
G239.2
[文化科学]
-
-
题名一种基于论文画像的科技文献数据去重算法
- 8
-
-
作者
白文磊
常丽琼
郭军
刘宝英
甘大广
-
机构
西北大学信息科学与技术学院
西北大学京东人工智能与物联网联合研究院
万方数据有限公司
-
出处
《计算机技术与发展》
2022年第8期148-154,共7页
-
基金
国家重点研发计划项目(2017YFB1400301)。
-
文摘
快速准确地将不同数据库中重复数据过滤清除是构建数据仓库的重要技术之一。在科技文献资源服务领域,传统的数据去重方法主要是利用数据库检索技术,进行字段内容匹配,过滤内容相同的论文数据.然而,分布在不同数据库中的论文,一般有着不同的字段信息和字段类型,即使有相同的字段也会因为字段内容可能存在乱码信息,导致算法鲁棒性不强,这是传统搜索查找匹配方法面临的一个主要挑战。为解决这个问题,借鉴推荐系统中物品画像和人物画像算法的思想,该文提出了一种基于论文画像的科技文献数据去重算法。该算法通过tf-idf技术提取文章摘要中的关键字信息,再将关键字信息通过word2vec转换为词向量,进而计算出论文之间的相似程度并过滤掉重复数据。实验结果表明,在真实的大型论文数据集下,该算法能够有效去除重复信息,auc均值可达到0.98以上。
-
关键词
论文画像
数据清洗
数据去重
词频-逆文档频率
词向量
-
Keywords
paper portrait
data clean
data deduplication
tf-idf
word2vec
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于学术论文的共同研究兴趣人员的推荐
- 9
-
-
作者
张智强
侯爱琴
杜娜娜
甘大广
-
机构
西北大学信息科学与技术学院
北京万方软件股份有限公司
-
出处
《物联网技术》
2021年第8期126-130,共5页
-
基金
国家重点研发计划子课题:分布式资源巨系统及资源协同理论(2017YFB1400301)。
-
文摘
科技资源的智能搜索对提高研究人员的工作效率至关重要。利用学术论文及其引文信息找到与自己研究兴趣相同的研究者,跟踪他们的研究进展,对科研工作开展大有裨益。通过捕捉研究者过去发表的论文,尤其是近几年发表的学术论文,可以发掘其研究兴趣及其变化轨迹,并以档案的形式建立学术背景模型。进一步通过直接信任和间接信任两种方式建立用户研究兴趣关系网,以便极大可能地推荐共同研究兴趣人员。通过在AMiner数据集及万方数据的实验结果发现,无论该研究人员兴趣是否转变,利用最近5年的论文列表建立起的用户研究兴趣关系网,直接信任与间接信任均可以为用户推荐相似度较高的研究人员。另外,通过间接信任方式不仅为该研究者找出相似度较高的研究人员,而且能够极大可能地扩展推荐列表,找出更多相似兴趣的研究人员。
-
关键词
信息检索
推荐系统
共同研究兴趣
用户建模
混合推荐
信任度关系
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-