-
题名基于稀疏分布式表征的英文著者姓名消歧研究
被引量:7
- 1
-
-
作者
翟晓瑞
韩红旗
张运良
李仲
-
机构
中国科学技术信息研究所富媒体数字出版内容组织与知识服务重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第12期3534-3538,共5页
-
基金
国家自然科学基金资助项目(71473237)
中国工程科技知识中心建设项目(CKCEST-2018-1-26)
-
文摘
为将稀疏分布式表征理论应用到著者姓名消歧,了解其在解决姓名消歧问题时的效果,提出了基于稀疏分布式表征的英文文献著者姓名消歧方法。该方法选择论文摘要文本信息作为消歧特征,将其生成二进制表示的SDR码。根据待消歧论文的SDR与同名作者的论文SDR相似度对比来实现著者姓名消歧。最终得到的结果为准确率98. 21%,召回率76. 75%,F值86. 17%,证明提出的消歧方法具有较好的效果。通过将该方法与利用合著者特征进行消歧的方法进行对比,说明该方法能够较好地解决文献著者姓名歧义问题。此外,该方法还可将作者未收录在作者库中的论文识别出来并将其指派给新作者,无须重新学习和更新模型。
-
关键词
姓名消歧
稀疏分布式表征
语义指纹
层级时序记忆模型
-
Keywords
name disambiguation
sparse distributed representation
semantic fingerprint
hierarchical temporal memory
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文本稀疏分布式表征的学术合作推荐
被引量:9
- 2
-
-
作者
李仲
韩红旗
吴广印
翟晓瑞
李琳娜
刘玉博
-
机构
中国科学技术信息研究所
富媒体数字出版内容组织与知识服务重点实验室
北京万方软件股份有限公司
北京物资学院
-
出处
《情报科学》
CSSCI
北大核心
2019年第6期113-118,共6页
-
基金
国家自然科学基金"科学合作网络的不连通问题研究"(71473237)
中国科学技术信息研究所重点工作项目"富媒体知识组织与知识服务关键技术研究"(ZD2019-10)
北京物资学院2019年"实培计划"项目"基于顾客感知价值的经管类期刊感知质量评价研究"资助
-
文摘
【目的/意义】帮助科研工作者了解领域相关科研工作者的研究内容,促进开展进一步的交流合作。【方法/过程】根据稀疏分布式表征理论对作者论文的文本内容进行特征表示,计算作者研究内容相似性,根据得分进行排序推荐。【结果/结论】选取了NIPS会议论文数据集进行了实验,将实验结果与TD-IDF方法和LDA主题模型方法进行对比,证明了稀疏分布式表征是一种能够从语义层面表征对象特征的数据表示方式,能有效用于合作推荐。
-
关键词
合作推荐
稀疏分布式表征
社会网络
相似度
-
Keywords
collaborator recommendation
sparse distributed representation
social network
similarity
-
分类号
G252.8
[文化科学—图书馆学]
G644
[文化科学—高等教育学]
-
-
题名基于SDR表征的英语教材智能消歧技术
- 3
-
-
作者
潘丽鹏
-
机构
咸阳师范学院外国语学院
-
出处
《微型电脑应用》
2021年第8期97-99,122,共4页
-
基金
咸阳师范学院校级科研项目(XSYK20001)
咸阳师范学院青年骨干教师培养项目(XSYGG202004)。
-
文摘
英语教材类文献著者姓名消歧一直是文献搜索领域的重点研究课题,旨在对所需的文献信息进行精确定位。因而基于稀疏分布式表征理论,研究了英语教材类文献著者姓名智能消歧技术。以文献摘要的文字内容为消歧特征,并以其为基础进行二进制SDR码转换。通过比较待消歧文献SDR与重名著者文献SDR的相似度完成文献著者的指派。应用结果表明,这个方法的消歧准确率可达98.21%,查全率为76.75%,F值为86.17%,消歧效果显著。此外,这个方法能够将著者所撰写的尚未录入著者文献库的文献自动归类到库中。
-
关键词
稀疏分布式表征
英语教材
智能消歧
准确率
查全率
-
Keywords
SDR
English textbooks
intelligent disambiguation
accuracy
recall
-
分类号
G250
[文化科学—图书馆学]
-