科技文献语篇元素自动标注模型研究综述被引量：7

Overview of Science and Technology Literature Discourse Elements Automatic Annotation Model Research

导出

摘要 [目的／意义]为更好地提升科技文献的语义丰富化效果，对国内外科技文献语篇元素标注模型、技术和方法进行调研总结，为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法／过程]利用学术网站搜索和相关数据库搜索引擎，对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研，对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果／结论]科技文献语篇元素标注具有非常重要的实际应用价值，构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。 [Purpose/significance] In order to improve the semantic enrichment effect of scientific and technical literature, this paper summarizes the domestic and foreign scientific and technical literature discourse elements automatic an- model, technologies and methods, and nalysis system. [ Method/process] This paper provides reference for text mining, knowledge extraction and semantic a- used Web Scholar and related database search engine to conduct in-depth reading and related research on references and research reports involving scientific and technical papers annotation, dis- course elements, knowledge extraction, sentence recognition, automatic article classification, etc. and summarized the re-search the main technologies of each module in the framework. [ Result/conclusion ] The annotation of scientific literature discourse elements has very important practical application value. The construction of annotation model needs to take full account of construction thought, annotation field and annotation granularity as well as annotation techniques

作者于改红张智雄马娜 Yu Gaihong;Zhang Zhixiong;Ma Na(University of Chinese academy of sciences,Beijing 100049;National Science Library,Chinese Academy of Sciences,Beijing 100190;Wuhan Library,Chinese Academy of Sciences,Wuhan 430071)

机构地区中国科学院大学中国科学院文献情报中心中国科学院武汉文献情报中心

出处《图书情报工作》 CSSCI 北大核心 2018年第15期132-144,共13页 Library and Information Service

基金中国科学院文献情报能力建设专项项目“基于arXiv数据的物理领域科研论文自动语义标注和索引应用示范”(项目编号:院1657)研究成果之一

关键词科技文献语篇元素标注模型自动标注 scientific and technical literature discourse elements annotation model automatic annotation

分类号 G251 [文化科学—图书馆学]

引文网络
相关文献

参考文献2

1白光祖,何远标,马建霞,刘建华,邹益民.利用小样本量机器学习实现学术文摘结构的自动识别[J].现代图书情报技术,2014(7):34-40. 被引量：9
2钱力,张晓林,王茜.基于科技文献的研究设计指纹描述框架研究[J].大学图书馆学报,2015,33(1):14-20. 被引量：18

二级参考文献42

1霍东云,聂峰光,郭力.利用Medline文摘数据库研究文本分类[J].计算机与应用化学,2007,24(9):1281-1284. 被引量：2
2U.S. National Library of Medicine. Structured Abstracts [EB/OL]. [2014-04-01]. http://www.nlm.nih.gov/bsd/policy/ structured abstracts.html.
3Hirohata K, Okazaki N, Ananiadou S, et al. Identifying Sec- tions in Scientific Abstracts Using Conditional Random Fields [C]. In: Proceedings of the 3rd International Joint Con- ference on Natural Language Processing (IJCNLP'08). 2008: 381-388.
4Teufel S, Siddharthan A, Batchelor C. Towards Discipline- independent Argumentative Zoning: Evidence from Chemis- try and Computational Linguistics [C]. In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing (EMNLP'09). Stroudsburg: Association for Com- putational Linguistics, 2009:1493-1502.
5Mizuta Y, Korhonen A, Mullen T, et al. Zone Analysis in Biology Articles as a Basis for Information Extraction [J]. International Journal of Medical Informatics, 2006, 75(6): 468-487.
6Liakata M, Teufel S, Siddharthan A, et al. Corpora for the Conceptualisation and Zoning of Scientific Papers [C]. In: Proceedings of the 7th International Conference on Language Resources and Evaluation. 2010:2054-2061.
7Ruch P, Boyer C, Chichester C, et al. Using Argumentation to Extract Key Sentences from Biomedical Abstracts [J]. Inter- national Journal of Medical Informatics, 2007, 76(2-3): 195-200.
8McKnight L, Srinivasan P, Categorization of Sentence Types in Medical Abstracts [C]. In: Proceedings of the 17th Annual Symposium of the American Medical Informatics Associa- tion. 2003: 440-444.
9Guo Y, Korhonen A, Liakata M, et al. Identifying the Infor- mation Structure of Scientific Abstracts: An Investigation of Three Different Schemes [C]. In: Proceedings of the 2010 Workshop on Biomedical Natural Language Processing. 2010: 99-107.
10Yamamoto Y, Takagi T. A Sentence Classification System for Multi-document Summarization in the Biomedical Domain [C]. In: Proceedings of the International Workshop on Bio- medical Data Engineering (BMDE'05), 2005: 90-95.

共引文献25

1ZHANG Xiaolin.Disruptive changes and the post-library era: Toward supply-side structure reform of knowledge services[J].Journal of Library Science in China,2018(1):5-20. 被引量：1
2庞娜.认知情报学:大数据背景下情报分析的新机遇[J].情报理论与实践,2018,41(12):55-60. 被引量：13
3刘天祎,步一,赵丹群,黄文彬.自动引文摘要研究述评[J].现代图书情报技术,2016(5):1-8. 被引量：3
4刘凤红,张恬.开放科学背景下新兴学术论文出版类型——研究要素出版[J].中国科技期刊研究,2017,28(2):138-144. 被引量：26
5刘建华,王颖,张智雄,李传席.植物物种多样性语义知识抽取研究[J].数据分析与知识发现,2017,1(1):37-46. 被引量：1
6白光祖,郑玉荣,吴新年,靳军宝,刘秋艳.基于文献知识关联的颠覆性技术预见方法研究与实证[J].情报杂志,2017,36(9):38-44. 被引量：52
7刘玉婷,吴敏华,骆力明.基于加权贝叶斯的小学英语个性化资源推荐[J].现代中小学教育,2017,33(12):53-58. 被引量：1
8张晓林.颠覆性变革与后图书馆时代--推动知识服务的供给侧结构性改革[J].中国图书馆学报,2018,44(1):4-16. 被引量：200
9钱力,张晓林,王茜.科技论文的研究设计指纹自动识别方法构建与实现[J].图书情报工作,2018,62(2):135-143. 被引量：6
10李纲,徐健,余辉,马亚雪.基于被引片段识别的科技文摘综述[J].现代情报,2017,37(9):171-176. 被引量：1

同被引文献140

1马建霞,袁慧,蒋翔.基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究[J].数据分析与知识发现,2020,4(2):78-88. 被引量：8
2张智雄,刘欢,丁良萍,吴朋民,于改红.不同深度学习模型的科技论文摘要语步识别效果对比研究[J].数据分析与知识发现,2019,3(12):1-9. 被引量：23
3李静,亢小玉.科技期刊智慧出版模式的构建路径及实施对策[J].编辑学报,2022,34(5):505-509. 被引量：20
4邱均平.试论科技文献体系的结构[J].图书与情报,1986(3):21-27. 被引量：1
5吴菲菲,李倩,黄鲁成.基于专利SAO结构的技术应用领域识别方法研究[J].科研管理,2014,35(6):1-7. 被引量：27
6黄鲁成,成雨,吴菲菲,苗红,李欣.关于颠覆性技术识别框架的探索[J].科学学研究,2015,33(5):654-664. 被引量：108
7陈幼华,郑巧英.关于电子图书描述元数据方案的思考[J].现代图书情报技术,2004(9):13-14. 被引量：3
8韩永青,郝绍芬,周钉山.基于用户认知心理的网络信息组织思考[J].情报资料工作,2006,27(2):58-60. 被引量：9
9李世玲,李素喜.MODS与MARC、DC之比较研究[J].现代情报,2006,26(6):138-140. 被引量：8
10曾鹏,吴玲达,陈文伟.多Agent战术意图识别的知识组织与问题求解[J].计算机科学,2007,34(7):181-183. 被引量：8

引证文献7

1李永泽.基于论证模型的科学论文论证结构探究[J].图书馆学研究,2020(5):87-93.
2张智雄,刘欢,于改红.构建基于科技文献知识的人工智能引擎[J].农业图书情报学报,2021,33(1):16-29. 被引量：30
3周静虹,夏立新.多维特征融合的STM图书资源标注框架构建研究[J].情报科学,2021,39(8):44-52. 被引量：3
4王颖.学术资源挖掘方法研究综述[J].现代情报,2021,41(12):164-177. 被引量：2
5黄红,陈翀,张婧莹.科技文献内容语义识别研究综述[J].情报学报,2022,41(9):991-1002. 被引量：7
6毕崇武,王冰艳,杨瑞仙,金燕.基于群体认知图式的健康UGC知识标注研究[J].情报理论与实践,2023,46(10):182-191. 被引量：1
7方卿,陈瑞.ChatGPT下科技期刊语义出版的变革[J].图书情报工作,2024,68(18):4-12.

二级引证文献41

1李林,张津鹏,付恩三,刘光伟.煤矿风险隐患评估系统[J].中国安全科学学报,2023,33(S02):1-6.
2白伟华,朱嘉贤,蔡文伟.基于知识关联树的知识协同模型研究及应用[J].智能计算机与应用,2022,12(2):137-142.
3都平平,彭琳.利用平台创新期刊出版服务--预印本平台出版的启示[J].科技与出版,2021(4):11-16. 被引量：10
4杨倩.智能机器人技术在图书馆中的应用历程与展望[J].大学图书馆学报,2021,39(6):30-37. 被引量：16
5白如江,赵梦梦,张玉洁,董坤.科技文献挖掘工具平台与关键技术综述[J].数据与计算发展前沿,2021,3(6):60-80. 被引量：5
6毛进,陈子洋.基于深度学习的科技文献摘要结构功能识别研究[J].农业图书情报学报,2022,34(3):15-27. 被引量：5
7李琳娜,刘志辉,陆泉.2021年第六届知识服务与情报工程学术交流会议纪要[J].图书情报知识,2022,39(2):153-160.
8赵瑞雪,黄永文.我国图书馆学术服务保障平台发展思考[J].数字图书馆论坛,2022(5):10-13. 被引量：1
9徐雷,秦翠玉,李娇.科技文献数据化及组织呈现路径研究[J].中国图书馆学报,2022,48(3):25-42. 被引量：9
10程冰,彭琳,杜杏叶,王景周,李玲.学术期刊同行评议创新实践与启示[J].中国科技期刊研究,2022,33(5):602-609. 被引量：11

1刘昌昊.近十年《语文研究》古汉语词汇研究综述[J].广州广播电视大学学报,2018,18(2):56-60.
2徐娅群.勇者永远在路上记喻荣军与周小倩原创音乐剧之路的砥砺前行[J].中国戏剧,2018,0(3):44-46.
3孙学宁.BIM技术在建筑设计中的应用策略[J].门窗,2018,0(7):148-148.
4刘代志子,汪训昌,臧淼.基于多特征融合的图像自动标注[J].软件工程与应用,2015,4(2):19-25.
5陈娟,朱福喜.结合半监督与主动学习的时间序列PU问题分类[J].计算机工程与应用,2018,54(11):116-121.
6陈鲜珍,陈益新,赵静波.游戏教学在小学数学教学中的应用探讨[J].读与写（上旬）,2018(1):51-51.
7李晓梅.基于新媒体技术进行高职图书馆阅读推广的探索[J].中文科技期刊数据库（全文版）图书情报,2018(7):61-62.
8吴开军,刁佩旋,张薇.景区网站品牌建设研究——以第一批66家5A景区为例[J].湖北工程学院学报,2018,38(2):78-84. 被引量：1
9何伟涛.日本的“代写作业”行业[J].妇女生活（现代家长）,2018,0(7):61-61.
10谢莹,许荣斌.基于Harmonic函数的自动试题标注模型[J].韶关学院学报,2018,39(6):1-6.

图书情报工作

2018年第15期

浏览历史

内容加载中请稍等...

科技文献语篇元素自动标注模型研究综述被引量：7

参考文献2

二级参考文献42

共引文献25

同被引文献140

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

科技文献语篇元素自动标注模型研究综述 被引量：7

参考文献2

二级参考文献42

共引文献25

同被引文献140

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

科技文献语篇元素自动标注模型研究综述被引量：7