数值信息抽取研究进展综述被引量：10

Numerical Information Extraction: A Review of Research

下载PDF

导出

摘要通过对数值信息抽取文献的调研,先从文献类型、学科领域、高频关键词三个方面进行定量分析,从抽取数据源、抽取对象、抽取方法与技术、结果评价和应用等方面对当前数值信息抽取研究进行了梳理和总结。研究发现当前对于数值信息抽取的研究具有五个特点:抽取数据源以新闻语料、Web网页为主,抽取对象以基数类数值信息和数量类数值信息为主,抽取方法以基于规则的方法为主,抽取结果评价指标比较单一,但应用领域较为广泛。图4。表3。参考文献56。 This paper first makes a quantitative analysis on the documents of numerical information extraction from three as- pects： document type, subject area and high frequency keywords. Then the research context is summarized from four aspects： data source type, object for extraction, extraction method and technique, result evaluation and corresponding application. Our findings are as follows： news corpus and web pages are the main data sources; cardinal numbers and quantitative phrases are the main objects for extraction; extraction method and technique are mainly rule-based and the result evaluation indicators are rela- tively simple but have a wide scope for application. 4 figs. 3 tabs. 56 refs.

作者吴超郑彦宁化柏林

机构地区中国科学技术信息研究所北京大学信息管理系

出处《中国图书馆学报》 CSSCI 北大核心 2014年第2期107-119,共13页 Journal of Library Science in China

关键词数值信息数值知识元数值信息抽取命名实体识别 Numerical information. Numeric knowledge element. Numerical information extraction. Named entityrecognition.

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献20

1化柏林,武夷山.多“源”信息需要多“方”融合[J].情报学报,2013,32(3). 被引量：7
2王芳,史海燕.国外Web Archive研究与实践进展[J].中国图书馆学报,2013,39(2):36-45. 被引量：28
3杨少华,林海略,韩燕波.针对模板生成网页的一种数据自动抽取方法(英文)[J].软件学报,2008,19(2):209-223. 被引量：45
4周秀会.知识元搜索引擎:CNKI知识搜索平台[J].现代情报,2007,27(5):220-222. 被引量：18
5林鸿飞,杨志豪,赵晶.中文文本的信息自动抽取和相似检索机制[J].小型微型计算机系统,2007,28(11):2074-2079. 被引量：3
6温有奎,孙明,温浩,焦玉英，武汉.基于Web的情报知识元挖掘与语义集成地图[J].情报学报,2008,27(2):163-168. 被引量：8
7化柏林,武夷山.文献综述,标“新”立“异”[J].情报学报,2013,32(4). 被引量：2
8陈肇雄.SC文法功能体系[J].计算机学报,1992,15(11):801-808. 被引量：23
9高强,游宏梁.基于层叠模型的国防领域命名实体识别研究[J].现代图书情报技术,2012(11):47-52. 被引量：5
10郑彦宁,化柏林.句子级知识抽取在情报学中的应用分析[J].情报理论与实践,2011,34(12):1-4. 被引量：16

二级参考文献354

1许勇,荀恩东,贾爱平,宋柔.基于互连网的术语定义获取系统[J].中文信息学报,2004,18(4):37-43. 被引量：13
2吴扬扬,陈锻生.识别和抽取Web列表中的关系信息[J].计算机科学,2004,31(6):86-88. 被引量：3
3常青.文本挖掘挖掘知识[J].中国计算机用户,2004(24):49-50. 被引量：10
4许勇,宋柔.基于HMM的百科辞典文本中句子的知识点分类[J].计算机工程与应用,2005,41(4):35-37. 被引量：5
5刘植惠.两种新型的情报产品──《超级杂志》和《科学地图册》[J].情报理论与实践,1994,17(6):47-48. 被引量：6
6李湖生.浅谈知识量及其测定[J].情报理论与实践,1995,18(2):3-5. 被引量：8
7陆小辉.简论信息检索的相关性[J].科技文献信息管理,2006,20(1):49-52. 被引量：3
8张榕,宋柔.术语定义提取研究[J].术语标准化与信息技术,2006(1):29-32. 被引量：8
9杨道玲.中文网络信息资源保存问题探讨[J].档案学研究,2006(3):39-42. 被引量：12
10周和玉.科技文献的知识表达及应用研究[J].情报学报,1996,15(6):431-435. 被引量：10

共引文献459

1聂文杰,莫迪,黄邦锐,刘海,郝天永.基于位置特征和句法依存树的可度量数量信息抽取模型[J].计算机系统应用,2022,31(10):279-287.
2王芳,赵洪.数据溯源研究与实践进展[J].情报学进展,2020(1):313-353. 被引量：7
3王芳,纪雪梅,史海燕.数字信息资源的管护、保存与网络归档[J].情报学进展,2014(1):308-349. 被引量：1
4张璐,彭雪莹,陈静.突发公共卫生事件中大学生健康信息搜寻意图研究[J].情报科学,2022,40(10):51-59. 被引量：6
5沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
6王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
7叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
8岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(z2):344-349.
9张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报（农业科学版）,2010,28(2):132-139. 被引量：6
10李万辉,林瑞明,张文德.台湾科技文献信息抽取与检索平台的设计与实现[J].图书馆学研究（应用版）,2010(6):71-75.

同被引文献84

1刘挺,吴岩,王开铸.基于信息抽取和文本生成的自动文摘系统设计[J].情报学报,1997,16(S1):31-36. 被引量：13
2张积玉.学术论文分类初探[J].陕西师大学报（哲学社会科学版）,1993,22(4):104-111. 被引量：4
3庞富祥,贾丽红,张红霞.学术论文的分类及写作[J].太原理工大学高等教育研究,2001,19(1):28-30. 被引量：4
4谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量：49
5刘鲁红,刘力强,胡亚军.信息抽取技术在数字图书馆中的应用研究[J].情报理论与实践,2005,28(3):321-324. 被引量：12
6邓尚民,孙玉伟.信息抽取系统的研究现状[J].现代图书情报技术,2006(3):55-58. 被引量：23
7余丰,朱东华.信息抽取技术在竞争情报研究中的应用[J].情报杂志,2006,25(3):25-26. 被引量：11
8温有奎,温浩,徐端颐,潘龙法.基于知识元的文本知识标引[J].情报学报,2006,25(3):282-288. 被引量：64
9周露阳.论审评学术论文创新因素的指标体系[J].编辑学报,2006,18(1):68-70. 被引量：26
10马费成.情报学的进展与深化[J].情报学报,1996,15(5):337-343. 被引量：79

引证文献10

1杨京,王芳,白如江.基于研究水平的单篇学术论文创新力评价研究——以碳纳米管材料领域为例[J].情报理论与实践,2017,40(9):105-111. 被引量：12
2郭少卿,乐小虬.科技论文中数值指标实际取值识别[J].数据分析与知识发现,2018,2(1):21-28. 被引量：4
3黄容,何杨煜琪,王忠义,李春雅.数字图书馆数值知识元检索系统设计[J].图书情报工作,2018,62(14):125-132. 被引量：10
4张桂平,张宁,白宇.面向问答的数值信息抽取[J].郑州大学学报（理学版）,2018,50(4):21-25. 被引量：3
5胡泽萍,陈红军.大数据时代的企业智库构建研究[J].信息系统工程,2018,31(7):126-128. 被引量：1
6李春杰,马建玲.国内外图情领域信息抽取研究文献计量分析[J].情报科学,2019,37(4):157-164. 被引量：6
7赵洪,王芳.大规模异构的政府统计报表信息抽取与集成融合研究[J].情报学报,2020,39(9):938-948. 被引量：7
8王山.基于OAVU四元组的数值型知识元表示方法与实践[J].现代情报,2022,42(8):20-27. 被引量：1
9袁钺,庞娜,李广建.美国《商业管制清单》中技术指标自动抽取研究[J].数据分析与知识发现,2023,7(1):35-48. 被引量：1
10李春杰,马建玲,主雪梅.数值信息抽取研究概述及应用分析[J].情报科学,2019,37(2):40-45. 被引量：2

二级引证文献46

1聂文杰,莫迪,黄邦锐,刘海,郝天永.基于位置特征和句法依存树的可度量数量信息抽取模型[J].计算机系统应用,2022,31(10):279-287.
2陆伟,罗卓然,李信.科技创新评价研究进展[J].情报学进展,2022(1):158-187. 被引量：2
3李艳,沈卓,陈嘉钰.情报分析的基本问题及研究进展[J].情报学进展,2020(1):120-164. 被引量：3
4王竣平,白宇,蔡东风.采用BI-LSTM-CRF模型的数值信息抽取[J].计算机应用与软件,2019,36(5):138-144. 被引量：8
5黎子辉.面向第三方科技成果评价的图书馆信息服务研究[J].图书馆工作与研究,2019(5):69-74. 被引量：2
6连宇江,冯磊,孙琳,赵军亮,樊长军.基于分类思想的知识自我获取和自我更新技能提升途径研究[J].情报探索,2019,0(9):1-6.
7赵翀,王丽达.基于数据挖掘技术的智能图书馆云检索系统设计[J].现代电子技术,2020,43(2):60-63. 被引量：8
8程树英,杨继红.基于碎片化检索的数字图书馆知识组织与揭示研究[J].中国中医药图书情报杂志,2020,44(2):18-21. 被引量：3
9刘亚静.基于MapReduce的档案信息数据库快速检索系统设计[J].电子设计工程,2020,28(13):45-49. 被引量：5
10翟景华.基于绘画的计算机辅助设计系统研究[J].现代电子技术,2020,43(17):183-186.

1王安萌.我国图书馆创客空间研究进展综述[J].图书馆研究与工作,2016(4):15-18. 被引量：6
2卢宏.近十年来我国图书馆学理论研究进展综述[J].图书馆工作与研究,2013(1):17-22. 被引量：9
3田玉晶.近年来我国数字资源整合研究进展综述[J].江西图书馆学刊,2008,38(4):27-29. 被引量：1
4丁越飞,许春芝,梁绍红.咬定青山不放松——浙江省档案登记备份工作进展综述[J].浙江档案,2012(8):6-9.
5肖自力,李修宇,林申清.全国文献资源调查进展综述[J].图书馆杂志,1989,8(1):14-16. 被引量：3
6张苏,孙君.从CrossFire Gmelin获取数值信息的方法与技巧[J].图书馆学刊,2007,29(4):130-132.
7王边际,江源.从科技论文计量指标看我军的学术影响力[J].信息管理导刊,2001,14(3):22-26.
8崔雷.生物医学文本挖掘:步骤与工具[J].中华医学图书情报杂志,2017,26(3):1-5. 被引量：8
9李麟,朱曼曼,左丽华.2012年国际开放获取实践进展综述[J].图书情报工作,2013,57(20):136-142. 被引量：13
10王杰.我国数字图书馆联盟研究进展综述[J].农业图书情报学刊,2008,20(4):63-65. 被引量：16

中国图书馆学报

2014年第2期

浏览历史

内容加载中请稍等...

数值信息抽取研究进展综述被引量：10

参考文献20

二级参考文献354

共引文献459

同被引文献84

引证文献10

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

数值信息抽取研究进展综述 被引量：10

参考文献20

二级参考文献354

共引文献459

同被引文献84

引证文献10

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

数值信息抽取研究进展综述被引量：10