基于条件随机场的专利摘要信息抽取研究被引量：3

Information Extraction of Patent Summary Based on Conditional Random Fields

下载PDF

导出

摘要专利摘要是重要的情报分析数据来源，但其自然语言文本的特征，使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议（NACSIS Test Collections for IR, NTCIR,）提供的英文专利文摘测试语料，采用文本信息抽取统计方法中的条件随机场模型，通过提取并添加有效的特征，有针对性地抽取专利摘要中表示技术和功效内容的信息，为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。 Patent summary is an important data source of inteUigence analysis. However, the characteristics of natural language text make automatic content extraction more difficult. In this paper, we use the testing data provided by NTCIR-8 and the conditional random fields model which is one of the information extraction statistical methods, by extracting and adding effective features, we extract the technology and efficacy information, to provide the machine automatical extraction for technical and efficiency matrix analysis of patent.

作者黄绍杉乔晓东桂婕李鹏

机构地区中国科学技术信息研究所

出处《数字图书馆论坛》 2010年第9期7-12,共6页 Digital Library Forum

基金本文得到国家科技部“十一五”科技支撑计划（项目编号：2006BAH03B05）、中国科学技术信息研究所重点工作项目（项目编号：2009KP01-7-1）、中国科学技术信息研究所2009年度预研基金项目（项目编号：YY-200906）等项目的资助.

关键词专利摘要信息抽取条件随机场 Patent summary, Information extraction, CRFs

分类号 G306 [文化科学]

引文网络
相关文献

参考文献7

1李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量：178
2彭爱东.企业专利情报信息研究[D].南京大学,2000.6.
3邓尚民,孙玉伟.信息抽取系统的研究现状[J].现代图书情报技术,2006(3):55-58. 被引量：23
4SETTLESB.Biomedical Named Entity Recognition Using Conditional Random Fields and Rich Feature Sets[C] //Proceedings of the International Joint Workshop on Normal Language Processing in Biomedicine and its Application(NLPBA),Geneva,Switzerland,2004:103-107.
5The 8th NTCIR Workshop[EB/OL].[2010-08-10].http://research.nii.ac.jp/ntcir/ntcir-ws8/ws-en.html.
6postagger.1.0[CP/OL].[2010-08-10].http://www-tsujii.is.S.u-tokyo.ac.jp/～tsuruoka/postagger/.
7snowball[CP/OL].[2010-08-10].http://snowball.tartarus.org/demo.php.

二级参考文献42

1[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
2[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
3[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
4[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
5[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001
6[1]Applet D E,Israel D J.Introduction to Information Extraction Technology. A Tutorial for IJCAI-99,1999
7[2]Gaizauskas R,Wilks Y.Information Extraction:Beyond Document Retrieval[J].Journal of Documentation, 1997
8[3]Sager N.Natural Language Information Processing. Reading,Massachusetts:Addison Wesley, 1981
9[4]Dejong G.An Overview of the FRUMP System[C].In:LEHNERT W,RINGLE M h eds. Strategies for Natural Language Processing,Lawrence Erlbaum, 1982:149～176
10[5]Grishman R,Sundheim B.Message Understanding Conference-6:A Brief History[C].In :Proceedings of the 16h International Conference on Computational Linguistics(COLING-96),1996-08

共引文献194

1沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
2王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
3叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
4岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(z2):344-349.
5张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报（农业科学版）,2010,28(2):132-139. 被引量：6
6李万辉,林瑞明,张文德.台湾科技文献信息抽取与检索平台的设计与实现[J].图书馆学研究（应用版）,2010(6):71-75.
7宋远君,赵铭远,马静.基于本体的无人机情报获取与分析系统研究[J].计算机科学,2012,39(S3):215-219. 被引量：1
8江朝晖,张相华,林俊如,王立荣,冯焕清.基于互联网的交通信息资源自动获取技术研究[J].公路交通科技（应用技术版）,2008,4(8):168-170.
9李海涛.纯文本文档处理技术的研究与应用[J].现代图书情报技术,2004(10):33-35. 被引量：2
10马彦波,张蕾.一种创建事件模式的新方法[J].微机发展,2005,15(1):20-23. 被引量：2

同被引文献32

1葛煦,卢宝华,杨湘华.谈高校科技发展中专利文献的利用[J].技术与创新管理,2005,26(1):68-70. 被引量：6
2方曙,张娴,肖国华.专利情报分析方法及应用研究[J].图书情报知识,2007,24(4):64-69. 被引量：111
3赖院根,朱东华,胡望斌.基于专利情报分析的高技术企业专利战略构建[J].科研管理,2007,28(5):156-162. 被引量：37
4王昊,邓三鸿.HMM和CRFs在信息抽取应用中的比较研究[J].现代图书情报技术,2007(12):57-63. 被引量：12
5贾志琦,邵曰剑.有效利用专利文献提高企业技术创新能力[J].山西科技,2008(1):91-93. 被引量：12
6王昊,刘建华,苏新宁,杨建林.面向语义网的本体学习技术和系统研究[J].现代图书情报技术,2009(1):64-72. 被引量：1
7王昊,苏新宁.基于CRFs的角色标注人名识别模型在网络舆情分析中的应用[J].情报学报,2009,28(1):88-96. 被引量：13
8赵学武,田振国.维信诺专利申请态势及其布局分析[J].电子知识产权,2010(1):83-88. 被引量：3
9何径舟,王厚峰.基于特征选择和最大熵模型的汉语词义消歧[J].软件学报,2010,21(6):1287-1295. 被引量：37
10李鹏,桂婕,乔晓东,张兆锋.条件随机场与规则集成的专利摘要信息抽取[J].数字图书馆论坛,2010(9):2-6. 被引量：3

引证文献3

1王密平,王昊,邓三鸿,吴志祥.基于CRFs的冶金领域中文专利术语抽取研究[J].现代图书情报技术,2016(6):28-36. 被引量：13
2张兆锋,贺德方.专利技术功效图智能构建研究进展[J].情报理论与实践,2017,40(1):139-144. 被引量：6
3张静.专利分析报告内容要素标引质量控制机制研究[J].现代情报,2017,37(5):33-36. 被引量：1

二级引证文献20

1王雪颖,王昊,张紫玄.中文专利文献中连续符号串的语义识别[J].数据分析与知识发现,2018,2(5):11-22. 被引量：1
2邱洪华,李程博.中国银行业商业方法技术创新的策略与路径:基于专利技术/功效的分析[J].创新,2018,12(3):83-95. 被引量：4
3俞琰,赵乃瑄.基于通用词与术语部件的专利术语抽取[J].情报学报,2018,37(7):742-752. 被引量：14
4唐慧慧,王昊,张紫玄,王雪颖.基于汉字标注的中文历史事件名抽取研究[J].数据分析与知识发现,2018,2(7):89-100. 被引量：8
5王健,殷旭,吕学强,徐丽萍.基于CRFs的专利文献领域术语抽取方法[J].计算机工程与设计,2019,40(1):279-284. 被引量：11
6马建红,张亚梅,姚爽,张炳斐,郭昌宏.基于BLSTM＿attention＿CRF模型的新能源汽车领域术语抽取[J].计算机应用研究,2019,36(5):1385-1389. 被引量：16
7陈梅婕,谢振平,陈晓琪,许鹏.专利新词发现的双向聚合度特征提取新方法[J].计算机应用,2020,40(3):631-637. 被引量：6
8翟东升,张京先,胡等金.基于SAO结构和词向量的专利技术功效图自动构建研究[J].情报理论与实践,2020,43(3):116-123. 被引量：17
9余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：16
10李建,靖富营,刘军.基于改进BERT算法的专利实体抽取研究——以石墨烯为例[J].电子科技大学学报,2020,49(6):883-890. 被引量：11

1专利摘要[J].铸造,2011,60(8):827-828.
2杨守廉.专利文献及其检索简介[J].情报杂志,1985,4(2):49-56.
3周昌农,倪雅芬.专利文献及其网上浏览[J].上海电力学院学报,2000,16(2):87-92. 被引量：1
4费一楠.浅谈专利摘要中有益效果的翻译技巧[J].中国发明与专利,2013(9):72-74. 被引量：3
5黄水清,王东波,何琳.基于先秦语料库的古汉语地名自动识别模型构建研究[J].图书情报工作,2015,59(12):135-140. 被引量：41
6张俊林,黄瑞红,孙乐.亚洲语言信息检索评测会议NTCIR介绍[J].数字图书馆论坛,2006(9):20-25. 被引量：2
7逯万辉,马建霞.基于CRFs的领域爆发词识别的研究与实现[J].情报科学,2014,32(1):89-93. 被引量：11
8田润丰.朝阳县档案馆通过国家二级档案馆评审[J].兰台世界（上旬）,2010(12):64-64.
9师朝阳.中国专利摘要改写中“有益效果”问题的研讨[J].专利文献研究,2007(2):9-13. 被引量：1
10闫海新.中日两国高等教育文献保障系统之比较研究[J].图书馆理论与实践,2002(1):29-30. 被引量：2

数字图书馆论坛

2010年第9期

浏览历史

内容加载中请稍等...

基于条件随机场的专利摘要信息抽取研究被引量：3

参考文献7

二级参考文献42

共引文献194

同被引文献32

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的专利摘要信息抽取研究 被引量：3

参考文献7

二级参考文献42

共引文献194

同被引文献32

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的专利摘要信息抽取研究被引量：3