期刊文献+

基于条件随机场的专利摘要信息抽取研究 被引量:3

Information Extraction of Patent Summary Based on Conditional Random Fields
下载PDF
导出
摘要 专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。 Patent summary is an important data source of inteUigence analysis. However, the characteristics of natural language text make automatic content extraction more difficult. In this paper, we use the testing data provided by NTCIR-8 and the conditional random fields model which is one of the information extraction statistical methods, by extracting and adding effective features, we extract the technology and efficacy information, to provide the machine automatical extraction for technical and efficiency matrix analysis of patent.
出处 《数字图书馆论坛》 2010年第9期7-12,共6页 Digital Library Forum
基金 本文得到国家科技部“十一五”科技支撑计划(项目编号:2006BAH03B05)、中国科学技术信息研究所重点工作项目(项目编号:2009KP01-7-1)、中国科学技术信息研究所2009年度预研基金项目(项目编号:YY-200906)等项目的资助.
关键词 专利摘要 信息抽取 条件随机场 Patent summary, Information extraction, CRFs
  • 相关文献

参考文献7

  • 1李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量:178
  • 2彭爱东.企业专利情报信息研究[D].南京大学,2000.6.
  • 3邓尚民,孙玉伟.信息抽取系统的研究现状[J].现代图书情报技术,2006(3):55-58. 被引量:23
  • 4SETTLESB.Biomedical Named Entity Recognition Using Conditional Random Fields and Rich Feature Sets[C] //Proceedings of the International Joint Workshop on Normal Language Processing in Biomedicine and its Application(NLPBA),Geneva,Switzerland,2004:103-107.
  • 5The 8th NTCIR Workshop[EB/OL].[2010-08-10].http://research.nii.ac.jp/ntcir/ntcir-ws8/ws-en.html.
  • 6postagger.1.0[CP/OL].[2010-08-10].http://www-tsujii.is.S.u-tokyo.ac.jp/~tsuruoka/postagger/.
  • 7snowball[CP/OL].[2010-08-10].http://snowball.tartarus.org/demo.php.

二级参考文献42

  • 1[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
  • 2[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
  • 3[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
  • 4[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
  • 5[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001
  • 6[1]Applet D E,Israel D J.Introduction to Information Extraction Technology. A Tutorial for IJCAI-99,1999
  • 7[2]Gaizauskas R,Wilks Y.Information Extraction:Beyond Document Retrieval[J].Journal of Documentation, 1997
  • 8[3]Sager N.Natural Language Information Processing. Reading,Massachusetts:Addison Wesley, 1981
  • 9[4]Dejong G.An Overview of the FRUMP System[C].In:LEHNERT W,RINGLE M h eds. Strategies for Natural Language Processing,Lawrence Erlbaum, 1982:149~176
  • 10[5]Grishman R,Sundheim B.Message Understanding Conference-6:A Brief History[C].In :Proceedings of the 16h International Conference on Computational Linguistics(COLING-96),1996-08

共引文献194

同被引文献32

引证文献3

二级引证文献20

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部