基于框架语义标注的自由文本信息抽取研究被引量：2

Free text information extraction based on frame semantic tagging

下载PDF

导出

摘要信息抽取是从自由文本语料库构建数据库,实现信息自动收集的有效途径之一。提出了一种以框架语义标注为基础构建信息抽取规则的信息抽取方法。基于框架语义标注的信息抽取是用统一的方法来指导信息抽取过程。这种方法具有较细的处理粒度,对语义规则性强的领域有一定的普遍适用性。设计了基于框架语义的BAIE(图书内容简介信息抽取)系统,并对图书的内容简介试行信息抽取。抽取结果表明,基于框架语义的信息抽取方式有一定的可行性和适用性。 Information extraction is a main approach for constructing database from free text corpus and for automatic collecting information.Frame semantic tagging is suggested to be the base for rule-building in information extraction.Information extraction based on frame semantic tagging uses a uniform approach to guide the process of information extraction.Processing at a finer granularity level,the method has a universal appeal for information extraction in domains showing strong semantic rules.A system called BAIE （Book Abstract Information Extraction system）,which is based on frame semantic,is designed and used to extract information from book abstract.The result shows that the approach is feasible and has practical promise.

作者牛之贤白鹏洲段富

机构地区太原理工大学计算机与软件学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第25期143-145,151,共4页 Computer Engineering and Applications

基金科技部专题项目(No.2006FY11070903)

关键词信息抽取框架语义抽取规则 information extraction frame semantic extraction rules

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1李向阳,苗壮.自由文本信息抽取技术[J].情报科学,2004,22(7):815-821. 被引量：23
2李向阳,张亚非.基于语义标注的信息抽取[J].解放军理工大学学报（自然科学版）,2004,5(4):39-43. 被引量：12
3Fillmore C J.框架语义学[M].詹卫东,译.北京:商务印书馆,2003.
4李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量：177
5李跃进,赵晶,林鸿飞.基于Internet的军事演习信息抽取系统[J].计算机工程与应用,2006,42(14):214-218. 被引量：6
6Ciravegna F.Adaptive information extraction from text by rule induction and generalisation[D].Department of Computer Science, University of Sheffield.

二级参考文献66

1[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
2[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
3[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
4[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
5[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001
6[1]Applet D E,Israel D J.Introduction to Information Extraction Technology. A Tutorial for IJCAI-99,1999
7[2]Gaizauskas R,Wilks Y.Information Extraction:Beyond Document Retrieval[J].Journal of Documentation, 1997
8[3]Sager N.Natural Language Information Processing. Reading,Massachusetts:Addison Wesley, 1981
9[4]Dejong G.An Overview of the FRUMP System[C].In:LEHNERT W,RINGLE M h eds. Strategies for Natural Language Processing,Lawrence Erlbaum, 1982:149～176
10[5]Grishman R,Sundheim B.Message Understanding Conference-6:A Brief History[C].In :Proceedings of the 16h International Conference on Computational Linguistics(COLING-96),1996-08

共引文献208

1唐坚,刘海燕.作战文书中部队番号的自动识别方法[J].兵器装备工程学报,2020,0(2):143-147. 被引量：1
2沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
3李胜利,李昌清,袁平鹏,刘英书.基于Web的电子期刊元数据信息抽取方法[J].华中科技大学学报（自然科学版）,2007,35(12):13-15. 被引量：7
4王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
5叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
6岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(z2):344-349.
7张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报（农业科学版）,2010,28(2):132-139. 被引量：6
8李万辉,林瑞明,张文德.台湾科技文献信息抽取与检索平台的设计与实现[J].图书馆学研究（应用版）,2010(6):71-75.
9宋远君,赵铭远,马静.基于本体的无人机情报获取与分析系统研究[J].计算机科学,2012,39(S3):215-219. 被引量：1
10李海涛.纯文本文档处理技术的研究与应用[J].现代图书情报技术,2004(10):33-35. 被引量：2

同被引文献11

1金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：79
2王寅.认知语言学的翻译观[J].中国翻译,2005,26(5):15-20. 被引量：402
3程琪龙.语义框架和认知操作[J].外语教学,2007,28(1):1-4. 被引量：28
4刘群李素建.基于《知网》的词汇语义相似度计算[A]..第三届汉语词汇语义学研讨会[c].台北,2002..
5董振东董强.知网[EB／OL].http://www.keenage.com.,2003-07—12.
6ZHANG Hua-ping,Yu Hong-kui,Xiong De-yi,etal. HH MM-based Chinese lexical analyzer ICTCLAS [A]. 41st Annual Meet ing of the Association for Computational Linguistics[C]. Sapporo: [s. n]. 2003.
7王寅.认知翻译学与识解机制[J].英语知识,2013(1):52-57. 被引量：73
8唐燕.湖北外宣翻译与荆楚文化输出研究[J].湖北成人教育学院学报,2014,20(5):107-109. 被引量：2
9屠桂萍,李天贤.框架语义学视角下的概念转换研究——以许渊冲译欧阳修《临江仙》为例[J].大众文艺（学术版）,2019(21):194-196. 被引量：3
10赵雪晴.从框架语义学看《三国演义》中的文化负载词[J].黑河学院学报,2020,11(8):127-130. 被引量：2

引证文献2

1袁璐,王楷娥.面向电子商务的关键信息抽取方法[J].商场现代化,2012(32):98-99.
2邹桢,孙琳,于卓佳,于舒雅,石梦浩.框架语义学视角下荆楚文化翻译研究——以武汉市博物馆翻译文本为例[J].海外英语,2023(4):63-66.

1李向阳,张亚非.基于语义标注的信息抽取[J].解放军理工大学学报（自然科学版）,2004,5(4):39-43. 被引量：12
2李剑波,李小华,董树明,杨科华.一种基于XML的Web信息抽取方法[J].情报杂志,2006,25(8):49-51. 被引量：7
3董旻,方曙.Deep Web信息抽取研究[J].图书情报工作,2007,51(10):25-28. 被引量：5
4刘勇,李良洁.基于汉语框架的语义标注方法[J].科技风,2015(3):224-225.
5刘勇,魏光泽.基于汉语框架的语义标注方法[J].计算机科学,2015,42(S1):98-101.
6林丽.基于新闻语料库的越南语框架语义标注研究[J].中文信息学报,2013,27(6):201-208. 被引量：3
7沈晓卫,李培峰,朱巧明.槽填充中抽取模式的优化方法[J].中文信息学报,2015,29(2):199-206. 被引量：1
8李向阳,苗壮.自由文本信息抽取技术[J].情报科学,2004,22(7):815-821. 被引量：23
9林丽.试析框架语义标注在新闻事件抽取中的应用——以越南语军事新闻为例[J].山西大学学报（自然科学版）,2013,36(4):510-516. 被引量：5
10赵辉,王振夺.基于OpenMP的任务调度与负载均衡技术的分析与研究[J].福建电脑,2013,29(4):16-17.

计算机工程与应用

2008年第25期

浏览历史

内容加载中请稍等...

基于框架语义标注的自由文本信息抽取研究被引量：2

参考文献6

二级参考文献66

共引文献208

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于框架语义标注的自由文本信息抽取研究 被引量：2

参考文献6

二级参考文献66

共引文献208

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于框架语义标注的自由文本信息抽取研究被引量：2