基于信息单元融合的新闻原子事件抽取被引量：4

Atomic Event Extraction Based on Information Unit Fusion

导出

摘要原子事件抽取是将非结构化文本进行结构化表示的重要方法.针对新闻语料,本文提出了一种基于信息单元融合的原子事件抽取方法.在中文分词、词性标注、命名实体识别等自然语言处理技术的基础上,利用语言规则将信息单元标识出来并进行融合,达到浅层句法分析的效果,通过原子事件抽取算法将原子事件从经信息单元融合后的语料中抽取出来.基于信息单元融合的原子事件抽取方法不仅对文本长度没有严格限制,并且不受事件类型的约束;实验结果表明,基于信息单元融合的原子事件抽取方法是有效的. Atomic event extraction is an important means to represent the unstructured text structurally. This paper proposes an information basic unit fusion approach to extract atomic event from the news. On the basis of Chinese word segmentation,part of speech tagging and named entity recognition,information basic units can be marked and fused according to linguistic rules. And then,the atomic events can be extracted from information basic unit fused texts by the atomic event extraction algorithm. This approach does not restrict the length of texts and the types of atomic events. The experiment results demonstrate the effectiveness and feasibility of the atomic event extraction approach based on information unit fusion.

作者张贺刘茂福胡慧君顾进广

机构地区武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2015年第2期139-144,共6页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金(61100133 61173062) 国家社会科学基金重大项目(11&ZD189)

关键词信息单元融合原子事件事件抽取 information unit fusion atomic event event extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
2王萌,李春贵,徐超,何婷婷.主题与子事件发现的多文档自动文摘[J].计算机工程与应用,2011,47(18):130-134. 被引量：1
3Hakkani-Tur D, Ji H, Grishman R. Using Informa- tion Extraction to Improve Cross-lingual Document Re trieval[DB/OL]. [2014-03-05]. http://wze,w, lattice. cnrs. fr/poibeau ramies Proceedings_ MMIES2007. pd f g page-- 24.
4肖升,何炎祥.基于动词论元结构的中文事件抽取方法[J].计算机科学,2012,39(5):161-164. 被引量：11
5侯立斌,李培峰,朱巧明,钱培德.基于跨事件理论的缺失事件角色填充研究[J].计算机科学,2012,39(7):200-204. 被引量：5
6Gupta P, Ji H. Predicting Unknown Time Arguments based on Cross-Event Propagation[DB/OL]. [-2014 05 06 . http://cs, nyu. edu/ 7Ehengji/time, pdf.
7Llorens H, Saquete E, Navarro-Colorado B. TimeM1. events recognition and classification learning CRF models with semantic roles[DB/OL]. [2014 03-06]. http ://aclweb. org/anthologynew/C/ClO/C10 1082. pdf.
8Ahn D. The Stages of Event Extraction [DB/OL]. [2014-04-02]. http ://dare. uva. nl/record/221799.
9许红磊,陈锦秀,周昌乐,林如琦,杨肖方.自动识别事件类别的中文事件抽取技术研究[J].心智与计算,2010,0(1):34-44. 被引量：15
10许旭阳,李弼程,张先飞,韩永峰.基于事件实例驱动的新闻文本事件抽取[J].计算机科学,2011,38(8):232-235. 被引量：12

二级参考文献63

1顾阳.论元结构理论介绍[J].当代语言学,1994(1):1-11. 被引量：112
2姜吉发.一种跨语句汉语事件信息抽取方法[J].计算机工程,2005,31(2):27-29. 被引量：12
3姜吉发.一种事件信息抽取模式获取方法[J].计算机工程,2005,31(15):96-98. 被引量：27
4袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
5秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
6梁晗,陈群秀,吴平博.基于事件框架的信息抽取系统[J].中文信息学报,2006,20(2):40-46. 被引量：38
7秦兵,刘挺,陈尚林,李生.多文档文摘中句子优化选择方法研究[J].计算机研究与发展,2006,43(6):1129-1134. 被引量：13
8Radcv D R.Experiments in single and multiple documents sum- marization using MEAD[C]//Proceed/ngs of the Document Under- standing Conference,New Orleans,2001.
9Fukumoto F, Suzuki Y.Extracting key paragraph based on topic" and event detection--towards multi-document summarization[C]// Proceedings of NAACL-ANLP 2000 Workshop on Automatic Summarization, 2000 : 31-39.
10Lin C Y, Hovy E.Manual and automatic evaluation of summa- ries[C]//Proceedings of the Workshop on Automatic Summariza- tion, Philadelphia, July, 2002: 45-51.

共引文献126

1许荣华,吴刚,李培峰,朱巧明.基于指代消解的中文事件融合方法[J].计算机应用,2009,29(8):2264-2267. 被引量：3
2付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19
3仲兆满,刘宗田,周文,付剑锋.事件关系表示模型[J].中文信息学报,2009,23(6):56-60. 被引量：23
4许荣华,吴刚,李培峰,朱巧明.基于事件框架的主题事件融合研究[J].计算机应用研究,2009,26(12):4542-4545. 被引量：6
5张先飞,郭志刚,刘嵩,程磊,田雨暄.基于触发词指导的自相似度聚类事件检测[J].计算机科学,2010,37(3):212-214. 被引量：12
6付剑锋,刘宗田,刘炜,单建芳.基于特征加权的事件要素识别[J].计算机科学,2010,37(3):239-241. 被引量：9
7许君宁,董萍,刘怀亮.基于知网的中文事件抽取研究[J].情报杂志,2009,28(B12):150-151. 被引量：2
8吴刚,许荣华,朱巧明,李培峰,钱培德.一种基于角色匹配的事件抽取方法[J].微计算机信息,2010,26(9):187-189. 被引量：3
9石振国,刘宗田,王杰华,冯达盛.事件网络模型与应用研究[J].南通大学学报（自然科学版）,2010,9(3):55-65.
10许旭阳,韩永峰,宋文政.事件抽取技术的回顾与展望[J].信息工程大学学报,2011,12(1):113-118. 被引量：9

同被引文献39

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：123
3唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：136
4赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
5冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):104-110. 被引量：24
6周文,刘宗田,孔庆苹.基于事件的知识处理研究综述[J].计算机科学,2008,35(2):160-162. 被引量：10
7姚天昉,程希文,徐飞玉,汉思·乌思克尔特,王睿.文本意见挖掘综述[J].中文信息学报,2008,22(3):71-80. 被引量：106
8郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,23(5):47-52. 被引量：37
9刘宗田,黄美丽,周文,仲兆满,付剑锋,单建芳,智慧来.面向事件的本体研究[J].计算机科学,2009,36(11):189-192. 被引量：100
10付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19

引证文献4

1刘金硕,李哲,叶馨,陈嘉敏,邓娟.文本情感倾向性分析方法:bfsmPMI-SVM[J].武汉大学学报（理学版）,2017,63(3):259-264. 被引量：3
2廖涛,付维成,方贤进.基于正负加权的中文事件识别研究[J].计算机应用与软件,2019,36(11):175-181. 被引量：2
3黄细凤.基于动态掩蔽注意力机制的事件抽取[J].计算机应用研究,2020,37(7):1964-1968. 被引量：7
4余传明,林虹君,张贞港.基于多任务深度学习的实体和事件联合抽取模型[J].数据分析与知识发现,2022,6(2):117-128. 被引量：9

二级引证文献21

1买买提阿依甫,吾守尔·斯拉木,帕丽旦·木合塔尔,杨文忠.基于LDA与深度神经网络的维吾尔文情感分类[J].计算机仿真,2019,36(10):194-201. 被引量：6
2买买提阿依甫,吾守尔·斯拉木,艾斯卡尔·艾木都拉,杨文忠,帕丽旦·木合塔尔.基于多特征和深度神经网络的维吾尔文情感分类[J].计算机应用研究,2020,37(5):1368-1374. 被引量：2
3廖涛,陈红,方贤进.基于多特征和规则约束的事件时序关系识别[J].阜阳师范大学学报（自然科学版）,2020,37(3):65-71. 被引量：1
4曹高辉,任卫强,丁恒.面向限定域的深度语义事件泛化研究[J].情报学报,2020,39(8):863-871. 被引量：3
5尹浩然,曹金璇,曹鲁喆,王国栋.扩充语义维度的BiGRU-AM突发事件要素识别研究[J].数据分析与知识发现,2020,4(9):91-99. 被引量：2
6高曦文,贾科利,毛鸿欣,张俊华.基于小波变换及异质SVM方法的土壤盐渍化高光谱定量分类研究[J].现代电子技术,2021,44(3):155-161. 被引量：2
7陈红.基于事件时序关系的自动摘要抽取[J].盐城工学院学报（自然科学版）,2021,34(1):31-35.
8张震,谷雨,耿小航,俞海亮.基于预训练模型和特征融合的事件触发词抽取[J].杭州电子科技大学学报（自然科学版）,2021,41(4):40-47. 被引量：4
9廖涛,宋杨,张顺香.基于双维注意力机制的事件要素识别方法[J].安徽理工大学学报（自然科学版）,2021,41(4):25-30.
10胡瑞娟,周会娟,刘海砚,李健.基于深度学习的篇章级事件抽取研究综述[J].计算机工程与应用,2022,58(24):47-60. 被引量：4

1沈斌,朱国良,闫广超.煤矿监控系统中RFID数据处理平台的研究[J].工业控制计算机,2010,23(7):57-58. 被引量：1
2陆晓华,张宇,钱进.基于图数据库的电影知识图谱应用研究[J].现代计算机,2016,22(5):76-83. 被引量：8
3周玉新.命名实体识别研究发展综述[J].科技风,2016(16):99-99. 被引量：1
4卢志翔,蒙丽莉.文本分类中特征项权重算法的改进[J].柳州师专学报,2011,26(4):128-131. 被引量：1
5祝伟华,卢熠,刘斌斌.基于HMM的Web信息抽取算法的研究与应用[J].计算机科学,2010,37(2):203-206. 被引量：12
6魏彩娟.有源RFID系统数据安全[J].信息与电脑（理论版）,2014,0(12):144-145.
7周涛,陆惠玲.基于ECA规则的ACOODB中的事件研究[J].陕西工学院学报,2004,20(2):68-72.
8郑明秀,付春常,杨明根.复杂事件描述语言事件表达式的研究[J].计算机技术与发展,2012,22(7):113-115. 被引量：1
9赵晓南,李战怀,曾雷杰.保证多volume数据一致性的远程复制机制[J].计算机应用研究,2008,25(10):2951-2955. 被引量：1
10董飚.一种基于规则的电子商务系统查询语句的设计与应用[J].内江科技,2016,37(9):57-58.

武汉大学学报（理学版）

2015年第2期

浏览历史

内容加载中请稍等...

基于信息单元融合的新闻原子事件抽取被引量：4

参考文献11

二级参考文献63

共引文献126

同被引文献39

引证文献4

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于信息单元融合的新闻原子事件抽取 被引量：4

参考文献11

二级参考文献63

共引文献126

同被引文献39

引证文献4

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于信息单元融合的新闻原子事件抽取被引量：4