基于汉英平行语料库的英文显式篇章关系识别被引量：2

English explicit discourse relation recognition on Chinese-English parallel corpus

下载PDF

导出

摘要汉英篇章平行语料库有助于基于篇章的双语研究.构建了汉英平行语料库,对语料中的汉语及其英语对译中的连接词分别进行了标注和关系分类.其中英文连接词比单语语料上的英文连接词定义广泛,更为复杂.在此语料上,抽取词法、句法和位置信息等特征在英文文本上进行显式篇章关系识别.实验采用最大熵分类方法,获得连接词识别正确率92.5%;抽取英文和对应中文连接词作为特征,获得给定连接词关系分类正确率85.6%.研究结果可为今后的中英篇章关系对比识别提供参考. Chinese-English discourse parallel corpus contributes to bilingual discourse research.The Chinese-English discourse Parallel Corpus,which annotates conjunctions and relation classification in Chinese corpus and English corpus was constructed in this paper.In this corpus English conjunction definition is wider than traditional conjunction’s,and is more complicate.On this corpus,the paper extracts lexical,syntactic features and location information to identify and classify the explicit discourse relation in the English text.Experiment adopts with maximum entropy classification method to obtain conjunction recognition accuracy of 92.5%;and extracts English and Chinese conjunction as features to obtain given conjunction classification accuracy of 85.6%.The research provides a reference for contrast recognition of Chinese-English discourse relation for future.

作者冯洪玉李艳翠冯文贺 FENG Hongyu;LI Yancui;FENG Wenhe(School of Information Engineering,Henan Institute of Science and Technology,Xinxiang 453003,China;Guangdong University of Foreign Studies,Guangzhou 510420,China)

机构地区河南科技学院信息工程学院广东外语外贸大学

出处《河南科技学院学报（自然科学版）》 2019年第5期55-62,共8页 Journal of Henan Institute of Science and Technology(Natural Science Edition)

基金国家自然科学基金(61502149) 河南省科技计划项目(182102210048)

关键词显式篇章关系连接词识别分类 explicit discourse relation conjunction recognition classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1周小佩,洪宇,车婷婷,姚建民,朱巧明.一种无指导的隐式篇章关系推理方法研究[J].中文信息学报,2013,27(2):17-25. 被引量：6
2李艳翠,孙静,周国栋,冯文贺.基于清华汉语树库的复句关系词识别与分类研究[J].北京大学学报（自然科学版）,2014,50(1):118-124. 被引量：19
3冯文贺.汉英篇章结构平行语料库的对齐标注研究[J].中文信息学报,2013,27(6):158-164. 被引量：7
4冯文贺,李艳翠,任函,周国栋.汉英篇章结构平行语料库的对齐标注评估[J].中文信息学报,2017,31(3):86-93. 被引量：4
5李艳翠,孙静,周国栋.汉语篇章连接词识别与分类[J].北京大学学报（自然科学版）,2015,51(2):307-314. 被引量：7
6胡金柱,舒江波,姚双云,周星,吴锋文,肖升.面向中文信息处理的复句关系词提取算法研究[J].计算机工程与科学,2009,31(10):90-93. 被引量：22

二级参考文献40

1邢福义.往前又是O起点──《汉语复句研究》自序[J].汉语学习,2000(4):12-13. 被引量：3
2周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
3邢福义.汉语语法学[M].长春:东北师范大学出版社,2000.75-78.
4邹嘉彦,连兴隆,高维君,等.中文篇章中的关联词语及其引导的句子关系的自动标注--面向话语分析的中文篇章语料库的开发[C]//1998中文信息处理国际会议论文集,1998:288-297.
5李晋霞,刘云.面向计算机的二重复句层次划分研究[C]∥语言计算与基于内容的文本处理,2003:147-153.
6柏晓静常宝宝詹卫东.构建大规模的汉英双语平行语料库[C]..见:2002全国机器翻译研讨会文集:机器翻译研究进展[C].,2002.147-154.
7邢福义.汉语复句研究[M].北京:商务印书馆.2002.
8Z Lin, H T Ng, M Y Kan. Automatically Evaluating Text Coherence Using Discourse Relations[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, 2011, Volume 1: 997-1006.
9D Marcu, A Echihabi. An Unsupervised Approach to Recognizing Discourse Relations [C]//Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, 2002: 368-375.
10M Saito, K Yamamoto, S Sekine. Using Phrasal Patterns to Identify Discourse Relations[C]//Proceedings of the Human Language Technology Conference of the NAACL, 2006, Companion Volume:133-136.

共引文献47

1孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
2周俊明,秦哲,李锐龙,李艳翠.汉英主从对齐语料标注平台[J].电信快报,2021(8):41-46.
3胡金柱,吴锋文,李琼,舒江波.汉语复句关系词库的建设及其利用[J].语言科学,2010,9(2):133-142. 被引量：31
4胡金柱,雷利利,杨进才,舒江波,陈江曼.多重复句关系标记搭配的求解模型研究[J].计算机工程与科学,2011,33(11):177-182. 被引量：4
5姚双云,胡金柱,舒江波,沈威.篇章连贯语义关系的自动标注方法[J].计算机工程,2012,38(7):131-133. 被引量：5
6胡金柱,陈江曼,杨进才,舒江波,雷利利.基于规则的连用关系标记的自动标识研究[J].计算机科学,2012,39(7):190-194. 被引量：15
7吴锋文.面向信息处理的汉语复句研究现状及其展望[J].宁夏大学学报（人文社会科学版）,2013,35(4):29-33.
8孙静,李艳翠,周国栋,冯文贺.汉语隐式篇章关系识别[J].北京大学学报（自然科学版）,2014,50(1):111-117. 被引量：15
9李艳翠,孙静,周国栋,冯文贺.基于清华汉语树库的复句关系词识别与分类研究[J].北京大学学报（自然科学版）,2014,50(1):118-124. 被引量：19
10吴锋文.关系标记对汉语复句层次关系识别的影响[J].渭南师范学院学报,2014,29(9):68-73. 被引量：2

同被引文献15

1韩丹,洪汝攀,钟焱军.LSTM深度神经网络在消防力量调度算法中的应用[J].电信快报,2021(5):25-27. 被引量：4
2周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
3金澎,吴云芳,俞士汶.词义标注语料库建设综述[J].中文信息学报,2008,22(3):16-23. 被引量：17
4李艳翠,冯文贺,周国栋,朱坤华.基于逗号的汉语子句识别研究[J].北京大学学报（自然科学版）,2013,49(1):7-14. 被引量：22
5冯文贺.汉英篇章结构平行语料库的对齐标注研究[J].中文信息学报,2013,27(6):158-164. 被引量：7
6张牧宇,秦兵,刘挺.中文篇章级句间语义关系体系及标注[J].中文信息学报,2014,28(2):28-36. 被引量：24
7李艳翠,孙静,周国栋.汉语篇章连接词识别与分类[J].北京大学学报（自然科学版）,2015,51(2):307-314. 被引量：7
8钟书能.话题链在汉英篇章翻译中的统摄作用[J].外语教学理论与实践,2016(1):85-91. 被引量：14
9冯文贺,李艳翠,任函,周国栋.汉英篇章结构平行语料库的对齐标注评估[J].中文信息学报,2017,31(3):86-93. 被引量：4
10张献丽.略论汉英翻译中的衔接性[J].牡丹江大学学报,2017,26(10):146-147. 被引量：2

引证文献2

1周俊明,秦哲,李锐龙,李艳翠.汉英主从对齐语料标注平台[J].电信快报,2021(8):41-46.
2李艳翠,冯继克,来纯晓,冯洪玉,冯文贺.汉英篇章衔接对齐语料库构建研究[J].中文信息学报,2022,36(4):39-47.

1徐昇,王体爽,李培峰,朱巧明.运用多层注意力神经网络识别中文隐式篇章关系[J].中文信息学报,2019,33(8):12-19. 被引量：10
2张莉,胡佳.小班系列活动：向上，向下[J].东方娃娃（保育与教育）,2019,0(10):77-79.
3徐鹏,王冠韬,刘奎,罗斯达.石墨烯/碳纳米管嵌入式纤维传感器对树脂基复合材料原位监测的结构-性能关系对比[J].材料工程,2019,47(9):29-37. 被引量：1
4王召妍.《金瓶梅》篇章修辞之冷热映衬[J].贵州工程应用技术学院学报,2019,37(4):9-14.
5林通,姬艳涛,王犇.我国警察体育研究的基本现状研究——基于Bibexcel的文献计量与可视化分析[J].广州体育学院学报,2019,39(5):59-62. 被引量：1

河南科技学院学报（自然科学版）

2019年第5期

浏览历史

内容加载中请稍等...

基于汉英平行语料库的英文显式篇章关系识别被引量：2

参考文献6

二级参考文献40

共引文献47

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于汉英平行语料库的英文显式篇章关系识别 被引量：2

参考文献6

二级参考文献40

共引文献47

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于汉英平行语料库的英文显式篇章关系识别被引量：2