对比关系句子生成方法研究

Generating Sentences of Contrast Relationship

导出

摘要【目的】生成两段文本之间具有对比关系的句子,为自动生成对比关系段落文本提供基础模型。【方法】将对比关系句子生成任务看作是由两段文本组成的文本序列到两者之间对比关系文本序列的自动生成,设计一个基于Seq2Seq的深度学习模型,在字符向量的基础上融入对比特征对输入文本进行表示,Encoder层和Decoder都采用BiLSTM结构,同时在模型中引入Attention机制。【结果】在人工标注的查新单及科技论文数据集上展开实验,采用BLEU作为生成效果评价指标,最后评价得分为12.1,比直接使用BiLSTM+Attention的基准模型得分高6.5。【局限】由于人工标注对比关系句子的复杂性,实验所用的数据量有限。【结论】该模型能够生成一定程度上可读并且具有对比关系的句子,可以作为对比关系段落文本生成的基础模型。 [Objective]This paper tries to generate contrastive sentences from two related paragraphs,aiming to establish a new model for creating contrastive paragraphs.[Methods]We generated contrastive sentences automatically from contrastive text sequences.We designed a deep learning model based on Seq2seq,which incorporated contrast features with character vectors to represent texts.Both the Encoder and Decoder layers of our model used BiLSTM structure,which also included attention mechanism.[Results]We examined the proposed model with manually annotated search lists and scientific papers.Then,we adopted BLEU as evaluation index for the results.The final evaluation score was 12.1,which was 6.5 higher than those of the benchmark model using BiLSTM+Attention.[Limitations]Due to the complexity of manually labeling,the data size in our experiments was small.[Conclusions]The proposed model could be used to build new model for generating contrastive paragraphs.

作者焦启航乐小虬 Jiao Qihang;Le Xiaoqiu(National Science Library,Chinese Academy of Sciences,Beijing 100190,China;Department of Library,Information and Archives Management,School of Economics and Management,University of Chinese Academy of Sciences,Beijing 100190,China)

机构地区中国科学院文献情报中心中国科学院大学经济与管理学院图书情报与档案管理系

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第6期43-50,共8页 Data Analysis and Knowledge Discovery

关键词对比关系文本生成文本表征深度学习 Contrast Relationship Text Generation Text Representation Deep Learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1林汝昌,李曼珏.语义的对比关系和对立关系[J].外语教学与研究,1987,19(2):15-21. 被引量：8
2白林楠,胡韧奋,刘智颖.基于句法语义规则系统的比较句自动识别[J].北京大学学报（自然科学版）,2015,51(2):275-281. 被引量：3
3车竞.现代汉语比较句论略[J].湖北师范学院学报（哲学社会科学版）,2005,25(3):60-63. 被引量：23
4魏阳阳.现代汉语三种平比句型的语义认知机制研究[J].理论月刊,2017(12):75-80. 被引量：1
5黄小江,万小军,杨建武,肖建国.汉语比较句识别研究[J].中文信息学报,2008,22(5):30-38. 被引量：16
6吴晨,韦向峰.用户评价中比较句的识别和倾向性分析[J].计算机科学,2016,43(S1):435-439. 被引量：4
7朱茂然,王奕磊,高松,王洪伟,郑丽娟.中文比较关系的识别:基于注意力机制的深度学习模型[J].情报学报,2019,38(6):612-621. 被引量：8

二级参考文献42

1尚平.比较句系统研究综述[J].语言文字应用,2006(S2):77-80. 被引量：12
2刘焱.“比”字句对比较项选择的语义认知基础[J].上海财经大学学报,2004,6(5):76-80. 被引量：5
3石毓智.论社会平均值对语法的影响——汉语“有”的程度表达式产生的原因[J].语言科学,2004,3(6):16-26. 被引量：20
4陈珺,周小兵.比较句语法项目的选取和排序[J].语言教学与研究,2005(2):22-33. 被引量：61
5车竞.现代汉语比较句论略[J].湖北师范学院学报（哲学社会科学版）,2005,25(3):60-63. 被引量：23
6黄德根,王莹莹.基于SVM的组块识别及其错误驱动学习方法[J].中文信息学报,2006,20(6):17-24. 被引量：6
7[8]相原茂.汉语比较句的两种否定形式[M].语言教学与研究.1992.
8[9]徐燕青."不比"型比较句的语义类型[M].语言教学与研究.1996.
9N. JINDAL, B. LIU. Identifying Comparative Sentences in Text Documents [C]//Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM: 2006:244 251.
10N. JINDAL, B. LIU. Mining Comparative Sentences and Relations[C]//Proceedings of the 21st National Conference on Artificial Intelligence (AAAI-06). 2006.

共引文献46

1程勇,徐德宽,董军.基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究[J].中文信息学报,2020(4):101-110. 被引量：11
2陈艾莎.从语义的角度分析学生汉译英练习中的错误[J].外国语文,1995,20(3):88-93. 被引量：2
3马静,张福元.语言的象似性探讨[J].外语教学,2000,21(1):9-13. 被引量：14
4李永平,黄媛媛.形式与语义的不相容性及其修辞特点[J].福建外语,1999(3):27-29. 被引量：1
5盛银花.湖北安陆方言的比较句[J].湖北第二师范学院学报,2010,27(12):40-44. 被引量：1
6刘国辉.近三十年来反义词现象研究思考及非对称性反义词表征考察[J].外语研究,2008,25(3):1-8. 被引量：6
7黄小江,万小军,杨建武,肖建国.汉语比较句识别研究[J].中文信息学报,2008,22(5):30-38. 被引量：16
8宋锐,林鸿飞,常富洋.中文比较句识别及比较关系抽取[J].中文信息学报,2009,23(2):102-107. 被引量：26
9田宇贺.试谈黄廖本《现代汉语》增订四版对语法部分的修改[J].湖北社会科学,2009(5):125-128.
10黄高辉,姚天昉,刘全升.基于CRF算法的汉语比较句识别和关系抽取[J].计算机应用研究,2010,27(6):2061-2064. 被引量：22

1白霞.有章可循有法可遵——浅谈立论文的结构[J].中学语文,2020(18):34-34.
2陈伟民,佘亮,谢超.基于学习地图的培训效果评价指标体系研究[J].中国电力教育,2020(3):26-28. 被引量：1
3张亚.硬膜外麻醉与腰硬联合麻醉在分娩镇痛中的应用比较[J].医药界,2020,0(11):0038-0038.
4沈晚笑.基于AHP的高职英语多模态课堂教学效果评价模型研究[J].文化创新比较研究,2020,0(7):169-170. 被引量：1
5崔晓丽,张子慧.微波疗法治疗妇科盆腔炎的临床分析[J].医药界,2020,0(11):0119-0119.
6吴韬,夏浩志.孤独症谱系障碍儿童家庭喘息服务的研究进展[J].中国全科医学,2020,23(24):2991-2999. 被引量：13
7杨艳丽.基于移动平台饮食运动量化管理对中青年糖尿病患者的影响[J].实用临床护理学电子杂志,2020,5(20):42-42.
8杨磊.中学武术校本课程建设效果评价指标建立与筛选[J].试题与研究（教学论坛）,2020(9):193-193.
9国显达,那日萨,高欢,杨心怡.基于Gaussian LDA的在线评论主题挖掘研究[J].情报学报,2020,39(6):630-639. 被引量：15
10黄远,白琮,李宏凯,张敬林,陈胜勇.基于条件生成对抗网络的图像描述生成方法[J].计算机辅助设计与图形学学报,2020,32(6):911-918. 被引量：14

数据分析与知识发现

2020年第6期

浏览历史

内容加载中请稍等...

对比关系句子生成方法研究

参考文献7

二级参考文献42

共引文献46

相关作者

相关机构

相关主题

浏览历史