基于文本语义离散度的自动作文评分关键技术研究被引量：14

Research on Key Technology of Automatic Essay Scoring Based on Text Semantic Dispersion

下载PDF

导出

摘要该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。 Based on the existing methods,including LDA model,paragraph vector,word vector text,we extract four kinds of text semantic dispersion representations,and apply them on the automatic essay scoring.This paper gives a vector form of the text semantic dispersion from the statistical point of view and gives a matrix form from the perspective of decentralized text semantic dispersion,experimented on the multiple linear regression,convolution neural network and recurrent neural network.The results showed that,on the test data of 50 essays,after the addition of text semantic dispersion feature,the Root Mean Square Error is reduced by 10.99%and the Pearson correlation coefficient increases 2.7times.

作者王耀华李舟军何跃鹰巢文涵周建设

机构地区北京航空航天大学计算机学院国家计算机网络应急技术处理协调中心首都师范大学成像技术高精尖创新中心

出处《中文信息学报》 CSCD 北大核心 2016年第6期173-181,共9页 Journal of Chinese Information Processing

基金国家自然科学基金(61170189 61370126 61202239 U1636211) 国家863计划(2015AA016004 2014AA015105) 北京成像技术高精尖创新中心项目(BAICIT-2016001)

关键词作文评分语义离散度神经网络 Automatic Essay Scoring semantic dispersion neural network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(5):18-24. 被引量：184

二级参考文献33

1Attali, Y. and Burstein, J. Automated essay scoring with Erater V. 2.0 [ A ]. Paper presented at the Conference of the International Association for Educational Assessment (IAEA), Philadelphia, June 13 - 18, 2004.
2Bachman, L. F. Fundamental considerations in language testing [ M ]. Oxford and New York: Oxford University Press, 1990.
3Blok, H. , and de Glopper, K. 1992. Large scale writing assessment[A]. In L. Verhoeven and J. H. A. L. De Jong (eds.). The construct of language proficiency [ C ]. Amsterdam/Philadelphia: John Benjamins, 1992 : 101 - 111.
4Burstein, J.C. , Kukich, K. , Wolff, S. , Lu, C. , Chodorow, M., Braden-Harder, L. & Harris, M.D. Automated scoring using a hybrid feature identification technique [ A ]. In The Proceedings of the annual meeting of the Association of Computation[ C], 1998a.
5Burstein, J. C. , Kukieh, K. , Wolff, S. E. , Lu, C. , & Chodorow, M. Enriching automated scoring using discourse marking [ A ]. Paper presented at the Workshop on Discourse Relations and Discourse Marking at the annual meeting of the Association, 1998b.
6Burstein, J. , Kukich, K. , Braden-Harder, L. , Chodorow, M. , Hua, S. & Kaplan, B. Computer analysis of essay content for automatic score prediction: A prototype automated scoring system for GMAT analytical writing assessment[ R]. (Research Report RR-98-15). Princeton, NJ: Educational Testing Service, 1998c.
7Burstein, J. C., & Marcu, D. , Andreyev, S, & Chodorow, M. Towards automatic classification of discourse elements in essays [ A ]. In Proceedings of the 39th annual meeting of the Association for Computational Linguistics [ C ], France, 2001:90 - 92.
8Chung, G. , & O'Neil, H. Jr. Methodological approaches to online scoring of essays [ R] ( Report No. CSE-TR-461 ). Los Angeles, CA: University of California, Los Angeles, Center for the Study of Evaluation, 1997.
9Cohen, Y. , Ben-Simon, A. & Hovav, M. The effect of specific language features on the complexity of systems for automated essay scoring [ C ]. Paper presented at the IAEA 29th Annual Conference. Manchester, UK,2003.
10Daigon, A. Computer grading of English composition [ J ]. English Journal 55.1, 1966:46 - 52.

共引文献183

1吴艳华.英语写作智能评阅系统对比研究——以iWrite和批改网为例[J].校园英语,2020(40):69-70. 被引量：2
2耿娟娟.在线英语写作评价反馈的有效性研究[J].校园英语,2020(34):24-25. 被引量：1
3赵霞.在线评阅反馈对大学英语写作教学的反拨效应[J].新东方英语（中英文版）,2019(2):16-16.
4周风燕.iwrite英语写作教学与评阅系统2.0在教学中的运用[J].才智,2019,0(30):24-25. 被引量：2
5吴迪.近十年国内英语测试研究述评[J].大连理工大学学报（社会科学版）,2009,30(4):119-123. 被引量：3
6文秋芳,秦颖,江进林.英语考试翻译自动评分中双语对齐技术的应用[J].外语电化教学,2009(1):3-8. 被引量：23
7陈红.校本大学英语写作教研辅助平台的设计构想及理论基础[J].外语界,2009(1):78-85. 被引量：11
8葛诗利,陈潇潇.大学英语作文自动评分研究中的问题及对策[J].山东外语教学,2009(3):21-26. 被引量：42
9孟凡娜,辜向东.简短问答题计算机辅助评分系统的设计与实验[J].外语电化教学,2010(1):37-41.
10谢贤春.英语作文自动评分及其效度、信度与可操作性探讨[J].江西师范大学学报（哲学社会科学版）,2010,43(2):136-140. 被引量：13

同被引文献84

1曹犟,邬晓钧,夏云庆,郑方.基于拼音索引的中文模糊匹配算法[J].清华大学学报（自然科学版）,2009(S1):1328-1332. 被引量：14
2严可,胡国平,魏思,戴礼荣,李萌涛,杨晓果,冯国栋.面向大规模英语口语机考的复述题自动评分技术[J].清华大学学报（自然科学版）,2009(S1):1356-1362. 被引量：18
3张文忠,吴旭东.第二语言口语流利性发展定量研究[J].现代外语,2001,24(4):341-351. 被引量：172
4任春艳.HSK作文评分客观化探讨[J].汉语学习,2004(6):58-67. 被引量：17
5索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
6龙翀,庄丽,朱小燕,黄开竹,孙俊,堀田悦伸,直井聡.手写中文地址识别后处理方法的研究[J].中文信息学报,2006,20(6):69-74. 被引量：6
7梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(5):18-24. 被引量：184
8冯胜利,王洁,黄梅.汉语书面语体庄雅度的自动测量[J].语言科学,2008,7(2):113-126. 被引量：45
9阎红灿,张淑芬,谷建涛,阎少宏.基于音码相似度的拼音模糊查询算法[J].计算机与现代化,2008(8):18-20. 被引量：4
10陈潇潇,葛诗利.自动作文评分研究综述[J].解放军外国语学院学报,2008,31(5):78-83. 被引量：66

引证文献14

1刘磊,梁茂成.英语学习者书面语法错误自动检测研究综述[J].中文信息学报,2018,32(1):1-8. 被引量：7
2夏林中,罗德安,张春晓,张卫丰.英语自动作文评分系统实现路径探析[J].深圳信息职业技术学院学报,2018,16(2):18-23. 被引量：1
3宁凌.一种基于深度学习的PDM文档自动审核算法[J].计算机与网络,2018,44(10):57-58. 被引量：1
4祁俊辉,龙华,赖华,毕丹宏.基于字形编码与拼音编码的近似商标辨识算法研究[J].软件导刊,2018,17(6):77-80. 被引量：1
5吴恩慈,田俊华.汉语作文自动评价及其关键技术——来自作文自动评价(AEE)的经验[J].教育测量与评价,2019,0(8):45-54. 被引量：4
6董泽东,孙新杰,胡洋.基于机器学习的英语分层在线考试系统设计与实现[J].科技风,2019,0(32):78-79. 被引量：3
7吕欣,程雨夏.基于语义相似度与XGBoost算法的英语作文智能评价框架研究[J].浙江大学学报（理学版）,2020,47(3):329-336. 被引量：10
8孙李丽,郭琳,文旭,王正良.一种BP神经机器英语翻译自动化评判系统的设计[J].信息技术,2020,44(8):12-16. 被引量：7
9李心广,陈帅,龙晓岚.一种面向句子的汉英口语翻译自动评分方法[J].中文信息学报,2021,35(7):54-62. 被引量：2
10Shuai Yuan,Tingting He,Huan Huang,Rui Hou,Meng Wang.Automated Chinese Essay Scoring Based on Deep Learning[J].Computers, Materials & Continua,2020(10):817-833.

二级引证文献41

1吴汉东,李安.网络版权治理的算法技术与算法规则[J].网络法律评论,2020,20(1):78-101. 被引量：8
2黄逸凡.基于云服务的计算机在线考试系统设计研究[J].湖南工业职业技术学院学报,2022,22(2):6-8. 被引量：4
3王洁,钱泳伊,王苏丽,韦梦琦.机器翻译对英专人才培养的影响及对策[J].电脑知识与技术,2018,14(10X):106-108. 被引量：2
4邵霞,刘俊.基于DHNN的翻译质量熵权TOPSIS评价[J].信息技术,2021,45(2):13-19. 被引量：4
5色差甲,慈祯嘉措,才让加,华果才让.基于神经网络的藏文正字检错法[J].中文信息学报,2020,34(12):48-53. 被引量：2
6刘振华,苏立伟,苏华权.自然语言处理技术下电网敏感客户画像多特征提取方法[J].电网与清洁能源,2021,37(6):60-67. 被引量：7
7张启东.试卷设计的聚类算法[J].电子技术与软件工程,2021(12):164-165.
8杨丽萍,辛涛.人工智能辅助能力测量:写作自动化评分研究的核心问题[J].现代远程教育研究,2021,33(4):51-62. 被引量：6
9胡荣.基于动态抽题算法的智能组卷系统设计[J].信息与电脑,2021,33(12):42-44. 被引量：2
10张梦娟.英语语言文学中模糊语义的翻译策略探讨[J].海外英语,2021(15):282-283.

1陆军,梁颖红,陆玉清,李斌,姚建民.多分类器融合技术在自动作文评分中的应用[J].微电子学与计算机,2009,26(10):69-73. 被引量：3
2郭亚琴,王正群.基于类内类间离散度的分类器设计方法[J].信息技术,2010,34(5):35-37. 被引量：5
3葛诗利,陈潇潇.文本聚类在大学英语作文自动评分中应用[J].计算机工程与应用,2009,45(6):145-148. 被引量：10
4王鑫,李晓佳,吴飞,龚钿选.基于边缘灰度相关性分析规则破碎纸条复原[J].未来英才,2016,0(4):2-2.
5郝敬宏.走进网上阅卷系统了解高考作文评分[J].学语文,2005(6):28-29. 被引量：1
6刘卫忠,余力.基于链语法的英语作文自动评分研究[J].电脑知识与技术（过刊）,2014,20(1X):284-287. 被引量：1
7张梅,印勇.英语作文计算机评分技术综述[J].外语电化教学,2010(6):44-47. 被引量：9
8柯育强.大学英语作文自动评分系统中文本聚类的应用[J].电子技术与软件工程,2017(5):205-205. 被引量：1
9黄志娥,谢佳莉,荀恩东.HSK自动作文评分的特征选取研究[J].计算机工程与应用,2014,50(6):118-122. 被引量：17
10蔡伟,娄庆华.高考作文网上阅卷评分误差控制研究[J].湖北招生考试,2008,0(24):20-24. 被引量：1

中文信息学报

2016年第6期

浏览历史

内容加载中请稍等...

基于文本语义离散度的自动作文评分关键技术研究被引量：14

参考文献1

二级参考文献33

共引文献183

同被引文献84

引证文献14

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于文本语义离散度的自动作文评分关键技术研究 被引量：14

参考文献1

二级参考文献33

共引文献183

同被引文献84

引证文献14

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于文本语义离散度的自动作文评分关键技术研究被引量：14