摘要
作为儿童读物分级研究的重要组成部分,易读性分析旨在对文本的阅读难度进行自动判定,从而为分级阅读提供量化的评测依据,帮助教师和家长为学习者选择合适的阅读材料。随着智能信息处理技术的发展,利用机器学习算法对文本的易读性进行自动分析和判别已经成为当前研究热点。以苏教版、人教版、北师大版小学《语文》教材为基础构建语料库,将年级作为难度等级指标,从文字、词汇、句子、篇章四个层面考察了48项影响文本难易度的语言因素与难度等级之间的相关性,采用多元线性回归模型,构建了易读性公式,并利用亲近母语分级阅读书目,对公式的评估效果进行验证。结果发现,易读性公式的总体准确率较高,但针对高年级文本难度预测正确率较低,对此提出了客观分析与主观分析结合、文本认知因素与情感认知因素相结合等改进意见。最后,从语料库构建、预测模型优化、数字阅读平台建设等方面阐述了研究启示。
作者
王萌
柴昭甲
张倩倩
刘钊昊
Wang Meng;Chai ZhaoJia;Zhang QianQian;Liu ZhaoHao
出处
《上海教育科研》
北大核心
2024年第1期71-76,共6页
Journal of Shanghai Educational Research
基金
教育部人文社会科学研究项目“通向心理健康的文本情绪识别研究”(编号:21YJA740037)
中央引导地方科技发展资金项目“福建省心理健康人机交互技术研究中心”(编号:2020L3024)
2023年江苏省研究生科研与实践创新计划项目“融合深度学习的大学生心理健康分析研究——基于社交文本”(编号:KYCX23_2535)的部分研究成果。