-
题名结合深度学习和语言难度特征的句子可读性计算方法
被引量:3
- 1
-
-
作者
唐玉玲
张宇飞
于东
-
机构
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第2期29-39,共11页
-
基金
国家社会科学基金(17ZDA305)
教育部人文社会科学研究青年基金(19YJCZH230)
北京语言大学中青年学术骨干支持计划。
-
文摘
该文提出了可读性语料库构建的改进方法,基于该方法,构建了规模更大的汉语句子可读性语料库。该语料库在句子绝对难度评估任务上的准确率达到78.69%,相对前人工作提升了15%以上,证明了改进方法的有效性。同时,将深度学习方法应用于汉语可读性评估,探究了不同深度学习方法自动捕获难度特征的能力,并进一步探究了向深度学习特征中融入不同层面的语言难度特征对模型整体性能的影响。实验结果表明,不同深度学习模型捕获难度特征的能力不尽相同,语言难度特征可以不同程度地提高可读性评估模型的难度表征能力。
-
关键词
深度学习
语言难度特征
句子可读性
-
Keywords
deep learning
language difficulty characteristics
sentence readability
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于对外汉语教材的新闻报刊难句分析
- 2
-
-
作者
赵文杰
赵慧周
-
机构
北京语言大学
-
出处
《中国科技经济新闻数据库 教育》
2022年第1期115-118,共4页
-
文摘
随着对外汉语教学的不断发展,教学材料的文本可读性分析显得越发重要,面向汉语学习者的文本简化任务首先需要回答的就是“判断难易”的问题。但目前国内对外汉语领域的可读性分析主要聚焦于通用文本的可读性评价上,对于新闻语料的可读性评价研究不足。本文选取了对外汉语教学中比较重要的报刊阅读教学这一领域,从中级报刊阅读教材中提取教学难句,并从句子中所含的构式和长定语成分上对难句的特点进行分析,研究结果有助于自动识别新闻阅读难句。
-
关键词
句子可读性
报刊难句
对外汉语教学
-
分类号
H195.4
[语言文字—汉语]
-