期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于预训练模型和Transformer架构的大数据与计算机类科普书籍难度分类研究
1
作者 黄启洲 《软件》 2024年第7期153-155,共3页
针对当前研究在书籍级长文本可读性评估方面的不足,本文提出了一种新颖的PTDE-CAC模型。该模型将书籍分割为固定片段,利用无监督聚类获取难度感知片段,对预训练模型进行再训练,使其学习难度知识,将长文本表示为多个不同难度级别的向量... 针对当前研究在书籍级长文本可读性评估方面的不足,本文提出了一种新颖的PTDE-CAC模型。该模型将书籍分割为固定片段,利用无监督聚类获取难度感知片段,对预训练模型进行再训练,使其学习难度知识,将长文本表示为多个不同难度级别的向量。本文构建了大数据、计算机科普教材分级数据集,实验证明PTDE-CAC模型在可读性评估中表现优异,优于传统方法和现有预训练模型。本工作为书籍级可读性评估提供了新思路,也为相关教材编写选择提供了参考。 展开更多
关键词 书籍级长文本 可读性评估 PTDE-CAC模型 难度感知预训练 多视角表示 大数据 计算机科普教材分数据集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部