期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
学术文本结构功能深度学习识别方法的多学科对比分析 被引量:6
1
作者 李楠 方丽 张逸飞 《现代情报》 CSSCI 2019年第12期55-63,87,共10页
[目的/意义]学术文本的结构功能识别可视为多类别文本自动分类问题,借助深度学习技术能够获得良好的自动识别性能,然而目前缺少其在不同学科适用性的对比研究。[方法/过程]选择医学、图情、数据、出版、经济5个学科方向5种期刊的6 452... [目的/意义]学术文本的结构功能识别可视为多类别文本自动分类问题,借助深度学习技术能够获得良好的自动识别性能,然而目前缺少其在不同学科适用性的对比研究。[方法/过程]选择医学、图情、数据、出版、经济5个学科方向5种期刊的6 452篇结构式摘要为基础语料,设计并实现了基于Magpie深度学习组件的学术文本结构功能识别实验,通过对比分析同一分类模型在不同学科领域实验语料上的性能表现及其影响因素,揭示机器学习方法的学科适用性规律。[结果/结论]实验结果显示,学科差异性对于机器学习效果有显著的影响,其中医学领域学术文本的结构功能识别效率明显高于其他学科,常见的学术文本功能结构框架中"方法"和"结果"的机器学习识别效果更佳。 展开更多
关键词 文本结构功能识别 深度学习 多学科 文本分类 MAGPIE
下载PDF
基于层次注意力网络模型的学术文本结构功能识别 被引量:16
2
作者 秦成磊 章成志 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第11期26-42,共17页
【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统... 【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。 展开更多
关键词 学术文本结构功能识别 层次注意力网络 IMRaD 领域适应性分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部