【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统...【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。展开更多
【目的/意义】学术文献的摘要由目的、方法、结果等结构组成,这些结构具有特定的功能。目前,针对摘要功能结构识别的研究不多,且存在识别效率不高的问题,本文引入双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)、双...【目的/意义】学术文献的摘要由目的、方法、结果等结构组成,这些结构具有特定的功能。目前,针对摘要功能结构识别的研究不多,且存在识别效率不高的问题,本文引入双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)、双向长短时记忆网络(Bidirectional Long Short Term Memory, BiLSTM)、BiLSTM-CRF、BERT等深度学习模型,对1232篇情报类期刊论文进行摘要结构功能识别研究。【方法/过程】引入5折交叉验证法进行多次实验,以避免一次实验的偶然性;实验结果用"均值±标准差"形式表示,同时考虑模型的平均性能和稳定性;实验结果用F1值进行评价。【结果/结论】与BiRNN、BiLSTM、BiLSTM-CRF等模型相比,BERT模型具有最高的均值和最低的标准差,这表明该模型不仅具有最优的结构功能识别能力,而且性能稳定,该模型特别适用于摘要结构功能识别任务。【局限/创新】本文采用的实验语料规模较小且为人工标注,这限制了识别效率的提升。展开更多
Instead of merely inferring that our beliefs are in a correlation to the facts, I will contend that what matters is the logic of their inferential structure. This will reveal what is actually true for their relation a...Instead of merely inferring that our beliefs are in a correlation to the facts, I will contend that what matters is the logic of their inferential structure. This will reveal what is actually true for their relation and not just real for experience. Given one and two-sided inferences, the conditions of their functional relation will be consistent within a square of opposition; for contraries, contradictions and sub-contraries in a way that probability theory is not. Within this model of inferences, the two-sided concept of inferences will also have a modal value for its relation to the one-sided concept of inferences. Proposing that empirical, formal, speculative, and an Intuitionist Speculative understanding of logic will have a modal identity within a dialectical principle.展开更多
文摘【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。
文摘【目的/意义】学术文献的摘要由目的、方法、结果等结构组成,这些结构具有特定的功能。目前,针对摘要功能结构识别的研究不多,且存在识别效率不高的问题,本文引入双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)、双向长短时记忆网络(Bidirectional Long Short Term Memory, BiLSTM)、BiLSTM-CRF、BERT等深度学习模型,对1232篇情报类期刊论文进行摘要结构功能识别研究。【方法/过程】引入5折交叉验证法进行多次实验,以避免一次实验的偶然性;实验结果用"均值±标准差"形式表示,同时考虑模型的平均性能和稳定性;实验结果用F1值进行评价。【结果/结论】与BiRNN、BiLSTM、BiLSTM-CRF等模型相比,BERT模型具有最高的均值和最低的标准差,这表明该模型不仅具有最优的结构功能识别能力,而且性能稳定,该模型特别适用于摘要结构功能识别任务。【局限/创新】本文采用的实验语料规模较小且为人工标注,这限制了识别效率的提升。
文摘Instead of merely inferring that our beliefs are in a correlation to the facts, I will contend that what matters is the logic of their inferential structure. This will reveal what is actually true for their relation and not just real for experience. Given one and two-sided inferences, the conditions of their functional relation will be consistent within a square of opposition; for contraries, contradictions and sub-contraries in a way that probability theory is not. Within this model of inferences, the two-sided concept of inferences will also have a modal value for its relation to the one-sided concept of inferences. Proposing that empirical, formal, speculative, and an Intuitionist Speculative understanding of logic will have a modal identity within a dialectical principle.