期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于多阶段分类的科研项目申请书结构功能识别
1
作者 林鑫 杜莹 罗宇 《数字图书馆论坛》 2024年第3期25-33,共9页
科研项目申请书蕴含丰富的科学知识,被广泛用作科技情报分析的基础数据,其中重复检测、分析挖掘等智能处理工作需要在明晰申请书结构功能的前提下展开。因此,构建一种基于多阶段分类的科研项目申请书结构功能识别模型。首先,对申请书进... 科研项目申请书蕴含丰富的科学知识,被广泛用作科技情报分析的基础数据,其中重复检测、分析挖掘等智能处理工作需要在明晰申请书结构功能的前提下展开。因此,构建一种基于多阶段分类的科研项目申请书结构功能识别模型。首先,对申请书进行预处理,识别申请书的正文内容及其包含的多模态要素,并将文本段落规范化;之后,基于BiLSTM-Attention模型,依次区分申请书中的章节标题与正文文本,基于标题识别正文文本的一级功能,进而识别申请书的细粒度结构功能。实验结果显示,所提方法的准确率与召回率分别达到93.7%和93.1%,该方法能较好支撑科研项目申请书的结构化解析,也能为其他类型学术文本的结构功能识别提供参考。 展开更多
关键词 科研项目申请书 结构功能识别 多阶段分类 BiLSTM-Attention
下载PDF
基于深度主动学习的科技文献摘要结构功能识别研究
2
作者 毛进 陈子洋 《数据分析与知识发现》 EI CSCD 北大核心 2024年第6期44-55,共12页
【目的】探究不同深度主动学习方法对科技文献摘要的结构功能识别效果和标注成本。【方法】提出基于主动学习和序列标注的科技文献摘要结构功能识别方法,构建考虑句间上下文序列信息的SciBERTBiLSTM-CRF模型(SBCA),然后分别提出基于摘... 【目的】探究不同深度主动学习方法对科技文献摘要的结构功能识别效果和标注成本。【方法】提出基于主动学习和序列标注的科技文献摘要结构功能识别方法,构建考虑句间上下文序列信息的SciBERTBiLSTM-CRF模型(SBCA),然后分别提出基于摘要单句和摘要全文两个维度的基于不确定性的主动学习策略,并在PubMed 20K数据集上进行实验。【结果】SBCA模型具有最佳的识别效果,与不考虑序列信息仅使用SciBERT模型相比,F1值提升了11.93个百分点。使用基于整篇摘要的最小置信度策略达到SBCA模型的最优F1值仅需使用60%数据,使用基于单句的最小置信度策略达到SBCA模型的最优F1值仅需使用65%数据。【局限】本研究中仅构建了基于不确定性的主动学习查询策略,未考虑构建其他类别的查询策略。【结论】基于深度主动学习的方法有助于在更低注释成本的前提下进行摘要结构功能识别。 展开更多
关键词 深度学习 文献结构功能识别 语步 主动学习 知识组织
原文传递
学术文本结构功能深度学习识别方法的多学科对比分析 被引量:6
3
作者 李楠 方丽 张逸飞 《现代情报》 CSSCI 2019年第12期55-63,87,共10页
[目的/意义]学术文本的结构功能识别可视为多类别文本自动分类问题,借助深度学习技术能够获得良好的自动识别性能,然而目前缺少其在不同学科适用性的对比研究。[方法/过程]选择医学、图情、数据、出版、经济5个学科方向5种期刊的6 452... [目的/意义]学术文本的结构功能识别可视为多类别文本自动分类问题,借助深度学习技术能够获得良好的自动识别性能,然而目前缺少其在不同学科适用性的对比研究。[方法/过程]选择医学、图情、数据、出版、经济5个学科方向5种期刊的6 452篇结构式摘要为基础语料,设计并实现了基于Magpie深度学习组件的学术文本结构功能识别实验,通过对比分析同一分类模型在不同学科领域实验语料上的性能表现及其影响因素,揭示机器学习方法的学科适用性规律。[结果/结论]实验结果显示,学科差异性对于机器学习效果有显著的影响,其中医学领域学术文本的结构功能识别效率明显高于其他学科,常见的学术文本功能结构框架中"方法"和"结果"的机器学习识别效果更佳。 展开更多
关键词 文本结构功能识别 深度学习 多学科 文本分类 MAGPIE
下载PDF
基于全字语义的摘要结构功能自动识别研究 被引量:22
4
作者 沈思 胡昊天 +1 位作者 叶文豪 王东波 《情报学报》 CSSCI CSCD 北大核心 2019年第1期79-88,共10页
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,... 学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。 展开更多
关键词 全字语义 序列属性 摘要结构功能识别 LSTM-CRF
下载PDF
基于层次注意力网络模型的学术文本结构功能识别 被引量:17
5
作者 秦成磊 章成志 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第11期26-42,共17页
【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统... 【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。 展开更多
关键词 学术文本结构功能识别 层次注意力网络 IMRaD 领域适应性分析
原文传递
基于深度学习模型的摘要结构功能识别方法研究 被引量:6
6
作者 刘忠宝 王宇飞 张志剑 《情报科学》 CSSCI 北大核心 2021年第3期107-112,共6页
【目的/意义】学术文献的摘要由目的、方法、结果等结构组成,这些结构具有特定的功能。目前,针对摘要功能结构识别的研究不多,且存在识别效率不高的问题,本文引入双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)、双... 【目的/意义】学术文献的摘要由目的、方法、结果等结构组成,这些结构具有特定的功能。目前,针对摘要功能结构识别的研究不多,且存在识别效率不高的问题,本文引入双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)、双向长短时记忆网络(Bidirectional Long Short Term Memory, BiLSTM)、BiLSTM-CRF、BERT等深度学习模型,对1232篇情报类期刊论文进行摘要结构功能识别研究。【方法/过程】引入5折交叉验证法进行多次实验,以避免一次实验的偶然性;实验结果用"均值±标准差"形式表示,同时考虑模型的平均性能和稳定性;实验结果用F1值进行评价。【结果/结论】与BiRNN、BiLSTM、BiLSTM-CRF等模型相比,BERT模型具有最高的均值和最低的标准差,这表明该模型不仅具有最优的结构功能识别能力,而且性能稳定,该模型特别适用于摘要结构功能识别任务。【局限/创新】本文采用的实验语料规模较小且为人工标注,这限制了识别效率的提升。 展开更多
关键词 结构功能识别 深度学习模型 双向循环神经网络 双向长短时记忆网络 条件随机场 BERT模型
原文传递
科技文献内容语义识别研究综述 被引量:6
7
作者 黄红 陈翀 张婧莹 《情报学报》 CSSCI CSCD 北大核心 2022年第9期991-1002,共12页
科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来。它属于细粒度文本挖掘,是获取和利用知识的基础。本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考。首先概括现有的文献内容语义标注模型,然后围绕章节... 科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来。它属于细粒度文本挖掘,是获取和利用知识的基础。本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考。首先概括现有的文献内容语义标注模型,然后围绕章节、句子、词汇三种识别粒度,梳理科技文献内容语义识别问题的研究发展,总结识别方法、评测手段以及典型应用,并据此提出现存问题及未来发展方向。本文探讨了五个方面的问题:(1)人们关注文献内容中哪些语义类型;(2)选取什么粒度的文本单元作为识别对象;(3)识别方法分为哪些类型;(4)如何评测识别结果;(5)语义识别有哪些典型应用。本文发现目前还存在语义类型标准不一、优质文献数据集欠缺、研究关注点不平衡、识别方法存在局限等问题,需要在后续研究中探寻解决方法。 展开更多
关键词 科技文献内容挖掘 语义类型 章节结构功能识别 语步识别 词汇语义识别
下载PDF
Squaring the Dialectic of Inference and Chance
8
作者 Paul Healey 《Journal of Philosophy Study》 2015年第5期257-271,共15页
Instead of merely inferring that our beliefs are in a correlation to the facts, I will contend that what matters is the logic of their inferential structure. This will reveal what is actually true for their relation a... Instead of merely inferring that our beliefs are in a correlation to the facts, I will contend that what matters is the logic of their inferential structure. This will reveal what is actually true for their relation and not just real for experience. Given one and two-sided inferences, the conditions of their functional relation will be consistent within a square of opposition; for contraries, contradictions and sub-contraries in a way that probability theory is not. Within this model of inferences, the two-sided concept of inferences will also have a modal value for its relation to the one-sided concept of inferences. Proposing that empirical, formal, speculative, and an Intuitionist Speculative understanding of logic will have a modal identity within a dialectical principle. 展开更多
关键词 INFERENCE square of opposition CHANCE MODALITIES DIALECTIC PRINCIPLE
下载PDF
房产面积识别技术研究 被引量:1
9
作者 殷齐鲁 《中国住宅设施》 2019年第5期104-105,101,共3页
房产面积是房产所有权的最重要的属性,房产面积识别技术的精确与否,对于确定房产面积至关重要。本文在分析房地产概念的基础上,分析了房地产领域的特点,介绍了房地产领域的识别技术。包括结构识别法,功能识别法和空间识别法,介绍了地下... 房产面积是房产所有权的最重要的属性,房产面积识别技术的精确与否,对于确定房产面积至关重要。本文在分析房地产概念的基础上,分析了房地产领域的特点,介绍了房地产领域的识别技术。包括结构识别法,功能识别法和空间识别法,介绍了地下室,停车位,架空层和特殊部件的识别技术;最后,案例分析阳台和低台存在情况下的房产面积计算原则,以上研究对房产面积识别具有一定的指导意义。 展开更多
关键词 房产面积 识别技术 结构功能识别 空间识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部