期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于特征融合的术语型引用对象自动识别方法研究 被引量:8
1
作者 马娜 张智雄 吴朋民 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第1期89-98,共10页
【目的】设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法。【方法】将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设... 【目的】设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法。【方法】将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设计伪标签学习降噪机制,采用半监督学习方法探究不同特征组合对识别效果的影响。【结果】本方法在术语型引用对象识别任务中最优F1值达到0.6018,比BERT模型实验结果提升8%。【局限】实验数据仅涉及计算机领域,在其他领域的可移植性有待考证。【结论】基于特征融合的深度学习方法在术语型引用对象的识别中有较好性能,伪标签学习方法解决了引用对象标注数据不足的问题,两者结合有效地探索了术语型引用对象自动化识别方法。 展开更多
关键词 引用对象识别 特征融合 伪标签学习 BiLSTM-CNN-CRF
原文传递
不同深度学习模型的科技论文摘要语步识别效果对比研究 被引量:21
2
作者 张智雄 刘欢 +2 位作者 丁良萍 吴朋民 于改红 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第12期1-9,共9页
【目的】探究不同深度学习模型的科技论文摘要语步识别效果,并分析识别效果差异原因。【方法】构建大规模的科技论文结构化摘要语料库,选择10000和50000两种样本量的训练集,以传统机器学习方法SVM作为对比基准,引入多种深度学习方法(包... 【目的】探究不同深度学习模型的科技论文摘要语步识别效果,并分析识别效果差异原因。【方法】构建大规模的科技论文结构化摘要语料库,选择10000和50000两种样本量的训练集,以传统机器学习方法SVM作为对比基准,引入多种深度学习方法(包括DNN、LSTM、Attention-BiLSTM等神经网络模型),开展语步识别实验,并对实验结果进行对比分析。【结果】Attention-BiLSTM方法在两种样本量下的实验中都取得最好的识别效果,50000样本量下F1值达0.9375;SVM方法的识别效果意外好于DNN、LSTM两种深度学习方法;但是,样本量从10000增加到50000时,SVM方法的识别效果提升最小(F1值提升0.0125),LSTM方法效果提升最大(F1值提升0.1125)。【局限】由于该领域尚未有公开的通用语料,主要以笔者收集的结构化论文摘要作为训练和测试语料,因此本文的研究结果在与他人比较时有一定的局限性。【结论】双向LSTM网络结构和注意力机制能够显著提升深度学习模型的语步识别效果;深度学习方法在大规模训练集下更能体现其优越性。 展开更多
关键词 深度学习 神经网络 语步识别 支持向量机
原文传递
Altmetrics与引文指标相关性研究 被引量:12
3
作者 吴朋民 陈挺 王小梅 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第6期58-69,共12页
【目的】研究高质量期刊中论文的Altmetrics指标的相关特性,包括与被引次数相关性、学科差异性、分项指标的贡献度等,对比分析与已有基于全论文数据集分析结果的差异性,为正确理解和使用Altmetrics指标提供借鉴。【方法】选取Nature In... 【目的】研究高质量期刊中论文的Altmetrics指标的相关特性,包括与被引次数相关性、学科差异性、分项指标的贡献度等,对比分析与已有基于全论文数据集分析结果的差异性,为正确理解和使用Altmetrics指标提供借鉴。【方法】选取Nature Index的68种高质量期刊为数据源,利用机器学习方法对论文进行学科分类,采用Spearman相关性分析方法,分析Altmetrics与被引次数之间的相关性及在各个学科中的差别,以及Altmetrics各分项指标的贡献度,并利用ROC曲线评估Altmetrics识别高被引论文的有效性。【结果】Altmetrics与被引次数的相关性存在学科差异;高质量期刊中,论文的Altmetrics分值与被引次数间的相关性增强;News、Blog、Twitter对Altmetrics得分的贡献度增大;Altmetrics有助于识别高被引论文。【局限】所选数据集覆盖年限较短,未进一步根据学科特点扩展数据集。【结论】对比以往全数据集的研究结果,Altmetrics在高质量期刊中的表现具有独特性,Altmetrics与被引次数之间具有强相关性。 展开更多
关键词 Altmetrics指标 被引次数 相关性分析 ROC曲线分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部