期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
科研流动与主题转换关系研究——以人机交互领域高影响力学者为例
1
作者 裴瑞敏 徐庆如 +1 位作者 胡涛 程豪 《今日科苑》 2024年第4期6-18,共13页
科研流动和主题转换是普遍存在的科研活动,均对科研绩效有重要影响。研究主题转换反映了知识信息的发展变化,适度的主题转换能带来学科交叉融合,并更易产生创新性成果,因此主题转换的成因和场景受到学者特别关注。本研究聚焦科研流动与... 科研流动和主题转换是普遍存在的科研活动,均对科研绩效有重要影响。研究主题转换反映了知识信息的发展变化,适度的主题转换能带来学科交叉融合,并更易产生创新性成果,因此主题转换的成因和场景受到学者特别关注。本研究聚焦科研流动与主题转换的关系,以新兴科技领域人机交互高影响力学者为例,分析了科研流动对学者主题转换的影响。采用履历分析方法测度科研人员流动,采用自然语言处理的Doc2Vec算法和近邻传播算法(AffinityPropagation)相结合识别研究主题并聚类,对人机交互领域的学者流动和主题转换特征进行分析,并从描述分析和统计分析两个角度研究了科研流动和主题转换之间的关系。研究发现,人机交互领域的高影响力学者科研流动和研究主题转换较为普遍,科研人员流动与主题转换之间存在显著正向关系,且不同阶段的流动和不同属性的流动对主题转换具有显著的正向影响,工作阶段的流动次数对主题转换的影响要大于教育阶段的流动。 展开更多
关键词 科研流动 主题转换 doc2vec 近邻传播算法(AP算法) 新兴科技领域
下载PDF
基于Doc2Vec和深度神经网络的战场态势智能推送研究 被引量:8
2
作者 申远 黄志良 +1 位作者 胡彪 王适之 《智能计算机与应用》 2020年第1期50-55,共6页
战场态势智能推送中的推荐算法是最核心、最关键的组成部分,在很大程度上决定了战场态势推送性能的优劣。深度神经网络推荐算法对用户和态势的需求度关系进行建模学习,能够学习到两者之间隐含的、更为复杂的非线性关系,缺点在于未利用... 战场态势智能推送中的推荐算法是最核心、最关键的组成部分,在很大程度上决定了战场态势推送性能的优劣。深度神经网络推荐算法对用户和态势的需求度关系进行建模学习,能够学习到两者之间隐含的、更为复杂的非线性关系,缺点在于未利用到态势的额外信息。因此以深度神经网络推荐算法为基础,利用Doc2Vec方法提取态势文本内容信息来作为深度神经网络模型的辅助输入,设计了一种基于Doc2Vec和深度神经网络的战场态势智能推送方法。实验仿真结果表明,利用Doc2Vec算法来对态势的额外信息进行建模,能够提升算法推荐效果。 展开更多
关键词 战场态势 智能推送 推荐算法 深度神经网络 doc2vec
下载PDF
基于doc2vec的主观题自动评分应用 被引量:1
3
作者 肖灵云 刘军库 李春红 《现代计算机》 2022年第1期79-82,95,共5页
针对中文主观题自动评分准确率低的问题,提出一种基于doc2vec算法的主观题自动评分方法。利用doc2vec算法计算出参考答案文本和考生答案文本的文本向量,计算出两文本向量之间的相似度,然后根据相似度计算考生得分。将主观题试题作为实... 针对中文主观题自动评分准确率低的问题,提出一种基于doc2vec算法的主观题自动评分方法。利用doc2vec算法计算出参考答案文本和考生答案文本的文本向量,计算出两文本向量之间的相似度,然后根据相似度计算考生得分。将主观题试题作为实验数据集,用doc2vec算法进行评分,并采用方差及偏差率作为衡量标准,对基于doc2vec算法的评分结果进行验证,并与基于TextRank算法的主观题自动评分结果及人工评分进行对比,实验表明基于doc2vec算法的评分结果的方差及偏差率都较小,稳定性较好,为后期研究主观题评分有一定的参考意义。 展开更多
关键词 自动评分 doc2vec算法 文本相似度 主观题
下载PDF
基于文献网络节点属性的论文重要性评价模型的构建及评估 被引量:2
4
作者 潘现伟 崔雷 《情报理论与实践》 CSSCI 北大核心 2023年第9期130-141,共12页
[目的/意义]学术论文评价是科研评价的基础,是科研管理和评价的刚需。目前基于引文和论文内容视角构建的论文评价模型效果仍有提升的空间。[方法/过程]首先,利用复杂网络分析法,从文献相似性网络的节点属性构建论文重要性评价模型,探讨... [目的/意义]学术论文评价是科研评价的基础,是科研管理和评价的刚需。目前基于引文和论文内容视角构建的论文评价模型效果仍有提升的空间。[方法/过程]首先,利用复杂网络分析法,从文献相似性网络的节点属性构建论文重要性评价模型,探讨从文献网络的角度评价论文质量的可行性。其次,选择8个医学相关学科,下载数据形成8个文献数据集,根据论文被Faculty Opinions数据库收录的情况,事先标记为重要论文和普通论文。再次,从论文的主题词、题目摘要和参考文献3种信息源分别构建基于医学主题词表树状结构、Doc2Vec算法和文献耦合的3种文献相似性网络,并对每一种文献相似性网络,利用复杂网络分析方法对网络中的节点进行特征计算,选择具有统计学差异的节点属性指标作为区别两类论文的评价指标。最后,采用4种机器学习算法对数据集中的论文进行二分类学习,构建并评估论文重要性评价模型。[结果/结论]基于文献网络进行论文评价的方法是可行的,3种文献网络构建算法效果差异较小,语义相似性文献网络和文献耦合两种算法略优于基于Doc2Vec的算法。BP神经网络算法在基于文献网络构建的论文重要性评价模型中性能最好。 展开更多
关键词 论文评价 文献相似性网络 复杂网络分析 doc2vec算法 机器学习
下载PDF
基于改进TextRank算法的中文文本摘要提取 被引量:24
5
作者 徐馨韬 柴小丽 +2 位作者 谢彬 沈晨 王敬平 《计算机工程》 CAS CSCD 北大核心 2019年第3期273-277,共5页
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重... 为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。 展开更多
关键词 doc2vec模型 K-MEANS算法 TextRank算法 摘要提取 权重影响因子
下载PDF
基于半监督学习的恶意URL检测方法 被引量:4
6
作者 麻瓯勃 刘雪娇 +2 位作者 唐旭栋 周宇轩 胡亦承 《计算机系统应用》 2020年第11期11-20,共10页
检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利... 检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利用专家知识与Doc2Vec两种方法预处理的数据训练两个分类器,筛选两个分类器预测结果相同且置信度高的数据打上伪标签(pseudo-labeled)后用于分类器继续学习.实验结果表明,本文方法只用0.67%的有标签数据即可训练出检测精确度(precision)分别达到99.42%和95.23%的两个不同类型分类器,与有监督学习性能相近,比自训练与协同训练表现更优异. 展开更多
关键词 恶意URL检测 半监督学习 协同训练改进算法 doc2vec 分类器训练
下载PDF
融合文本分布式表示的重复缺陷报告检测 被引量:2
7
作者 曾杰 贲可荣 +1 位作者 张献 徐永士 《计算机工程与科学》 CSCD 北大核心 2021年第4期670-680,共11页
重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并... 重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并抽取缺陷报告的分布式表示,将不同长度的缺陷报告编码为统一长度的稠密向量。接着,通过比较这些向量来计算不同缺陷报告的相似程度,将其作为一种新特征与重复缺陷报告检测过程常用的其它特征进行融合,并利用机器学习算法训练二元分类模型。在公开的Bugzilla重复缺陷报告数据集上的实验结果表明,相比于代表性方法D_TS,本文方法的F1值平均提升了2%,说明了新特征的有效性。 展开更多
关键词 重复缺陷报告 文本分布式表示 doc2vec模型 机器学习算法
下载PDF
基于句子向量表示和模糊C均值的电子政务文档自动摘要技术
8
作者 祁荣苓 焦文彬 汪洋 《数据与计算发展前沿》 CSCD 2021年第2期103-111,共9页
【目的】随着“互联网+电子政务”的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策。本文旨在研究一... 【目的】随着“互联网+电子政务”的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策。本文旨在研究一种适合电子政务文档的自动摘要算法。【方法】本文针对电子政务资讯文本的特点提出了一种融合Doc2Vec句子向量表示方法和模糊均值聚类方法的算法并应用在电子政务资讯文档的自动摘要生成中,不仅考虑句子之间的相关度,而且针对文章的特点对于每个句子赋予一定的权重来表示他作为摘要句子的重要性。【结果】实验表明,相较于目前常用的k-means算法结果和复杂的深度学习算法结果,该算法在电子政务资讯文档的自动生成取得了比较好的结果。【结论】研究自动摘要技术并在电子政务领域应用是一项很有价值的工作。 展开更多
关键词 自动摘要 电子政务 doc2vec 模糊聚类 信息化评估
下载PDF
基于文本相似度的简历匹配推荐算法研究 被引量:6
9
作者 施元鹏 单剑峰 《计算机仿真》 北大核心 2022年第4期441-444,491,共5页
为了能够更好的帮助求职者选择合适的岗位信息,提出了基于文本相似度的简历匹配推荐算法。通过对简历和岗位信息进行特征提取及特征处理,将数据文本划分为两类。在结构化文本中,利用偏好权重因子α消除求职者与企业之间由于不同因素带... 为了能够更好的帮助求职者选择合适的岗位信息,提出了基于文本相似度的简历匹配推荐算法。通过对简历和岗位信息进行特征提取及特征处理,将数据文本划分为两类。在结构化文本中,利用偏好权重因子α消除求职者与企业之间由于不同因素带来的相似度计算偏差。对于非结构化文本,利用机器学习模型doc2vec训练,并计算两者之间的相似度,提出修正参数χ来解决doc2vec缺乏考虑段落长度差异性的问题。实验结果表明,上述方法具有更高的准确率、召回率以及F1值。 展开更多
关键词 文本相似度 推荐算法 偏好权重因子 机器学习模型 修正参数
下载PDF
科学推动下技术机会发现方法研究 被引量:16
10
作者 韩晓彤 朱东华 汪雪锋 《图书情报工作》 CSSCI 北大核心 2022年第10期19-32,共14页
[目的/意义]科学与技术之间的密切关系,使得结合论文与专利进行技术机会分析比使用单一数据更加合理与高效。本文使科学技术关系的生成更自动化,减弱对主观判断的依赖,使技术颗粒更加精细,同时为技术研发人员提供研发建议,将科学研究中... [目的/意义]科学与技术之间的密切关系,使得结合论文与专利进行技术机会分析比使用单一数据更加合理与高效。本文使科学技术关系的生成更自动化,减弱对主观判断的依赖,使技术颗粒更加精细,同时为技术研发人员提供研发建议,将科学研究中汲取的理念应用到相应的技术创新中去。[方法/过程]将论文、专利的摘要文本进行Doc2vec向量表示,通过文本相似性将其关联成网络,再基于Louvain算法生成科技主题聚类,识别科学研究推动的技术机会。最后以3D打印技术为案例进行实证研究。[结果/结论]识别出若干科学研究推动的技术机会,并验证所识别的机会具有一定的技术潜力,证明方法的可行性和有效性。 展开更多
关键词 技术机会分析 科学推动力 专利分析 doc2vec Louvain算法
原文传递
基于语义网络的社会化问答社区答案聚合与排序研究 被引量:4
11
作者 刘伟利 张海涛 +1 位作者 李依霖 张春龙 《情报科学》 CSSCI 北大核心 2021年第9期94-100,共7页
【目的/意义】旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更好的知识服务。【方法/过程】首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络。其次,利用Louvain算法对答案... 【目的/意义】旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更好的知识服务。【方法/过程】首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络。其次,利用Louvain算法对答案语义网络进行社区划分,并用TextRank算法抽取各个主题下文档的关键词,使用词云对每个主题进行可视化展示。最后,利用PageRank算法对聚类后的答案语义网络进行排序,从而实现答案文档的主题聚合和排序。【结果/结论】本研究使用“知乎”上的问答数据进行了实证研究。结果表明,所提出的答案聚合和排序方法不仅能够向用户直观地展示答案之间的关联强度和各个主题答案的主要内容,还能够为用户提供分主题的答案排序结果,自动为用户筛选高质量的答案。【创新/局限】创新性地提出了答案语义网络,并基于答案语义网络,提出了一种集聚合、主题可视化和排序于一体的答案知识组织方法。 展开更多
关键词 社会化问答社区 答案聚合 答案排序 语义网络 doc2vec算法
原文传递
基于文本智能解析变换器的值守机器人控制方法
12
作者 韩天星 王宝 +3 位作者 张伟 冯磊 张潇 梁庆华 《机械设计与研究》 CSCD 北大核心 2022年第2期1-6,17,共7页
利用智能机器人开展配电站无人化值守作业需要对云平台系统下发的传统的运维作业操作票进行翻译,将文档内容转换为机器人提前约定的可识别的操作指令。针对这一问题,设计将运维文本转换为机器语言的变换器。变换器对语料进行分词预处理... 利用智能机器人开展配电站无人化值守作业需要对云平台系统下发的传统的运维作业操作票进行翻译,将文档内容转换为机器人提前约定的可识别的操作指令。针对这一问题,设计将运维文本转换为机器语言的变换器。变换器对语料进行分词预处理,基于doc2vec进行词句向量化,并结合K-means++算法进行语料聚类,将聚类的结果通过LCS(Longest Common Subsequence)算法以及seq2seq模型处理,最后基于历史语料库构建得到操作规则库及翻译模型。以江苏省某市的操作票运维文本进行实验,结论表明变换器对文本聚类的结果满足实际情况且通过LCS算法可以得到一个通用的匹配规则,使用变换器构建的翻译框架可以将作业指令准确变换为机器人可以识别的语言,进而控制机器人完成配电运维任务。 展开更多
关键词 操作票运维文本 doc2vec 聚类算法 LCS算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部