期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于智能合约和联邦存储的异步联邦学习模型
1
作者 刘星辰 杜军平 +1 位作者 梁美玉 李昂 《数据采集与处理》 CSCD 北大核心 2024年第6期1532-1542,共11页
公共安全突发事件中对数据安全的重视程度越来越高,联邦学习由于不再需要上传数据到中心服务器进行计算,减少了隐私泄露的可能而受到广泛关注。然而当前基于智能合约的联邦学习由于运算较大,存在着效率低等缺陷,因此本文提出了一种面向... 公共安全突发事件中对数据安全的重视程度越来越高,联邦学习由于不再需要上传数据到中心服务器进行计算,减少了隐私泄露的可能而受到广泛关注。然而当前基于智能合约的联邦学习由于运算较大,存在着效率低等缺陷,因此本文提出了一种面向公共卫生突发事件检测的智能合约与联邦存储的异步联邦学习方法。该方法允许联邦节点在任何时间加入和退出联邦学习;依托智能合约与分布存储,进一步增加了公共卫生安全领域的数据安全与训练效率;同时采用自适应的差分隐私对其上传到分布式存储节点的梯度进行动态保护,进一步降低了隐私泄露的风险。在公共数据集和公共卫生安全数据集上大量的实验表明,本文提出的方法在精度上优于已知的对比方法,且在达到相同精度的情况下所需时间更少。 展开更多
关键词 智能合约 联邦学习 公共卫生突发事件 联邦存储
下载PDF
特色农产品对县域经济发展影响研究
2
作者 张锐 包明齐 杜俊平 《全国流通经济》 2024年第5期144-147,共4页
农业是我国国民经济的基础,具有投入少、产出高的特点,对国家经济发展有着重要作用。因此,实现农业的现代化发展是我国实现经济腾飞的重要途径。在农业现代化发展中,特色农产品作为我国农业发展的重要内容,是实现农业现代化的有效途径... 农业是我国国民经济的基础,具有投入少、产出高的特点,对国家经济发展有着重要作用。因此,实现农业的现代化发展是我国实现经济腾飞的重要途径。在农业现代化发展中,特色农产品作为我国农业发展的重要内容,是实现农业现代化的有效途径。本文分析了特色农产品对县域经济发展的影响,并据此提出发展特色农产品促进县域经济发展的相关对策。 展开更多
关键词 特色农产品 县域经济 影响
下载PDF
基于PDCA模式下的高校绩效评价体系研究——以S大学为例 被引量:1
3
作者 杜俊萍 王舟 田洁 《教育财会研究》 2024年第3期30-36,共7页
高校绩效管理是学校财务管理的核心内容,而绩效预算评价作为绩效管理的重要组成部分,备受关注。本文将PDCA管理模式引入高校绩效管理框架,融合高校特色,构建科学合理的多维度预算绩效评价体系,助力高校绩效管理目标的实现,促进高校内涵... 高校绩效管理是学校财务管理的核心内容,而绩效预算评价作为绩效管理的重要组成部分,备受关注。本文将PDCA管理模式引入高校绩效管理框架,融合高校特色,构建科学合理的多维度预算绩效评价体系,助力高校绩效管理目标的实现,促进高校内涵式发展,最终形成绩效计划制定、绩效目标实施、绩效考核评估及绩效反馈与应用的良性循环。同时,本文选取了S大学2018-2022年绩效评价数据及相关财务数据,基于PDCA管理模式,运用层次分析法开展预算绩效评价,旨在为高校预算绩效评价指标的建立提供有效借鉴,促进高校实现内涵式发展。 展开更多
关键词 高校绩效管理 绩效评价体系 PDCA模式
下载PDF
河西走廊地区农业灌溉用水效率及其影响因素研究 被引量:1
4
作者 杜俊平 《贺州学院学报》 2024年第1期130-136,共7页
探究河西走廊地区的农业用水效率水平及其影响因素,有助于推进河西走廊地区农业节水灌溉的高质量发展。利用超效率SBM模型测算河西走廊地区农业用水效率水平,采用Tobit模型探究该区域用水效率的影响因素,结果表明:从总体趋势来看,2005年... 探究河西走廊地区的农业用水效率水平及其影响因素,有助于推进河西走廊地区农业节水灌溉的高质量发展。利用超效率SBM模型测算河西走廊地区农业用水效率水平,采用Tobit模型探究该区域用水效率的影响因素,结果表明:从总体趋势来看,2005年至2020年河西走廊地区农业灌溉用水效率总体呈现波动上升态势,嘉峪关市一直高于这一区域的总体水平,除2020年,金昌市一直低于该区域总体水平,武威市的农业灌溉用水效率不稳定,各年差距较大。经济发展水平、农民人均纯收入对河西走廊地区农业灌溉用水效率有显著的正向影响,户均耕地面积、信息传输和计算机服务以及软件业从业人数占总从业人数的比例对河西走廊地区农业灌溉用水效率有显著的负向影响。针对河西走廊地区农业用水效率的影响因素应采取差异化措施,可切实提升该区域农业灌溉用水的效率,有助于当地农业迈入高质量发展之路。 展开更多
关键词 河西走廊 农业灌溉 用水效率 TOBIT模型 超效率SBM模型
下载PDF
实验室低真空−冷却水循环系统的研制
5
作者 杜俊平 张鲜放 +3 位作者 陈凤华 方少明 张华林 韩光鲁 《实验科学与技术》 2024年第2期30-34,共5页
结合低真空和冷却水装置的特点及存在的问题,研制了一种低真空−冷却水循环系统。通过合理的安装排布和巧妙的设备选型,仅通过一个流体输送设备,采用基于伯努利方程原理的真空瓶,实现了低真空和冷却水循环双重功能,提高了设备性能,降低... 结合低真空和冷却水装置的特点及存在的问题,研制了一种低真空−冷却水循环系统。通过合理的安装排布和巧妙的设备选型,仅通过一个流体输送设备,采用基于伯努利方程原理的真空瓶,实现了低真空和冷却水循环双重功能,提高了设备性能,降低了设备使用成本(约40%)和占用面积,有效增加了基础实验室操作安全性,从根源上降低了设备使用风险;利用水循环系统,达到了节能减排的目的。 展开更多
关键词 实验室 低真空 冷却水循环系统 研制
下载PDF
基于RNN和主题模型的社交网络突发话题发现 被引量:16
6
作者 石磊 杜军平 梁美玉 《通信学报》 EI CSCD 北大核心 2018年第4期189-198,共10页
社交网络数据是稀疏和嘈杂的,并伴有大量的无意义话题。传统突发话题发现方法无法解决社交网络短文本稀疏性问题,并需要复杂的后处理过程。为了解决上述问题,提出一种基于循环神经网络(RNN,recurrent neural network)和主题模型的突发... 社交网络数据是稀疏和嘈杂的,并伴有大量的无意义话题。传统突发话题发现方法无法解决社交网络短文本稀疏性问题,并需要复杂的后处理过程。为了解决上述问题,提出一种基于循环神经网络(RNN,recurrent neural network)和主题模型的突发话题发现(RTM-SBTD)方法。首先,综合RNN和逆序文档频率(IDF,inverse document frequency)构建权重先验来学习词的关系,同时通过构建词对解决短文本稀疏性问题。其次,模型中引入针板先验(spike and slab)来解耦突发话题分布的稀疏和平滑。最后,引入词的突发性来区分建模普通话题和突发话题,实现突发话题自动发现。实验结果表明与现有的主流突发话题发现方法相比,所提RTM-SBTD方法在多种评价指标上优于对比算法。 展开更多
关键词 社交网络 突发话题发现 主题模型 循环神经网络
下载PDF
CJ 5.8 tex单纱及其合股乔其纱生产实践
7
作者 杜俊萍 胡吉国 +1 位作者 高磊 李曼 《纺织器材》 2024年第2期50-54,59,共6页
为了确保纯棉CJ 5.8 tex合股乔其纱硬挺且富有弹性,分析纯棉乔其纱面料对纱线的要求,介绍纯棉CJ 5.8 tex合股乔其纱配棉与纺纱工艺流程,以及单纱与合股的捻度、捻向选择,单纱质量和锭速优化,并线倍捻工艺及注意事项,蒸纱工艺重要性等。... 为了确保纯棉CJ 5.8 tex合股乔其纱硬挺且富有弹性,分析纯棉乔其纱面料对纱线的要求,介绍纯棉CJ 5.8 tex合股乔其纱配棉与纺纱工艺流程,以及单纱与合股的捻度、捻向选择,单纱质量和锭速优化,并线倍捻工艺及注意事项,蒸纱工艺重要性等。通过多组试验方案试纺纯棉CJ 5.8 tex合股乔其纱,确定其单纱为Z捻、捻度为28.50捻/(25.4 mm),合股纱为Z捻、捻度为24.70捻/(25.4 mm);工艺优选后细纱隔距块为3.00 mm、配前后区压力棒、粗纱定量设为2.9 g/(10 m)、细纱锭速设为15.0 kr/min、倍捻工序卷绕角设为14°32′。指出:合股线生产捻度设计可利用Excel数据分析确定合股强力回归方程;乔其纱单纱Z捻+Z捻合股在较低捻度下生产与单纱Z捻+S捻合股较高捻度的强力持平,且节约用电、单纱生产效率高;合股并线工序应重点控制小辫子、单股等疵点,倍捻工序重点调整成形、避免强捻与捻不匀问题;蒸纱定型能使乔其纱结构稳定,强力和伸长率提升,利于织造和印染。 展开更多
关键词 CJ 5.8 tex合股乔其纱 捻度 捻向 并线 倍捻 卷绕角 锭速
下载PDF
基于卷积神经网络的微博话题内容搜索方法 被引量:3
8
作者 周南 杜军平 +3 位作者 姚旭 梁美玉 薛哲 LEE JangMyung 《计算机科学与探索》 CSCD 北大核心 2019年第5期753-764,共12页
针对由于微博文本的数据特性造成的传统信息搜索方法无法直接实现微博话题内容搜索的问题,提出了一种基于卷积神经网络的微博话题内容搜索方法,对微博安全话题内容进行搜索和匹配排序。该方法包括基于深度卷积神经网络的微博内容筛选和... 针对由于微博文本的数据特性造成的传统信息搜索方法无法直接实现微博话题内容搜索的问题,提出了一种基于卷积神经网络的微博话题内容搜索方法,对微博安全话题内容进行搜索和匹配排序。该方法包括基于深度卷积神经网络的微博内容筛选和微博内容匹配两部分。微博内容筛选依据深度卷积特征表示进行微博内容筛选,微博内容匹配通过卷积特征非线性变换对筛选结果进行匹配排序。微博内容筛选和微博内容匹配对国民安全话题相关的微博文本内容局部特征进行处理,对筛选结果进行相似度计算从而实现相似度匹配。实验结果表明该方法在微博搜索性能上优于现有同类方法,并验证了所提出方法针对安全话题的微博文本内容搜索的有效性。 展开更多
关键词 微博搜索 深度卷积神经网络 深度学习 搜索排序 信息搜索
下载PDF
基于注意力特征提取网络的图像描述生成算法 被引量:4
9
作者 李金轩 杜军平 周南 《南京信息工程大学学报(自然科学版)》 CAS 2019年第3期295-301,共7页
针对解决图像描述生成中对浅层图像特征利用不充分、图像目标间关系提取不足的问题,提出一种基于注意力图像特征提取的图像描述生成算法.通过语言模型上下文信息对不同深度图像特征进行自适应注意力权重分配,使带有注意力的图像特征参... 针对解决图像描述生成中对浅层图像特征利用不充分、图像目标间关系提取不足的问题,提出一种基于注意力图像特征提取的图像描述生成算法.通过语言模型上下文信息对不同深度图像特征进行自适应注意力权重分配,使带有注意力的图像特征参与指导图像描述生成,提升了图像描述生成的效果.在MSCOCO测试集中所提算法的BLEU-1和CIDEr得分分别达到0.752和0.934,从而验证了所提算法的有效性. 展开更多
关键词 注意力机制 图像描述 长短期记忆网络 图像特征提取
下载PDF
基于多视角股票特征的股票预测研究 被引量:7
10
作者 李金轩 杜军平 薛哲 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第1期68-74,共7页
股票价格预测是金融行业中的一个重要研究内容,能够更准确地分析股票价格走势对于投资机构至关重要.目前,关于自动化预测股票价格发展的研究工作相对较少,还有许多问题需要解决.针对传统股票预测方法中视角单一、无法充分考虑数据的各... 股票价格预测是金融行业中的一个重要研究内容,能够更准确地分析股票价格走势对于投资机构至关重要.目前,关于自动化预测股票价格发展的研究工作相对较少,还有许多问题需要解决.针对传统股票预测方法中视角单一、无法充分考虑数据的各特征重要度的问题,提出一种基于多视角股票特征的股票预测方法,通过计算股票数据的Ma,Macd,Kdj,Boll特征指标,训练每个指标下的弱学习器,并进行多个弱学习器的集成学习,最终用于预测股票价格走势.使用美国股票新闻数据集进行验证.结果表明,基于多视角股票特征的股票预测方法预测得到的股票价格与实际价格之间的平均误差与均方误差分别为1.9321和0.0581,优于传统的基于单一指标的股票预测结果. 展开更多
关键词 股票预测 多视角 弱学习器 集成学习
下载PDF
基于膨胀卷积迭代与注意力机制的实体名识别方法 被引量:4
11
作者 吕江海 杜军平 +1 位作者 周南 薛哲 《计算机工程》 CAS CSCD 北大核心 2021年第1期58-65,71,共9页
针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特... 针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特性,即用简单的结构记录尽可能多的输入信息,并在准确提取文本序列特征的同时加快神经网络模型的训练速度。通过引入ATT运用文本语法信息和单词词性信息,从众多文本特征中选择对实体名识别更关键的特征,从而提高文本特征提取的准确性。在新闻数据集和微博数据集上的实验结果表明,神经网络模型的训练速度比传统的双向长短期记忆神经网络有显著提升,基于注意力的实体名识别方法的评价指标比传统的无注意力机制方法提高2%左右。 展开更多
关键词 实体名识别 注意力机制 膨胀卷积 长短期记忆网络 条件随机场
下载PDF
面向微博短文本的社交与概念化语义扩展搜索方法 被引量:4
12
作者 崔婉秋 杜军平 +2 位作者 寇菲菲 李志坚 Lee JangMyung 《计算机研究与发展》 EI CSCD 北大核心 2018年第8期1641-1652,共12页
充分挖掘微博短文本的语义以实现精准搜索是一项重要任务.由于微博文本内容具有稀疏性和语义局限性的特点,使得仅通过分析字面语义来进行短文本理解和相似性匹配的传统搜索方法受到了一定的限制.因此提出了一种社交与概念化语义结合的... 充分挖掘微博短文本的语义以实现精准搜索是一项重要任务.由于微博文本内容具有稀疏性和语义局限性的特点,使得仅通过分析字面语义来进行短文本理解和相似性匹配的传统搜索方法受到了一定的限制.因此提出了一种社交与概念化语义结合的扩展搜索方法,通过挖掘社交网络独特的社交属性如#标签#、"@"和链接信息URL,对微博短文本实现进一步的社交语义扩展.该方法将文本字面分析获取的概念词语和社交关系中潜在的关联标签信息相结合,对短文本进行2种角度下的语义特征表示,实现了基于微博短文本语义充分理解的精准搜索.在微博数据集上的对比实验表明,与已有的扩展搜索方法相比所提方法能捕捉更多的语义特征,微博搜索的性能也得到了显著的提升. 展开更多
关键词 微博短文本 社交与概念化语义 扩展搜索 概念词语 关联标签
下载PDF
基于时空信息增强的科技论文主题趋势预测 被引量:1
13
作者 郑长伟 薛哲 +2 位作者 梁美玉 杜军平 寇菲菲 《计算机工程与应用》 CSCD 北大核心 2023年第14期86-93,共8页
近年来,随着社会对科研投入的增大,各种领域的研究成果数量显著增加,准确有效地预测未来研究主题的趋势可以帮助科研人员发现未来研究热点,各种领域的研究成果数量显著增加,准确有效地预测未来研究主题的趋势可以帮助科研人员发现未来... 近年来,随着社会对科研投入的增大,各种领域的研究成果数量显著增加,准确有效地预测未来研究主题的趋势可以帮助科研人员发现未来研究热点,各种领域的研究成果数量显著增加,准确有效地预测未来研究主题的趋势可以帮助科研人员发现未来研究热点。然而由于各个研究主题之间关联逐渐紧密,大量研究主题之间存在一定的依赖关系,孤立地看待单个研究主题并采用传统的序列问题处理方法,无法有效地挖掘这些研究主题之间的空间依赖。为了同时捕获研究主题之间的空间依赖以及时间变化,提出了一种基于时空信息增强的科技论文主题趋势预测模型,该模型结合了图卷积神经网络(GCN)和时间卷积网络(TCN),具体来说,GCN用于学习研究主题的空间表示,并利用空间依赖加强空间特征,TCN用于学习研究主题趋势的动态变化,并根据时间距离计算加权损失进行优化。在论文数据集以及公开数据集上与当前主流的序列预测模型以及类似的时空模型进行了对比,实验结果表明,在研究主题预测任务以及其他动态图任务中,该模型可以有效捕获时空关系并且优于当前最新的基准算法。 展开更多
关键词 科技数据预测 图神经网络 动态图学习 膨胀卷积 时间序列预测
下载PDF
面向科技学术会议的命名实体识别研究 被引量:3
14
作者 于润羽 杜军平 +2 位作者 薛哲 徐欣 奚军庆 《智能系统学报》 CSCD 北大核心 2022年第1期50-58,共9页
针对通用领域的命名实体识别算法难以充分挖掘到科技学术会议论文数据中语义信息的问题,提出一种结合关键词-字符长短期记忆网络和注意力机制的科技学术会议命名实体识别算法。首先对论文数据集中的关键词特征进行预训练,获得词汇层面... 针对通用领域的命名实体识别算法难以充分挖掘到科技学术会议论文数据中语义信息的问题,提出一种结合关键词-字符长短期记忆网络和注意力机制的科技学术会议命名实体识别算法。首先对论文数据集中的关键词特征进行预训练,获得词汇层面的潜在语义信息,将其与字符级别的语义信息融合,解决错误的词汇边界影响识别准确率的问题。然后,将双向长短期记忆网络和注意力机制输出的向量进行融合,同时考虑上下文和全局信息。最后利用条件随机场进行实体的识别。实验表明,所提出的算法在不同数据集上都取得了较好的识别效果,和对比算法相比,准确率、召回率、F_(1)指数均有一定程度的提升。 展开更多
关键词 命名实体识别 长短期记忆网络 注意力机制 字词融合 精准画像 自然语言处理 信息抽取 预训练模型
下载PDF
基于多路交叉的用户金融行为预测 被引量:3
15
作者 程鹏超 杜军平 薛哲 《智能系统学报》 CSCD 北大核心 2021年第2期378-384,共7页
针对通过挖掘用户的金融行为来改善金融领域的服务模式和服务质量的问题,本文提出了一种基于多路交叉特征的用户金融行为预测算法。根据数据包含的属性构建训练的特征,基于因子分解机模型(FM)利用下游行为预测任务对金融数据的特征进行... 针对通过挖掘用户的金融行为来改善金融领域的服务模式和服务质量的问题,本文提出了一种基于多路交叉特征的用户金融行为预测算法。根据数据包含的属性构建训练的特征,基于因子分解机模型(FM)利用下游行为预测任务对金融数据的特征进行预训练,获取数据特征的隐含向量。引入特征交叉层对金融数据的高阶特征进行提取,解决FM线性模型只能提取低阶特征的缺点。利用残差网络对金融数据的高阶特征进行提取,解决深度神经网络在提取金融数据高阶特征时由于网络层数过深而导致的梯度消失的问题。最后,将FM、特征交叉网络和残差网络整合为统一的多塔模型进行用户金融行为预测,并融合低阶特征与高阶特征进行用户金融行为预测。在多个数据集上对算法的有效性进行了实验验证,实验结果表明,所提出的算法能够取得较好的用户金融行为预测的准确率。 展开更多
关键词 行为预测 金融 多路交叉 残差 多塔模型 预训练 挖掘 联合训练
下载PDF
基于字词混合和GRU的科技文本知识抽取方法 被引量:3
16
作者 欧阳苏宇 邵蓥侠 +1 位作者 杜军平 李昂 《广西科学》 CAS 北大核心 2022年第4期634-641,共8页
知识抽取任务是从非结构化的文本数据抽取三元组关系(头实体-关系-尾实体)。现有知识抽取方法分为流水式方法和联合抽取方法。流水式方法将命名实体识别和实体知识抽取分别用各自的模块抽取,这种方式虽然有较好的灵活性,但训练速度较慢... 知识抽取任务是从非结构化的文本数据抽取三元组关系(头实体-关系-尾实体)。现有知识抽取方法分为流水式方法和联合抽取方法。流水式方法将命名实体识别和实体知识抽取分别用各自的模块抽取,这种方式虽然有较好的灵活性,但训练速度较慢。联合抽取的学习模型是一种通过神经网络实现的端到端的模型,同时实现实体识别和知识抽取,能够很好地保留实体和关系之间的关联,将实体和关系的联合抽取转化为一个序列标注问题。基于此,本文提出了一种基于字词混合和门控制单元(Gated Recurrent Unit, GRU)的科技文本知识抽取(MBGAB)方法,结合注意力机制提取中文科技资源文本的关系;采用字词混合的向量映射方式,既在最大程度上避免边界切分出错,又有效融入语义信息;采用端到端的联合抽取模型,利用双向GRU网络,结合自注意力机制来有效捕获句子中的长距离语义信息,并且通过引入偏置权重来提高模型抽取效果。 展开更多
关键词 知识抽取 向量映射 GRU 三元组关系 联合抽取方法
下载PDF
基于多重注意力的金融事件大数据精准画像 被引量:3
17
作者 陈剑南 杜军平 +1 位作者 薛哲 寇菲菲 《计算机科学与探索》 CSCD 北大核心 2021年第7期1237-1244,共8页
随着知识图谱技术的兴起,利用金融事件大数据中的实体关系来构建金融事件的精准画像成为一个重要的研究方向。通过对金融事件大数据信息进行精准画像,人们可以详细分析金融事件大数据中的属性关系,全面了解金融事件的发展态势,从而分析... 随着知识图谱技术的兴起,利用金融事件大数据中的实体关系来构建金融事件的精准画像成为一个重要的研究方向。通过对金融事件大数据信息进行精准画像,人们可以详细分析金融事件大数据中的属性关系,全面了解金融事件的发展态势,从而分析金融市场发展趋势与规律。然而金融事件大数据存在文本数据噪音多、中文语义复杂以及实体关系抽取不准确等研究难点,导致金融事件大数据画像不精准。针对以上问题,提出一种基于多重注意力的金融事件大数据实体关系抽取算法(REMA)来进行实体关系的抽取,然后利用抽取的实体关系信息结合知识图谱技术进行金融事件大数据的精准画像。实验结果表明:在不使用外部资源的情况下,该算法在金融事件大数据中实体关系抽取的准确率、召回率以及F1值比其他对比算法均有所提升,其中准确率提升了5.6个百分点,召回率提升了4.6个百分点,F1值提升了5个百分点。 展开更多
关键词 金融事件大数据 精准画像 多重注意力机制 实体关系抽取
下载PDF
基于Transformer与技术词信息的知识产权实体识别方法 被引量:1
18
作者 王宇晖 杜军平 邵蓥侠 《智能系统学报》 CSCD 北大核心 2023年第1期186-193,共8页
专利文本中包含了大量实体信息,通过命名实体识别可以从中抽取包含关键信息的知识产权实体信息,帮助研究人员更快了解专利内容。现有的命名实体提取方法难以充分利用专业词汇变化带来的词层面的语义信息。本文提出基于Transformer和技... 专利文本中包含了大量实体信息,通过命名实体识别可以从中抽取包含关键信息的知识产权实体信息,帮助研究人员更快了解专利内容。现有的命名实体提取方法难以充分利用专业词汇变化带来的词层面的语义信息。本文提出基于Transformer和技术词信息的知识产权实体提取方法,结合BERT语言方法提供精准的字向量表示,并在字向量生成过程中,加入利用字向量经迭代膨胀卷积网络提取的技术词信息,提高对知识产权实体的表征能力。最后使用引入相对位置编码的Transformer编码器,从字向量序列中学习文本的深层语义信息,并实现实体标签预测。在公开数据集和标注的专利数据集的实验结果表明,该方法提升了实体识别的准确性。 展开更多
关键词 中文命名实体识别 知识产权 Transformer编码器 信息融合 向量表示 科技大数据 专利 深度学习
下载PDF
基于知识图谱的科技成果智能查询系统 被引量:1
19
作者 徐欣 杜军平 薛哲 《计算机工程与应用》 CSCD 北大核心 2022年第22期116-122,共7页
科技成果数据呈现跨领域、跨学科特性,传统的信息查询检索技术已难以满足用户日益增长的智能化、精准化的科技成果信息获取需求。分析了知识图谱领域和信息检索领域的研究现状。采用网络爬虫从互联网中高效地爬取科技成果数据,利用实体... 科技成果数据呈现跨领域、跨学科特性,传统的信息查询检索技术已难以满足用户日益增长的智能化、精准化的科技成果信息获取需求。分析了知识图谱领域和信息检索领域的研究现状。采用网络爬虫从互联网中高效地爬取科技成果数据,利用实体识别和关系抽取技术识别和发现科技成果数据中的科技实体,构建科技成果知识图谱,并实现科技成果数据的结构化存储。基于ElasticSearch搜索引擎对科技实体构建高效索引,研究科技成果语义相似度计算方法,实现基于知识图谱的科技成果智能查询系统。实验结果验证了所构建的系统能够实现科技成果的高效查询以及相关主题内容的关联发现。 展开更多
关键词 科技成果 知识图谱 语义检索 智能查询
下载PDF
面向科技资讯的基于语义对抗和媒体对抗的跨媒体检索方法
20
作者 李昂 杜军平 +4 位作者 寇菲菲 薛哲 徐欣 许明英 姜阳 《计算机研究与发展》 EI CSCD 北大核心 2023年第11期2660-2670,共11页
科技资讯跨媒体检索是跨媒体领域的重要任务之一,面临着多媒体数据间异构鸿沟和语义鸿沟亟待打破的难题.通过跨媒体科技资讯检索,用户能够从多源异构的海量科技资源中获取目标科技资讯.这有助于设计出符合用户需求的应用,包括科技资讯... 科技资讯跨媒体检索是跨媒体领域的重要任务之一,面临着多媒体数据间异构鸿沟和语义鸿沟亟待打破的难题.通过跨媒体科技资讯检索,用户能够从多源异构的海量科技资源中获取目标科技资讯.这有助于设计出符合用户需求的应用,包括科技资讯推荐、个性化科技资讯检索等.跨媒体检索研究的核心是学习一个公共子空间,使得不同媒体的数据在该子空间中可以直接相互比较.在子空间学习中,现有方法往往聚焦于建模媒体内数据的判别性和媒体间数据在映射后的不变性,却忽略了媒体间数据在映射前后的语义一致性和语义内的媒体判别性,使得跨媒体检索效果存在局限性.鉴于此,提出一种面向科技资讯的基于语义对抗和媒体对抗的跨媒体检索方法(SMCR),寻找可供映射的有效公共子空间.具体而言,SMCR在建模媒体内语义判别性之外,将媒体间语义一致性损失最小化,以保留映射前后的语义相似性.此外,SMCR构建基础特征映射网络和精炼特征映射网络,联合最小化语义内的媒体判别性损失,有效增强了特征映射网络混淆媒体判别网络的能力.在2个数据集上的大量实验结果表明,所提出的SMCR方法在跨媒体检索中的表现优于最前沿的方法. 展开更多
关键词 跨媒体检索 对抗学习 科技资讯 媒体约束 语义一致性
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部