期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于掩码提示与门控记忆网络校准的关系抽取方法
1
作者 魏超 陈艳平 +2 位作者 王凯 秦永彬 黄瑞章 《计算机应用》 CSCD 北大核心 2024年第6期1713-1719,共7页
针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权... 针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权重矩阵,将离散的掩码语义空间相互关联;其次,采用门控校准网络将含有实体和关系语义的掩码表示融入句子的全局语义;再次,将它们作为关系提示校准关系信息,随后将句子表示的最终表示映射至相应的关系类别;最后,通过更好地利用提示中掩码,并结合传统微调方法的学习句子全局语义的优势,充分激发PLM的潜力。实验结果表明,所提方法在SemEval(SemEval-2010 Task 8)数据集的F1值达到91.4%,相较于RELA(Relation Extraction with Label Augmentation)生成式方法提高了1.0个百分点;在SciERC(Entities, Relations, and Coreference for Scientific knowledge graph construction)和CLTC(Chinese Literature Text Corpus)数据集上的F1值分别达到91.0%和82.8%。所提方法在上述3个数据集上均明显优于对比方法,验证了所提方法的有效性。相较于基于生成式的方法,所提方法实现了更优的抽取性能。 展开更多
关键词 关系抽取 掩码 门控神经网络 预训练语言模型 提示学习
下载PDF
面向机器阅读理解的边界感知方法
2
作者 刘青 陈艳平 +2 位作者 邹安琪 黄瑞章 秦永彬 《计算机应用》 CSCD 北大核心 2024年第7期2004-2010,共7页
针对现有的基于预训练语言模型的答案获取方法存在预测边界不够准确的问题,提出一种面向片段抽取式机器阅读理解(MRC)的边界感知方法。首先,在问题输入阶段引入特殊字符标记问题边界,通过增强问题语义信息的方式实现对问题边界的感知;其... 针对现有的基于预训练语言模型的答案获取方法存在预测边界不够准确的问题,提出一种面向片段抽取式机器阅读理解(MRC)的边界感知方法。首先,在问题输入阶段引入特殊字符标记问题边界,通过增强问题语义信息的方式实现对问题边界的感知;其次,在答案预测阶段,构建答案边界回归器,实现感知的问题边界语义信息与输出的预测答案边界语义信息的语义交互;最后,通过交互后的语义信息进一步调整存在偏差的预测答案边界,实现对预测答案的校准。实验结果表明,与SpanBERT(Span-based Bidirectional Encoder Representation from Transformers)相比,该方法在公共数据集SQuAD(Stanford Question Answering Dataset)1.1上的F1值提升了0.2个百分点、精确匹配(EM)值提升了0.9个百分点;在HotpotQA(Hotpot Question Answering)数据集上的F1值和EM值都提升了0.7个百分点;在NewsQA(News Question Answering)数据集上的F1值提升了2.8个百分点、EM值提升了3.3个百分点。可见,该方法能有效增强对问题边界信息的感知并且实现对预测答案边界的校准,有利于更好地理解和分析文本数据,在智能问答、智能客服等领域的应用中提高系统的准确性。 展开更多
关键词 机器阅读理解 问题边界感知 答案边界回归 片段抽取
下载PDF
融合行为词的罪名预测多任务学习模型
3
作者 郭晓 陈艳平 +2 位作者 唐瑞雪 黄瑞章 秦永彬 《计算机应用》 CSCD 北大核心 2024年第1期159-166,共8页
随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题... 随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题,提出一种融合行为词的罪名预测多任务学习模型。首先,由边界识别器生成行为词跨度,提炼出案情核心内容;其次,通过构建行为词的结构特征预测所属罪名;最后,将行为词识别和罪名预测进行统一建模,通过共享参数的方式增强模型的泛化能力。通过构建行为词识别和罪名预测的多任务数据集进行验证,实验结果表明该模型识别行为词任务的F值达到了83.27%,罪名预测任务的F值达到了84.29%,与BERT-CNN模型相比,分别提高了0.57%和2.61%,验证了该模型对行为词识别和罪名预测的优势。 展开更多
关键词 罪名预测 行为词 边界识别 图卷积神经网络 多任务学习
下载PDF
云资源调度的回答集程序描述性求解
4
作者 王卫舵 王以松 杨磊 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期94-104,共11页
针对求解难度为NP完全的基础设施即服务(IaaS)模式云资源调度问题,本文提出一种基于回答集程序(ASP)的描述性优化求解方法,并对其正确性进行分析。首先,把满足虚拟机CPU使用的情况下关闭尽可能多的主机做为减少云平台能耗的方法,将云资... 针对求解难度为NP完全的基础设施即服务(IaaS)模式云资源调度问题,本文提出一种基于回答集程序(ASP)的描述性优化求解方法,并对其正确性进行分析。首先,把满足虚拟机CPU使用的情况下关闭尽可能多的主机做为减少云平台能耗的方法,将云资源调度问题形式化表述;其次,结合形式化描述以及减少云平台能耗的策略,将云资源调度问题用ASP编码为描述性(优化)问题,并分析其正确性;最后,在公开的PlanetLab数据集上进行实验,结果显示,ASP方法可在保障服务质量的同时减少集群能耗,最高可节能13%以上。这表明ASP方法在云资源调度问题上是有效的,从而提供一种易理解、易修改并能充分利用ASP最新工具成果的有效云资源调度新方法。 展开更多
关键词 回答集程序 云资源调度 多目标优化 约束满足问题 能耗
下载PDF
基于事件表示和对比学习的深度事件聚类方法
5
作者 蒋小霞 黄瑞章 +2 位作者 白瑞娜 任丽娜 陈艳平 《计算机应用》 CSCD 北大核心 2024年第6期1734-1742,共9页
针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出一种基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,利用信息识别手段从非结构化文本中识别结构化的事件信息,避免冗余信息对事件语义... 针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出一种基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,利用信息识别手段从非结构化文本中识别结构化的事件信息,避免冗余信息对事件语义的影响;其次,将事件的结构信息集成于自编码器中学习低维稠密的事件表示,并以此作为下游聚类划分的依据;最后,为有效建模事件之间的细微差异,在特征学习过程中加入多正例对比损失。在数据集DuEE、FewFC、Military和ACE2005上的实验结果表明,相较于其他深度聚类方法,所提方法在准确率和标准化互信息(NMI)评价指标上均表现更好;相较于次优的方法,DEC_ERCL的聚类准确率分别提升了17.85%、9.26%、7.36%和33.54%,表明了DEC_ERCL具有更好的事件聚类效果。 展开更多
关键词 深度聚类 文本聚类 事件表示 事件结构 对比学习
下载PDF
基于多尺度混合注意力卷积神经网络的关系抽取模型
6
作者 唐媛 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 CSCD 北大核心 2024年第7期2011-2017,共7页
针对基于卷积神经网络(CNN)的关系抽取获取句子语义信息时缺少不同尺度语义特征信息的获取以及对关键信息的关注的问题,提出基于多尺度混合注意力CNN的关系抽取模型。首先,将关系抽取建模为二维化表示的标签预测;其次,通过多尺度的特征... 针对基于卷积神经网络(CNN)的关系抽取获取句子语义信息时缺少不同尺度语义特征信息的获取以及对关键信息的关注的问题,提出基于多尺度混合注意力CNN的关系抽取模型。首先,将关系抽取建模为二维化表示的标签预测;其次,通过多尺度的特征信息提取与融合,获得更细粒度的多尺度空间信息;然后,通过注意力与卷积的结合自适应地细化特征图,使模型关注重要的上下文信息;最后,使用两个预测器共同预测实体对之间的关系标签。实验结果表明,多尺度混合卷积注意力模型能够获取多尺度语义特征信息,而通道注意力和空间注意力通过权重捕捉通道和空间的关键信息,以此来提升关系抽取的性能。所提模型在数据集SemEval(SemEval-2010 task 8)、TACRED(TAC Relation Extraction Dataset)、Re-TACRED(Revised-TACRED)和SciERC(Entities,Relations,and Coreference for Scientific knowledge graph construction)上的F1值分别达到90.32%、70.74%、85.71%和89.66%。 展开更多
关键词 关系抽取 二维化表示 通道注意力 空间注意力 多尺度语义特征
下载PDF
理性与可验证的联邦学习框架
7
作者 吴柿红 田有亮 《软件学报》 EI CSCD 北大核心 2024年第3期1418-1439,共22页
联邦学习作为解决数据孤岛问题的有效方法,在服务器计算全部梯度的过程中,由于服务器的惰性和自利性会存在全局梯度不正确计算问题,因此需要验证全局梯度的完整性.现有的基于密码算法的方案验证开销过大.针对这些问题,提出一种理性与可... 联邦学习作为解决数据孤岛问题的有效方法,在服务器计算全部梯度的过程中,由于服务器的惰性和自利性会存在全局梯度不正确计算问题,因此需要验证全局梯度的完整性.现有的基于密码算法的方案验证开销过大.针对这些问题,提出一种理性与可验证的联邦学习框架.首先,结合博弈论,设计囚徒合约与背叛合约迫使服务器诚实.其次,所提方案使用基于复制的验证方案实现全局梯度的完整性验证,且支持客户端离线.最后,经分析证明所提方案的正确性,并经实验表明,该方案与已有的验证算法相比,客户端的计算开销降为0,一次迭代的通信轮数由原来的3轮优化到2轮,且训练开销与客户端的离线率成反比. 展开更多
关键词 联邦学习 博弈论 囚徒合约 背叛合约 数据完整性
下载PDF
基于生成对抗网络的联邦学习深度影子防御方案
8
作者 周辉 陈玉玲 +2 位作者 王学伟 张洋文 何建江 《计算机应用》 CSCD 北大核心 2024年第1期223-232,共10页
联邦学习(FL)可以使用户在不直接上传原始数据的条件下完成多方数据共享和交互,有效降低隐私泄露风险。然而,现有的研究表明敌手仍可以通过共享的梯度信息重构出原始数据。为进一步保护联邦学习隐私,基于生成对抗网络(GAN)提出一种联邦... 联邦学习(FL)可以使用户在不直接上传原始数据的条件下完成多方数据共享和交互,有效降低隐私泄露风险。然而,现有的研究表明敌手仍可以通过共享的梯度信息重构出原始数据。为进一步保护联邦学习隐私,基于生成对抗网络(GAN)提出一种联邦学习深度影子防御方案。首先,通过生成对抗网络学习原始真实数据分布特征,并生成可替代的影子数据;然后,通过影子数据训练影子模型替代原始模型,敌手无法直接获取真实数据训练过的原始模型;最后,利用影子数据在影子模型中产生的影子梯度替代真实梯度,使敌手无法获取真实梯度。在CIFAR10和CIFAR100数据集上进行了实验:与添加噪声、梯度裁剪、梯度压缩、表征扰动和局部正则化稀疏化五种防御方案相比,在CIFAR10数据集上所提方案的均方误差(MSE)是对比方案的1.18~5.34倍,特征均方误差(FMSE)是对比方案的4.46~1.03×10^(7)倍,峰值信噪比(PSNR)是对比方案的49.9%~90.8%;在CIFAR100数据集上的MSE是对比方案的1.04~1.06倍,FMSE是对比方案的5.93~4.24×10^(3)倍,PSNR是对比方案的96.0%~97.6%。相较于深度影子防御方法,所提方案考虑了敌手的实际攻击能力和影子模型训练存在的问题,设计了威胁模型和影子模型生成算法,在理论分析和实验方面表现更好,而且能够在保证准确率的前提下有效降低联邦学习隐私泄露风险。 展开更多
关键词 联邦学习 生成对抗网络 梯度反演 隐私保护 防御方案
下载PDF
Spark框架下支持差分隐私保护的K-means++聚类方法
9
作者 石江南 彭长根 谭伟杰 《信息安全研究》 CSCD 北大核心 2024年第8期712-718,共7页
针对差分隐私聚类算法在处理海量数据时其隐私性和可用性之间的矛盾,提出了一种分布式环境下支持差分隐私的K-means++聚类算法.该算法通过内存计算引擎Spark,创建弹性分布式数据集,利用转换算子及行动算子操作数据进行运算,并在选取初... 针对差分隐私聚类算法在处理海量数据时其隐私性和可用性之间的矛盾,提出了一种分布式环境下支持差分隐私的K-means++聚类算法.该算法通过内存计算引擎Spark,创建弹性分布式数据集,利用转换算子及行动算子操作数据进行运算,并在选取初始化中心点及迭代更新中心点的过程中,通过综合利用指数机制和拉普拉斯机制,以解决初始聚类中心敏感及隐私泄露问题,同时减少计算过程中对数据实施的扰动.根据差分隐私的特性,从理论角度对整个算法进行证明,以满足ε-差分隐私保护.实验结果证明了该方法在确保聚类结果可用性的前提下,具备出色的隐私保护能力和高效的运行效率. 展开更多
关键词 数据挖掘 聚类算法 差分隐私 Spark框架 指数机制
下载PDF
基于ARCI的高职院校大数据专业Python课程教学模式研究 被引量:3
10
作者 汤卫 杨赟 +1 位作者 陈玉玲 杨茂松 《计算机教育》 2019年第12期122-126,共5页
针对高职院校大数据专业Python课程教学模式改革现状,提出基于应用倒逼教学融合的教学模式,分析Python课程现状和问题,明确课程必要性和重要性;指出现有的Python教学模式及ARCI教学模式等问题,设计课程考评和反馈机制,助力培养学生的思... 针对高职院校大数据专业Python课程教学模式改革现状,提出基于应用倒逼教学融合的教学模式,分析Python课程现状和问题,明确课程必要性和重要性;指出现有的Python教学模式及ARCI教学模式等问题,设计课程考评和反馈机制,助力培养学生的思维和实际应用能力。 展开更多
关键词 Python课程 ARCI教学模式 教学过程 考评反馈
下载PDF
大学生数学建模思维的培养模式分析 被引量:2
11
作者 汤卫 陈玉玲 杨赟 《贵州广播电视大学学报》 2020年第4期60-65,共6页
文章以数学建模和数学模型的关系为基础,分析阐述数学思想和数学思维的关系,同时借助数学建模课程的实践方法,重点分析课程教学中存在的相关问题。针对数学建模思维的培养,文章提出了一种基于案例研讨的教学模式,主要从基础理论的构建... 文章以数学建模和数学模型的关系为基础,分析阐述数学思想和数学思维的关系,同时借助数学建模课程的实践方法,重点分析课程教学中存在的相关问题。针对数学建模思维的培养,文章提出了一种基于案例研讨的教学模式,主要从基础理论的构建、案例研讨的实施要点和数学建模竞赛等三个方面进行分析和总结,重点阐述如何从案例研讨中获取数学建模思维能力和创新思维能力,全方位提高学生的综合实践能力。 展开更多
关键词 数学建模 数学思想 建模思维培养 案例研讨 数学建模竞赛
下载PDF
公安警犬技术建设和运行模式研究——以贵州省仁怀市公安局警犬中队为视角 被引量:1
12
作者 刘枧 张涅 《贵州警察学院学报》 2021年第5期77-83,共7页
警犬技术是刑事技术的一种,在公安工作中广泛应用。贵州省仁怀市公安局警犬中队工作现状以及存在的问题,说明加强贵州警犬技术建设的必要性。研究公安警犬技术的建设方向,公安警犬技术的指挥模式、出勘模式和保障模式等运行模式,对全面... 警犬技术是刑事技术的一种,在公安工作中广泛应用。贵州省仁怀市公安局警犬中队工作现状以及存在的问题,说明加强贵州警犬技术建设的必要性。研究公安警犬技术的建设方向,公安警犬技术的指挥模式、出勘模式和保障模式等运行模式,对全面提高警犬技术工作效益具有重要意义。 展开更多
关键词 公安警犬技术 建设方向 运行模式
下载PDF
基于改进YOLOX的轻量型垃圾分类检测方法 被引量:2
13
作者 李洋 苟刚 《广西师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期80-90,共11页
生活垃圾分类是保护生态环境、促进绿色和谐发展的有效措施。针对移动端设备计算资源和内存有限,重量级模型难以嵌入等问题,本文提出一种基于改进YOLOX-tiny轻量型的垃圾分类检测方法。首先,使用EIoU替换原来的IoU损失函数,能加速收敛,... 生活垃圾分类是保护生态环境、促进绿色和谐发展的有效措施。针对移动端设备计算资源和内存有限,重量级模型难以嵌入等问题,本文提出一种基于改进YOLOX-tiny轻量型的垃圾分类检测方法。首先,使用EIoU替换原来的IoU损失函数,能加速收敛,提升检测精度;其次,在颈部网络引入注意力机制CBAM,对不同通道的权重重新分配,获取更多浅层的细粒度特征和深层的语义信息;最后,使用GhostBottleneck模块替换特征提取网络中的CSP模块,保留更多边缘信息,同时降低参数量,使模型轻量化。在华为云垃圾数据集上的实验结果表明,改进的算法与YOLOX-tiny相比,参数量降低至原来的87.97%,精度提升了0.3个百分点,在TrashNet数据集上的实验效果提升了0.36个百分点,从而证明了本文算法的有效性,该算法有利于嵌入移动端设备使用,具有一定的实用价值。 展开更多
关键词 垃圾分类 YOLOX 轻量型网络 EIoU CBAM GhostBottleneck
下载PDF
动态环境下视觉定位与建图的运动分割研究进展 被引量:1
14
作者 朱东莹 钟勇 +1 位作者 杨观赐 李杨 《计算机应用》 CSCD 北大核心 2023年第8期2537-2545,共9页
动态环境中视觉定位与建图系统受环境中动态物体的影响,定位与建图误差增加同时鲁棒性下降。而对输入图像的运动分割可显著提高动态环境下视觉定位与建图系统的性能。动态环境中的动态物体可分为运动物体与潜在运动物体。当前动态物体... 动态环境中视觉定位与建图系统受环境中动态物体的影响,定位与建图误差增加同时鲁棒性下降。而对输入图像的运动分割可显著提高动态环境下视觉定位与建图系统的性能。动态环境中的动态物体可分为运动物体与潜在运动物体。当前动态物体识别方法存在运动主体混乱、实时性差的问题。因此,综述了视觉定位与建图系统在动态环境下的运动分割策略。首先,从场景的预设条件出发,将运动分割策略分为基于图像主体静止假设方法、基于先验语义知识的方法和不引入假设的多传感融合方法;然后,对这三类方法进行总结,并分析各方法的准确性和实时性;最后,针对视觉定位与建图系统在动态环境下运动分割策略的准确性、实时性难以平衡的问题,讨论并展望了动态环境下运动分割方法的发展趋势。 展开更多
关键词 视觉定位与建图 动态环境 运动分割 实时性 移动机器人
下载PDF
CHAIN:基于重合支配的边缘计算节点放置算法 被引量:1
15
作者 赵徐炎 崔允贺 +4 位作者 蒋朝惠 钱清 申国伟 郭春 李显超 《计算机应用》 CSCD 北大核心 2023年第9期2812-2818,共7页
边缘计算将计算资源部署在离终端用户更近的边缘计算节点,从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量(QoS)。然而,目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外,... 边缘计算将计算资源部署在离终端用户更近的边缘计算节点,从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量(QoS)。然而,目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外,在边缘服务的时延等QoS因素的约束下,目前尚没有一种边缘计算节点部署算法能最大限度地提高边缘服务的鲁棒性同时最小化边缘节点部署成本。针对上述问题,首先,通过建立计算节点、用户传输时延和鲁棒性的模型将边缘计算节点放置问题转化为带约束条件的最小支配集问题;随后,提出重合支配的概念,基于重合支配衡量网络鲁棒性,设计了基于重合支配的边缘计算节点放置算法——CHAIN(edge server plaCement algoritHm based on overlApping domINation)。仿真实验结果表明,与面向覆盖的近似算法和面向基站的随机算法相比,CHAIN的系统时延降低了50.54%与50.13%。 展开更多
关键词 边缘计算 边缘计算节点放置 鲁棒性 部署成本 重合支配
下载PDF
面向热点新闻事件的层次化故事脉络生成方法 被引量:1
16
作者 刘东 林川 +1 位作者 任丽娜 黄瑞章 《计算机应用》 CSCD 北大核心 2023年第8期2376-2381,共6页
热点新闻事件的发展十分丰富,各个阶段的发展都有其独特的叙述,并且随着事件的发展呈现出层次化故事脉络演化的趋势。针对现有故事脉络生成方法存在脉络可解释性不佳以及缺乏层次性的问题,提出一种面向热点新闻事件的层次化故事脉络生... 热点新闻事件的发展十分丰富,各个阶段的发展都有其独特的叙述,并且随着事件的发展呈现出层次化故事脉络演化的趋势。针对现有故事脉络生成方法存在脉络可解释性不佳以及缺乏层次性的问题,提出一种面向热点新闻事件的层次化故事脉络生成方法(HSGM)。首先,采用改进热词算法来挑选主干种子事件,以构建主干脉络;其次,挑选分支事件热词以增强分支可解释性;然后,在分支脉络中采用融合热词关联度与动态时间惩罚的脉络连贯度挑选策略来增强父子事件的连接,以构建层次化热词,进而构建多层次故事脉络;此外,考虑到热点新闻事件存在潜伏期,在脉络构建过程加入孵化池以解决因热度不够所产生的初始事件被忽略问题。在两个自建真实数据集上进行实验的结果表明,在事件追踪过程中,与分别基于singlePass和基于k-means的方法相比,HSGM的F值分别高出了4.51%、6.41%和20.71%、13.01%;而在脉络构建过程中,与Story Forest和Story Graph相比,HSGM在两个自建数据集上的准确性、可理解性、完整性方面表现良好。 展开更多
关键词 故事脉络 热点新闻事件 故事树 事件演化 聚类
下载PDF
基于多层语义融合的结构化深度文本聚类模型 被引量:1
17
作者 马胜位 黄瑞章 +1 位作者 任丽娜 林川 《计算机应用》 CSCD 北大核心 2023年第8期2364-2369,共6页
近年来,由于图神经网络(GNN)的结构信息在机器学习中的优势,人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用,这导致在数据生成部分出现语义信息的缺失。针... 近年来,由于图神经网络(GNN)的结构信息在机器学习中的优势,人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用,这导致在数据生成部分出现语义信息的缺失。针对以上问题,提出了一种基于多层语义融合的结构化深度文本聚类模型(SDCMS)。该模型利用GNN将结构信息集成到解码器中,通过逐层语义补充增强了文本数据的表示,并通过三重自监督机制获得更好的网络参数。在Citeseer、Acm、Reutuers、Dblp、Abstract这5个真实数据集上进行实验的结果表明,与目前最优的注意力驱动的图形聚类网络(AGCN)模型相比,SDCMS在准确率、归一化互信息(NMI)和平均兰德指数(ARI)上分别最多提升了5.853%、9.922%和8.142%。 展开更多
关键词 深度文本聚类 逐层语义增强 文本语义信息 图神经网络 自监督学习
下载PDF
基于多尺度阶梯时频Conformer GAN的语音增强算法 被引量:3
18
作者 金玉堂 王以松 +1 位作者 王丽会 赵鹏利 《计算机应用》 CSCD 北大核心 2023年第11期3607-3615,共9页
针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在... 针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在多个尺度上利用时间-频率Conformer学习时域和频域的全局及局部特征依赖;其次,利用Mask Decoder分支学习振幅掩码,而Complex Decoder分支则直接学习干净的语谱图,融合这两个Decoder分支的输出可得到重建后的语音;最后,利用指标判别器判别语音的评价指标得分,通过极大极小训练使生成器生成高质量的语音。采用主观评价平均意见得分(MOS)和客观评价指标在公开数据集VoiceBank+Demand上与各类语音增强模型进行对比,结果显示,所提算法的MOS信号失真(CSIG)和MOS噪声失真(CBAK)比目前最先进的方法CMGAN(基于Conformer的指标生成对抗网络语音增强模型)分别提高了0.04和0.07,尽管它的MOS整体语音质量(COVL)和语音质量的感知评估(PESQ)略低于CMGAN,但与其他对比模型相比在多项主客观语音质量评估方面的评分均处于领先水平。 展开更多
关键词 语音增强 多尺度 CONFORMER 生成对抗网络 指标判别器 深度学习
下载PDF
融合局部语义特征的学者细粒度信息提取方法 被引量:1
19
作者 田悦霖 黄瑞章 任丽娜 《计算机应用》 CSCD 北大核心 2023年第9期2707-2714,共8页
从学者主页中提取的学者细粒度信息(如学者研究方向、教育经历等)在大规模专业人才库的创建等方面具有非常重要的应用价值。针对现有学者细粒度信息提取方法无法有效利用上下文语义联系的问题,提出一种融合局部语义特征的学者信息提取方... 从学者主页中提取的学者细粒度信息(如学者研究方向、教育经历等)在大规模专业人才库的创建等方面具有非常重要的应用价值。针对现有学者细粒度信息提取方法无法有效利用上下文语义联系的问题,提出一种融合局部语义特征的学者信息提取方法,利用局部范围文本的语义联系对学者主页进行细粒度信息抽取。首先,通过全词掩码中文预训练模型RoBERTa-wwm-ext学习通用语义表征;之后将通用语义表征中的目标句表征向量与局部相邻文本表征向量共同输入卷积神经网络(CNN)实现局部语义融合,从而获得更高维度的目标句表征向量;最终将目标句表征向量从高维度空间映射到低维度标签空间实现学者主页细粒度信息的抽取。实验结果表明,使用此融合局部语义特征的方法进行学者细粒度信息提取的宏平均F1值达到93.43%,与未融合局部语义的RoBERTa-wwm-ext-TextCNN方法相比提高了8.60个百分点,验证了所提方法在学者细粒度信息提取任务上的有效性。 展开更多
关键词 学者信息提取 预训练模型 局部语义融合 TextCNN 特征提取
下载PDF
不经意传输协议研究综述 被引量:1
20
作者 高莹 李寒雨 +2 位作者 王玮 刘翔 陈洁 《软件学报》 EI CSCD 北大核心 2023年第4期1879-1906,共28页
在互联网快速发展、大数据的挖掘与应用已渗透到各行各业的今天,如何安全且高效地共享、使用海量数据成为新的热点研究问题.安全多方计算是解决该问题的关键技术之一,它允许一组参与方在不泄露隐私输入的前提下进行交互,共同计算一个函... 在互联网快速发展、大数据的挖掘与应用已渗透到各行各业的今天,如何安全且高效地共享、使用海量数据成为新的热点研究问题.安全多方计算是解决该问题的关键技术之一,它允许一组参与方在不泄露隐私输入的前提下进行交互,共同计算一个函数并得到输出结果.不经意传输协议,也叫茫然传输协议,是一种保护隐私的两方通信协议,消息发送者持有两条待发送的消息,接收者选择一条进行接收,事后发送者对接收者获取哪一条消息毫不知情,接收者对于未选择的消息也无法获取任何信息.不经意传输协议是安全多方计算技术的关键模块之一,其效率优化可有效推动安全多方计算技术的应用落地,对于特殊的两方安全计算协议如隐私集合交集计算尤为重要.总结了不经意传输协议的分类及几种常见的变体,分别阐述了基于公钥密码的不经意传输协议的构造和研究进展,以及不经意传输扩展协议的构造和研究进展,由此引出不经意传输扩展协议的效率优化研究的重要性.同时,在半诚实敌手和恶意敌手这两种敌手模型下,分别对不经意传输协议和不经意传输扩展协议的效率优化研究进展进行了全面梳理.另一方面,从应用角度对不经意传输协议和不经意传输扩展协议在工程实现中常用的优化技术进行了系统化分析.最后,总结了不经意传输协议和不经意传输扩展协议研究目前所面临的主要问题及未来发展趋势. 展开更多
关键词 不经意传输 不经意传输扩展协议 效率优化 安全多方计算 隐私集合交集计算
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部