期刊文献+
共找到239篇文章
< 1 2 12 >
每页显示 20 50 100
基于事件最大边界的密集视频描述方法
1
作者 陈劭武 胡慧君 刘茂福 《中国科技论文》 CAS 2024年第2期169-177,共9页
针对基于集合预测的密集视频描述方法由于缺乏显式的事件间特征交互且未针对事件间差异训练模型而导致的模型重复预测事件或生成语句雷同问题,提出一种基于事件最大边界的密集视频描述(dense video captioning based on event maximal m... 针对基于集合预测的密集视频描述方法由于缺乏显式的事件间特征交互且未针对事件间差异训练模型而导致的模型重复预测事件或生成语句雷同问题,提出一种基于事件最大边界的密集视频描述(dense video captioning based on event maximal margin,EMM-DVC)方法。事件边界是包含事件间特征相似度、事件在视频中时间位置的距离、生成描述多样性的评分。EMM-DVC通过最大化事件边界,使相似预测结果的距离远且预测结果和实际事件的距离近。另外,EMM-DVC引入事件边界距离损失函数,通过扩大事件边界距离,引导模型关注不同事件。在ActivityNet Captions数据集上的实验证明,EMM-DVC与同类密集视频描述模型相比能生成更具多样性的描述文本,并且与主流密集视频描述模型相比,EMM-DVC在多个指标上达到最优水平。 展开更多
关键词 密集视频描述 多任务学习 端到端模型 集合预测
下载PDF
基于串行及并行多任务学习网络的储层参数评价研究
2
作者 徐彬森 肖立志 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第4期1613-1626,共14页
选取基于串行还是并行多任务学习的储层参数评价网络建模是近期涌现的一个问题.本文以中国西部某油田老区储层参数试验数据为基础,对比20种不同的基础神经元模块组成的多任务学习网络的孔隙度、饱和度和渗透率评价结果,据此提出模型选... 选取基于串行还是并行多任务学习的储层参数评价网络建模是近期涌现的一个问题.本文以中国西部某油田老区储层参数试验数据为基础,对比20种不同的基础神经元模块组成的多任务学习网络的孔隙度、饱和度和渗透率评价结果,据此提出模型选择策略:确定系数为评价指标,选择串行而不是并行结构网络模型的条件为模型参数量小于1000的参考值;模型参数量大于1000时,串行多任务网络不如并行多任务网络.当平均绝对误差为评价指标时,选取串行多任务的前提是模型参数量小于10000的参考值.模型参数量大于10000时,串行和并行多任务网络结果具有一定相似性.如果平均绝对误差和模型参数量均在允许范围内,两种架构网络均可行.本文旨在为后续不同类型多任务学习网络架构模型设计及应用提供支持. 展开更多
关键词 多任务学习 储层参数 评价机制 模型策略
下载PDF
基于技能网络的通用自然语言生成模型
3
作者 廖俊伟 程帅 《中文信息学报》 CSCD 北大核心 2024年第3期141-151,共11页
使用多任务训练的自然语言生成模型仅使用一个模型即可完成各种不同的自然语言生成任务。但这种所有任务共享所有参数的模型,无法清楚地知道模型的每一部分参数学到了什么技能。为了根据不同的任务选择激活不同的模型参数,该文提出了一... 使用多任务训练的自然语言生成模型仅使用一个模型即可完成各种不同的自然语言生成任务。但这种所有任务共享所有参数的模型,无法清楚地知道模型的每一部分参数学到了什么技能。为了根据不同的任务选择激活不同的模型参数,该文提出了一种基于稀疏激活的通用自然语言生成模型(SkillNet-NLG)。与传统的稠密模型在执行任务时激活所有的模型参数不同,SkillNet-NLG在执行任务时,首先依据任务预先定义一组完成任务所需要的技能,然后根据定义的技能选择性地激活与技能相关的模型参数。这种模型设计使其能够通过正确地选择与任务相关的技能来高效地学习新的任务。在中文自然语言生成任务上的实验结果表明,首先,在仅使用一个模型的情况下,SkillNet-NLG在常见的五个自然语言生成任务中的四个上面超过了当前最好方法;其次,SkillNet-NLG的表现优于另外两类多任务基线模型(稠密模型和混合专家模型),并取得了与针对特定任务单独训练的模型相当的性能;最后,当应用到新任务上时,SkillNet-NLG相较于所有基线方法取得了更好的结果,验证了该文所提出的方法对于学习新任务的有效性。 展开更多
关键词 自然语言生成 多任务模型 稀疏激活模型 技能网络
下载PDF
一种空间多核操作系统容错调度算法
4
作者 王宇思 杨桦 徐建 《微电子学与计算机》 2024年第5期49-56,共8页
目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法... 目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法仅考虑任务分配问题,没有考虑到系统中某一核心出现故障时如何进行容错。FT-RTA算法是一种空间多核操作系统容错调度算法,当一个核心上出现瞬时故障,将故障核心上在故障时间段内的所有任务迁移至正常核心上执行,使计算机系统不会感知到此次核心故障,成功屏蔽故障。经过实际应用中的典型参数验证,算法可以成功屏蔽核心故障,进行系统无感知的容错。 展开更多
关键词 空间操作系统 多核处理器 容错调度算法 混合任务模型
下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
5
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
下载PDF
基于多任务学习的IT运维服务需求语义解析
6
作者 许明阳 刘振元 王承涛 《计算机集成制造系统》 EI CSCD 北大核心 2024年第2期673-683,共11页
IT运维服务的自动化水平影响着企业的运营效率,为实现基于无人坐席的智能服务台,提出一种IT运维服务需求语义解析方法,包括意图识别和命名实体识别两个任务。在Multi-BERT-BiLSTM-CRF(MBBC)基准模型之上,通过先验知识和外部资源将词性... IT运维服务的自动化水平影响着企业的运营效率,为实现基于无人坐席的智能服务台,提出一种IT运维服务需求语义解析方法,包括意图识别和命名实体识别两个任务。在Multi-BERT-BiLSTM-CRF(MBBC)基准模型之上,通过先验知识和外部资源将词性和实体词典特征融入编码层,增强模型对词法信息和领域知识的学习。对MBBC模型的参数共享方式进行改进,提出增强的MBBC模型模型,增强两个任务之间的信息共享能力。实验表明,与MBBC模型相比,融合词性与实体词典特征并采用增强的MBBC模型可以进一步提升两类任务的识别性能。 展开更多
关键词 IT运维服务 意图识别 命名实体识别 BERT模型 多任务学习
下载PDF
面向航空发动机的虚拟多人拆装任务的驱动方法
7
作者 曾秋玮 胡兆勇 +2 位作者 王志乐 张锐林 邹刚 《系统仿真学报》 CAS CSCD 北大核心 2024年第1期220-231,共12页
为满足虚拟多人协同拆装系统不同拆装任务的快速开发需求,提出一种可配置任务序列的数据驱动方法。以某型航空发动机样机为研究对象,研究了多人协同拆装的任务要素,对任务进行基于JS对象图谱(JavaScript Object notation,JSON)的参数化... 为满足虚拟多人协同拆装系统不同拆装任务的快速开发需求,提出一种可配置任务序列的数据驱动方法。以某型航空发动机样机为研究对象,研究了多人协同拆装的任务要素,对任务进行基于JS对象图谱(JavaScript Object notation,JSON)的参数化设计与表达,以JSON参数化文件驱动任务序列,定义每一步任务的交互操作。实践表明:该方法运用于多人协同拆装系统中,使系统具备可配置性,能根据自定义任务序列驱动任务流程;在多端大任务量的情况下,有效提升部署效率。 展开更多
关键词 虚拟拆装 多人协同 航空发动机 参数化模型 任务驱动
下载PDF
基于多任务学习的语音情感识别
8
作者 李云峰 闫祖龙 +2 位作者 高天 方昕 邹亮 《数据采集与处理》 CSCD 北大核心 2024年第2期424-432,共9页
在近期的语音情感识别研究中,研究人员尝试利用深度学习模型从语音信号中识别情感。然而,传统基于单任务学习的模型对语音的声学情感信息关注度不足,导致情感识别的准确率较低。鉴于此,本文提出了一种基于多任务学习、端到端的语音情感... 在近期的语音情感识别研究中,研究人员尝试利用深度学习模型从语音信号中识别情感。然而,传统基于单任务学习的模型对语音的声学情感信息关注度不足,导致情感识别的准确率较低。鉴于此,本文提出了一种基于多任务学习、端到端的语音情感识别网络,以挖掘语音中的声学情感,提升情感识别的准确率。为避免采用频域特征造成的信息损失,本文利用基于时域信号的Wav2vec2.0自监督网络作为模型的主干网络,提取语音的声学特征和语义特征,并利用注意力机制将两类特征进行融合作为自监督特征。为了充分利用语音中的声学情感信息,使用与情感有关的音素识别作为辅助任务,通过多任务学习挖掘自监督特征中的声学情感。在公开数据集IEMOCAP上的实验结果表明,本文提出的多任务学习模型实现了76.0%的加权准确率和76.9%的非加权准确率,相比传统单任务学习模型性能得到了明显提升。同时,消融实验验证了辅助任务和自监督网络微调策略的有效性。 展开更多
关键词 深度学习 多任务学习 语音情感识别 自监督模型 微调策略
下载PDF
基于Transformer的飞机状态预测
9
作者 王经纬 高艳鹍 +1 位作者 宋澣兴 刘一非 《计算机工程与设计》 北大核心 2024年第2期477-483,共7页
在非定常气动力下,为防止飞机进入危险状态,通过建模进行状态预测,是保障飞行安全的重要手段,传统方法建模过程复杂、工程化难度大且普适性不强。为更好解决大迎角下飞行状态预测,使用基于深度学习的时序序列预测方法,推测飞机的飞行状... 在非定常气动力下,为防止飞机进入危险状态,通过建模进行状态预测,是保障飞行安全的重要手段,传统方法建模过程复杂、工程化难度大且普适性不强。为更好解决大迎角下飞行状态预测,使用基于深度学习的时序序列预测方法,推测飞机的飞行状态,达到最大限度发掘飞机性能、保障飞行安全的目的。提出一种多任务Transformer模型,同时完成飞行状态参数回归和飞行状态分类。实验结果表明,相比于同类模型,该模型的预测性能有大幅提升。 展开更多
关键词 多任务 深度学习 时序预测 状态分类 气动力建模 大迎角 非定常气动力
下载PDF
基于Bert模型对不完整事件日志的多属性修复
10
作者 张振虎 王丽丽 《洛阳师范学院学报》 2024年第2期17-22,共6页
流程挖掘是从事件日志中自动构建流程模型,并利用其分析、增强、监测实际的业务流程.然而不完整的事件日志会严重影响流程挖掘的结果.因此,修复事件日志是提高过程挖掘结果准确性的举措之一.现有的修复事件日志技术主要修复事件日志中... 流程挖掘是从事件日志中自动构建流程模型,并利用其分析、增强、监测实际的业务流程.然而不完整的事件日志会严重影响流程挖掘的结果.因此,修复事件日志是提高过程挖掘结果准确性的举措之一.现有的修复事件日志技术主要修复事件日志中的缺失活动,很少考虑修复日志中多个缺失的属性.现实中日志除了活动缺失,还存在属性缺失现象.针对此问题,提出了一种基于Bert的神经网络模型,用来修复事件中多个属性的缺失.该方法从数据的角度出发,通过Bert模型的预训练任务学习事件中属性之间的依赖关系,根据属性的前后文信息预测缺失的属性值.最后使用公开可用的真实事件日志对所提出的方法进行实验评估,评估结果表明本文所提出方法可以修复事件日志中多属性的缺失,且验证了该方法的准确性. 展开更多
关键词 修复事件日志 缺失属性 Bert模型 预训练任务 多属性修复
下载PDF
跨领域推荐方法研究综述
11
作者 王婷 张悦 《长江信息通信》 2024年第2期173-175,182,共4页
近年来,随着信息技术的迅速发展的爆发性增长,这一爆发式增长推动了跨领域推荐系统的出现和发展。跨领域推荐系统的设计和实现面临着诸多挑战,包括数据异构性、领域知识融合等问题。因此,书写跨领域推荐方法的研究变得尤为重要。这些方... 近年来,随着信息技术的迅速发展的爆发性增长,这一爆发式增长推动了跨领域推荐系统的出现和发展。跨领域推荐系统的设计和实现面临着诸多挑战,包括数据异构性、领域知识融合等问题。因此,书写跨领域推荐方法的研究变得尤为重要。这些方法旨在有效地整合来自不同领域的数据和信息,同时保持推荐系统的高效性和准确性。为实现这一目标,研究者们提出了各种跨领域推荐方法,包括基于迁移学习方法、基于多任务学习的方法等跨领域推荐方法,文章将从处理步骤及优缺点梳理各跨领域推荐系统方法。 展开更多
关键词 迁移学习 多任务学习 共享表示学习 迁移策略学习 元学习 混合方法学习 基于主题模型和知识图像学习
下载PDF
MoM-PO/SBR Algorithm Based on Collaborative Platform and Mixed Model
12
作者 TANG Xiaobin FENG Yuan GONG Xiaoyan 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2019年第4期589-598,共10页
For electromagnetic scattering of 3?D complex electrically large conducting targets,a new hybrid algorithm,MoM?PO/SBR algorithm,is presented to realize the interaction of information between method of moment(MoM)and p... For electromagnetic scattering of 3?D complex electrically large conducting targets,a new hybrid algorithm,MoM?PO/SBR algorithm,is presented to realize the interaction of information between method of moment(MoM)and physical optics(PO)/shooting and bouncing ray(SBR).In the algorithm,the COC file that based on the Huygens equivalent principle is introduced,and the conversion interface between the equivalent surface and the target is established.And then,the multi?task flow model presented in this paper is adopted to conduct CPU/graphics processing unit(GPU)tests of the algorithm under three modes,i.e.,MPI/OpenMP,MPI/compute unified device architecture(CUDA)and multi?task programming model(MTPM).Numerical results are presented and compared with reference solutions in order to illustrate the accuracy and the efficiency of the proposed algorithm. 展开更多
关键词 graphics processing unit(GPU) multitask programming model(MTPM) physical optics(PO) method of moment(MoM)
下载PDF
MODEL-BASED DEVELOPMENT OF REAL-TIME SOFTWARE SYSTEM FOR ELECTRONIC UNIT PUMP SYSTEM 被引量:1
13
作者 YU Shitao YANG Shiwei YANG Lin GONG Yuanming ZHUO Bin 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2007年第1期25-30,共6页
A real-time operating system (RTOS), also named OS, is designed based on the hardware platform of MC68376, and is implemented in the electronic control system for unit pump in diesel engine. A parallel and time-base... A real-time operating system (RTOS), also named OS, is designed based on the hardware platform of MC68376, and is implemented in the electronic control system for unit pump in diesel engine. A parallel and time-based task division method is introduced and the multi-task software architecture is built in the software system for electronic unit pump (EUP) system. The V-model software development process is used to control algorithm of each task. The simulation results of the hardware-in-the-loop simulation system (HILSS) and the engine experimental results show that the OS is an efficient real-time kernel, and can meet the real-time demands of EUP system; The built multi-task software system is real-time, determinate and reliable. V-model development is a good development process of control algorithms for EUP system, the control precision of control system can be ensured, and the development cycle and cost are also decreased. 展开更多
关键词 Real-time operating system (RTOS) multi-task V-model development Hardware-in-the-loop simulation system(HILSS) Electronic unit pump (EUP)
下载PDF
一种局部信息增强与对话结构感知的多轮对话模型
14
作者 廖彬 陈泽林 陈羽中 《小型微型计算机系统》 CSCD 北大核心 2023年第11期2408-2415,共8页
多轮对话是人工智能领域的一个重要分支.如何从多轮对话上下文中正确提取与问题相关的核心内容是多轮对话任务的关键问题.现有模型存在辅助任务低效,对全局与局部信息的筛选不够充分,对较短的多轮对话数据学习能力不足等问题.针对上述问... 多轮对话是人工智能领域的一个重要分支.如何从多轮对话上下文中正确提取与问题相关的核心内容是多轮对话任务的关键问题.现有模型存在辅助任务低效,对全局与局部信息的筛选不够充分,对较短的多轮对话数据学习能力不足等问题.针对上述问题,本文提出了一种局部信息增强且能够感知对话结构的多轮对话模型(Structure-aware Dialogue Model with Fine-grained Local Information,SAFL).针对子任务训练代价大的问题,提出了随机滑动窗口回复预测任务,在多轮对话上下文中的不同位置与大小的窗口内进行回复预测,充分学习细粒度的局部对话语义.针对信息筛选不够充分的问题,提出了重点局部信息蒸馏机制,借助多门控融合方法从全局和局部信息之中蒸馏出重点信息,提升模型融合效果.针对模型对较短的多轮对话上下文学习能力不足的问题,提出阶段信息学习机制,在微调前加强预训练语言模型对短多轮对话数据的领域学习,降低微调阶段中对短多轮对话的学习难度.此外,SAFL设计了对话结构感知任务在对话结构方面进一步加强模型对对话上下文的理解能力.Ubuntu和E-commerce数据集上的实验结果表明,SAFL模型的总体性能优于对比模型. 展开更多
关键词 多轮对话 多任务学习 预训练语言模型 门控机制 局部信息
下载PDF
基于MMoE和GRU的PMU数据有损压缩算法
15
作者 王守相 张晟 +2 位作者 郭陆阳 容春艳 柴林杰 《电力系统及其自动化学报》 CSCD 北大核心 2023年第3期29-37,共9页
为解决同步向量量测装置广泛部署带来的数据冗余度与数据量快速增长、系统数据储存及传输成本大幅增加的问题,本文提出一种基于多任务学习和门控循环单元自编码器的有损数据压缩算法。首先,根据同步向量量测装置三相量测数据具有相关性... 为解决同步向量量测装置广泛部署带来的数据冗余度与数据量快速增长、系统数据储存及传输成本大幅增加的问题,本文提出一种基于多任务学习和门控循环单元自编码器的有损数据压缩算法。首先,根据同步向量量测装置三相量测数据具有相关性的特点,采用多门控混合专家模型和门控循环单元构建了变分自编码器一次数据压缩模型,将各相数据进行特征融合,利用多任务学习挖掘三相量测数据之间的相关性;其次,使用无损压缩算法对一次压缩数据进行二次压缩,得到最终压缩数据;最后,通过算例分析表明,所提算法能够充分利用各相数据之间的相关性,实现对压缩数据的高精度重构,提高数据压缩效率。 展开更多
关键词 同步向量量测装置 数据压缩 多任务学习 多门控混合专家模型
下载PDF
基于多任务学习的机票价格预测模型
16
作者 卢敏 贾玉璇 《计算机工程与设计》 北大核心 2023年第8期2459-2464,共6页
针对现有机票销售模型忽视不同票价等级需求问题,考虑到机票需求的影响,提出一种多任务学习模型预测机票价格。在机票价格预测中引入辅助任务机票需求预测,建立多任务学习网络,通过共享相关任务在日、周、半月、月等水平上的多尺度需求... 针对现有机票销售模型忽视不同票价等级需求问题,考虑到机票需求的影响,提出一种多任务学习模型预测机票价格。在机票价格预测中引入辅助任务机票需求预测,建立多任务学习网络,通过共享相关任务在日、周、半月、月等水平上的多尺度需求特征,分析不同周期需求特征的影响。在六千万条记录的真实数据集上的实验结果表明,较之基准算法,该模型在准确率和F1分数方面提高了将近6%,验证了多任务学习模型的有效性。 展开更多
关键词 机票价格预测 机票需求 多尺度需求特征 多任务学习 卷积神经网络 残差网络 分类器模型
下载PDF
基于多STA-GLN集成模型的电力系统暂态稳定评估方法
17
作者 杨波 李成雲 +3 位作者 吕浩轩 周博文 李广地 谷鹏 《综合智慧能源》 CAS 2023年第7期48-60,共13页
随着高比例可再生能源的不断接入和电力电子化程度的提高,电力系统结构日益复杂,导致电力系统稳定性受威胁。针对基于人工智能的暂态稳定评估(TSA)方法存在的拓扑适应能力差、失稳样本学习困难和模型训练耗时长等缺陷,提出了基于图形卷... 随着高比例可再生能源的不断接入和电力电子化程度的提高,电力系统结构日益复杂,导致电力系统稳定性受威胁。针对基于人工智能的暂态稳定评估(TSA)方法存在的拓扑适应能力差、失稳样本学习困难和模型训练耗时长等缺陷,提出了基于图形卷积和长短时记忆组合网络的空间和时间双注意力机制(STA-GLN)集成电力系统TSA方法。搭建了电力系统仿真模型,在全接线、N-1断线和N-2断线3种拓扑结构下设置不同线路故障,获取原始样本集,基于STA-GLN的TSA方法对系统拓扑变化表现出更强的适应性和评估准确性;构建了基于自适应增强(AdaBoost)算法和迁移学习的集成STA-GLN多任务TSA模型,解决了失稳误判问题并加快了模型的响应速度。最后通过新英格兰10机39节点系统仿真分析验证了该方法的有效性。 展开更多
关键词 电力系统 可再生能源 暂态稳定评估 人工智能 集成学习 迁移学习 多任务模型 电力电子化
下载PDF
基于改进Faster R-CNN的手部位姿估计方法 被引量:3
18
作者 郑涵 田猛 +1 位作者 赵延峰 王先培 《科学技术与工程》 北大核心 2023年第3期1160-1167,共8页
基于视觉的手部位姿估计技术应用于诸多领域,具备着广泛的国际应用市场前景和巨大发展潜力。然而,手部自身存在检测目标过小、手指高自由度以及手部自遮挡等问题。通过对目前存在的难点分析,将手部位姿估计任务分为手部检测和手部关键... 基于视觉的手部位姿估计技术应用于诸多领域,具备着广泛的国际应用市场前景和巨大发展潜力。然而,手部自身存在检测目标过小、手指高自由度以及手部自遮挡等问题。通过对目前存在的难点分析,将手部位姿估计任务分为手部检测和手部关键点检测,提出基于改进的Faster R-CNN的手部位姿估计方法。首先提出基于改进的Faster R-CNN手部检测网络,将传统Faster R-CNN网络中的对ROI(regional of interest)的最大值池化,更改为ROI Align,并增加损失函数用于区分左右手。在此基础上增加了头网络分支用以训练输出MANO(hand model with articulated and non-rigid deformations)手部模型的姿态参数和形状参数,得到手部关键点三维坐标,最终得到手部的三维位姿估计结果。实验表明,手部检测结果中存在的自遮挡和尺度问题得到了解决,并且检测结果的准确性有所提高,本文手部检测算法准确率为85%,比传统Faster R-CNN算法提升13%。手部关键点提取算法在MSRA、ICVL、NYU三个数据集分别取得关键点坐标的均方误差值(key-point mean square error,KMSE)为7.50、6.32、8.50的结果。 展开更多
关键词 位姿估计 Faster R-CNN 手部检测 MANO模型 多任务网络
下载PDF
一种多任务学习的跨模态视频情感分析方法 被引量:1
19
作者 缪裕青 董晗 +3 位作者 张万桢 周明 蔡国永 杜华巍 《计算机工程与应用》 CSCD 北大核心 2023年第12期141-147,共7页
针对现有跨模态视频情感分析模型中模态融合不充分、空间复杂度较高以及较少考虑说话人本身属性对情感影响等问题,提出了一种结合多头注意力与多任务学习的跨模态视频情感分析模型。对视频进行预处理,得到视频、音频、文本三个模态的特... 针对现有跨模态视频情感分析模型中模态融合不充分、空间复杂度较高以及较少考虑说话人本身属性对情感影响等问题,提出了一种结合多头注意力与多任务学习的跨模态视频情感分析模型。对视频进行预处理,得到视频、音频、文本三个模态的特征表示。将得到的特征表示分别输入到GRU网络以提取时序特征。利用所提出的最大池化多头注意力机制,实现文本与视频、文本与音频的两两融合。将融合后的特征输入到情感分类与性别分类多任务网络得到说话人的情感极性与性别属性。实验结果表明,所提模型能够较好地利用模态间的差异信息与说话人性别属性,在有效提升情感识别准确率的同时降低了模型的空间复杂度。 展开更多
关键词 视频情感分析 模态融合 多头注意力 多任务学习 模型复杂度
下载PDF
基于多任务上下文增强的花椒检测模型 被引量:1
20
作者 杨前 刘兴科 +2 位作者 罗建桥 刘雪垠 李柏林 《机械制造与自动化》 2023年第1期113-118,149,共7页
花椒视觉采摘系统需要检测当前场景中的近景花椒。针对现有检测网络容易混淆相似外观的近景和远景花椒,难以准确检测近景花椒的问题,利用近景花椒与附近枝干的共生现象来区分近/远景花椒,提出基于多任务上下文增强的花椒检测模型。将枝... 花椒视觉采摘系统需要检测当前场景中的近景花椒。针对现有检测网络容易混淆相似外观的近景和远景花椒,难以准确检测近景花椒的问题,利用近景花椒与附近枝干的共生现象来区分近/远景花椒,提出基于多任务上下文增强的花椒检测模型。将枝干分割任务被加入目标检测网络中,用于引导全局特征同时表达花椒外观信息和枝干上下文信息;再为每个任务设计注意力模块调整全局特征,避免任务间的干扰。真实花椒数据实验结果表明:所提模型的精度相比YOLOv4、RetinaNet和SSD分别提高12.28%、17.23%和30.17%。该模型能够大幅度减少远景花椒误检,准确检测近景花椒。 展开更多
关键词 花椒采摘 目标检测 多任务网络 注意力机制
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部