期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
结合有监督联合一致性自编码器的跨音视频说话人标注 被引量:2
1
作者 柳欣 李鹤洋 +1 位作者 钟必能 杜吉祥 《电子与信息学报》 EI CSCD 北大核心 2018年第7期1635-1642,共8页
跨模态说话人标注旨在利用说话人的不同生物特征进行相互匹配和互标注,可广泛应用于各种人机交互场合。针对人脸和语音两种不同模态生物特征之间存在明显的"语义鸿沟"问题,该文提出一种结合有监督联合一致性自编码器的跨音视... 跨模态说话人标注旨在利用说话人的不同生物特征进行相互匹配和互标注,可广泛应用于各种人机交互场合。针对人脸和语音两种不同模态生物特征之间存在明显的"语义鸿沟"问题,该文提出一种结合有监督联合一致性自编码器的跨音视频说话人标注方法。首先分别利用卷积神经网络和深度信念网络分别对人脸图像和语音数据进行判别性特征提取,接着在联合自编码器模型的基础上,提出一种新的有监督跨模态神经网络模型,同时嵌入softmax回归模型以保证模态间和模态内样本的相似性,进而扩展为3种有监督一致性自编码器神经网络模型来挖掘音视频异构特征之间的潜在关系,从而有效实现人脸和语音的跨模态相互标注。实验结果表明,该文提出的网络模型能够有效的对说话人进行跨模态标注,效果显著,取得了对姿态变化和样本多样性的鲁棒性。 展开更多
关键词 跨模态说话人标注 有监督联合自编码器 softmax回归模型 有监督神经网络模型
下载PDF
结合双流网络和双向五元组损失的跨人脸-语音匹配
2
作者 柳欣 王锐 +1 位作者 钟必能 王楠楠 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期694-705,共12页
面部视觉信息和语音信息是人机交互过程中最为直接和灵活的方式,从而基于智能方式的人脸和语音跨模态感知吸引了国内外研究学者的广泛关注.然而,由于人脸-语音样本的异质性以及语义鸿沟问题,现有方法并不能很好地解决一些难度比较高的... 面部视觉信息和语音信息是人机交互过程中最为直接和灵活的方式,从而基于智能方式的人脸和语音跨模态感知吸引了国内外研究学者的广泛关注.然而,由于人脸-语音样本的异质性以及语义鸿沟问题,现有方法并不能很好地解决一些难度比较高的跨人脸-语音匹配任务.提出了一种结合双流网络和双向五元组损失的跨人脸-语音特征学习框架,该框架学到的特征可直接用于4种不同的跨人脸-语音匹配任务.首先,在双流深度网络顶端引入一种新的权重共享的多模态加权残差网络,以挖掘人脸和语音模态间的语义关联;接着,设计了一种融合多种样本对构造策略的双向五元组损失,极大地提高了数据利用率和模型的泛化性能;最后,在模型训练中进行ID分类学习,以保证跨模态表示的可分性.实验结果表明,与现有方法相比,能够在4个不同跨人脸-语音匹配任务上取得效果的全面提升,某些评价指标效果提升近5%. 展开更多
关键词 人脸-语音关联 跨模态感知 双流网络 双向五元组损失 加权残差网络
下载PDF
基于孪生网络的目标跟踪算法研究进展 被引量:2
3
作者 梁启花 胡现韬 +2 位作者 钟必能 于枫 李先贤 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第5期90-103,共14页
目标跟踪是计算机视觉领域中最为核心的基础研究问题之一,其能够协同高层视频应用分析和研究,具有重要的理论价值、广泛的实用价值和多学科交叉性,成为学术界、工业界以及国家战略的关注焦点。由于跟踪场景复杂度高、干扰强,目标表观变... 目标跟踪是计算机视觉领域中最为核心的基础研究问题之一,其能够协同高层视频应用分析和研究,具有重要的理论价值、广泛的实用价值和多学科交叉性,成为学术界、工业界以及国家战略的关注焦点。由于跟踪场景复杂度高、干扰强,目标表观变化多样性以及多模态信息融合等因素,使得跟踪器需要均衡鲁棒性、准确性以及实时性等性能衡量指标。目前,已有很多工作从不同视角解决目标跟踪领域中的挑战,但是在多维度性能指标的衡量下,仍然不能很好地克服复杂场景下的跟踪问题。本文通过基于孪生网络的目标跟踪算法,回顾领域发展现状,探讨存在的挑战,展望未来值得关注的研究方向,为该领域未来的研究工作提供借鉴和参考。 展开更多
关键词 计算机视觉 目标跟踪 视频应用与分析 多模态 孪生网络
下载PDF
新工科背景下融合创新创业教育的“操作系统”课程教学改革探索
4
作者 钟必能 李宁 +2 位作者 梁启花 陶小梅 邓清勇 《济宁学院学报》 2024年第6期94-101,共8页
新工科背景下的“双创”教育取得了较大进展,将专业教育和创新创业教育融合,对学生发展、产业发展和教育改革等有重要研究价值和实践意义。现有“操作系统”课程与创新创业教育融合不足,存在将“双创”教育融入教学内容、教学过程、实... 新工科背景下的“双创”教育取得了较大进展,将专业教育和创新创业教育融合,对学生发展、产业发展和教育改革等有重要研究价值和实践意义。现有“操作系统”课程与创新创业教育融合不足,存在将“双创”教育融入教学内容、教学过程、实践环节及考核评价不高的问题,专创融合不足导致课程改革进展缓慢。以“操作系统”课程为基础,围绕“以学生为中心、渐进式实践、阶段性评价”的原则,开展融合“双创”教育的课程教学改革探讨,主要从课程教学内容、教学方法、实践教学以及考核与评价等若干方面进行初步改革,探索适合新工科发展需要的、旨在创新思维和创业意识得到有效培养的、融合创新创业教育的“操作系统”课程改革路径,为高校培养操作系统产业创新型人才提供一定理论基础。 展开更多
关键词 新工科 操作系统 创新创业教育 课程教学改革
下载PDF
DRNet:Towards fast,accurate and practical dish recognition 被引量:1
5
作者 CHENG SiYuan CHU BinFei +4 位作者 zhong bineng ZHANG ZiKai LIU Xin TANG ZhenJun LI XianXian 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2021年第12期2651-2661,共11页
Existing algorithms of dish recognition mainly focus on accuracy with predefined classes,thus limiting their application scope.In this paper,we propose a practical two-stage dish recognition framework(DRNet)that yield... Existing algorithms of dish recognition mainly focus on accuracy with predefined classes,thus limiting their application scope.In this paper,we propose a practical two-stage dish recognition framework(DRNet)that yields a tradeoff between speed and accuracy while adapting to the variation in class numbers.In the first stage,we build an arbitrary-oriented dish detector(AODD)to localize dish position,which can effectively alleviate the impact of background noise and pose variations.In the second stage,we propose a dish reidentifier(DReID)to recognize the registered dishes to handle uncertain categories.To further improve the accuracy of DRNet,we design an attribute recognition(AR)module to predict the attributes of dishes.The attributes are used as auxiliary information to enhance the discriminative ability of DRNet.Moreover,pruning and quantization are processed on our model to be deployed in embedded environments.Finally,to facilitate the study of dish recognition,a well-annotated dataset is established.Our AODD,DReID,AR,and DRNet run at about 14,25,16,and 5 fps on the hardware RKNN 3399 pro,respectively. 展开更多
关键词 neural network acceleration neural network quantization object detection reidentification dish recognition
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部