期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于CNN和HOG的司机分心检测
1
作者 秦斌斌 钱江波 +1 位作者 严迪群 董一鸿 《计算机应用与软件》 北大核心 2024年第6期115-122,共8页
针对现有CNN网络模型只关注网络最后一层的输出而未能充分利用中间层的输出特征,而事实上中间层特征包含很多有用信息,提出一种端到端的提取多阶段中间网络层输出特征,并与HOG(Histogram of Oriented Gradient)特征融合的司机分心检测... 针对现有CNN网络模型只关注网络最后一层的输出而未能充分利用中间层的输出特征,而事实上中间层特征包含很多有用信息,提出一种端到端的提取多阶段中间网络层输出特征,并与HOG(Histogram of Oriented Gradient)特征融合的司机分心检测模型。模型参数量仅为3.6 M,同时采用L2权重正则化、Dropout以及批量正则化对模型性能进行提升。在两个公开的数据集State Farm Distracted Driver Detection(SFD3)和AUC Distracted Driver(AUCD2)进行了实验验证,在SFD3准确度达到99.78%,比现有论文提高约3百分点,网络参数量分别减少约95%;在AUCD2上准确度达到95.15%,比现有论文提高约2百分点,网络参数量减少约60%。 展开更多
关键词 分心检测 图像分类 HOG CNN
下载PDF
Cross-CNN:基于CNN和Transformer混合模型的动画跨帧线稿着色算法
2
作者 余毅丰 钱江波 +2 位作者 严迪群 王翀 董理 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2491-2502,共12页
对长序列的动画线稿帧进行着色是计算机视觉中一项具有挑战性的任务.一方面,线稿中包含的信息较为稀疏,需要着色算法对缺失的信息进行推断;另一方面,连续帧之间的色彩需要保持一致,以确保整个视频的视觉质量.现有的着色算法多数只针对... 对长序列的动画线稿帧进行着色是计算机视觉中一项具有挑战性的任务.一方面,线稿中包含的信息较为稀疏,需要着色算法对缺失的信息进行推断;另一方面,连续帧之间的色彩需要保持一致,以确保整个视频的视觉质量.现有的着色算法多数只针对单张图片进行着色,这类算法只给出一个开放性的符合合理范围的色彩结果,无法适用于帧序列着色.另一些基于参考帧的着色算法,并没有将2帧之间的关系有机地联系起来,导致着色效果不够出色.在同一镜头序列中,同一对象的特征往往不会发生太大变化,因此,可以设计一个根据给定参考帧,即可给线稿自动着色的模型.为此,本文提出了基于CNN(Convolutional Neural Networks)和Transformer相结合的模型Cross-CNN,该模型能够从参考帧中寻找并匹配颜色,从而保证时间维度上的特征一致性.Cross-CNN模型参考帧和线稿帧在通道维度叠加,输入预训练的Resnet50网络提取局部融合特征,将融合特征图传给Transformer结构进行编码以提取全局特征.在Transformer结构中设计了交叉注意力机制更好地匹配远距离特征.最后使用带有跳层连接的卷积解码器完成着色图片输出.本文在数据集方面从8部电影中截取画面并经过严格筛选,最终制作了一个包含20000对二元组的数据集用于实验研究.Cross-CNN的SSIM(Structural SIMilarity)达到了0.932,高于SOTA算法0.014.本文算法代码链接:https://github.com/silenye/Cross-CNN. 展开更多
关键词 线稿着色 卷积神经网络 TRANSFORMER 颜色匹配 动画制作
下载PDF
基于长短期时间关系网络的视频行人重识别
3
作者 何智敏 钱江波 +2 位作者 严迪群 叶绪伦 王翀 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2746-2757,共12页
行人重识别是计算机视觉领域中的一个重要研究方向,其目的是在不同的监控摄像头中识别并跟踪同一行人.由于视频帧间存在多种时间关系,从这些关系中可以获取到对象的运动模式以及细粒度特征,因此视频重识别相比图像重识别拥有更丰富的时... 行人重识别是计算机视觉领域中的一个重要研究方向,其目的是在不同的监控摄像头中识别并跟踪同一行人.由于视频帧间存在多种时间关系,从这些关系中可以获取到对象的运动模式以及细粒度特征,因此视频重识别相比图像重识别拥有更丰富的时空线索,也更接近实际应用.问题的关键是如何挖掘这些时空线索作为视频重识别的特征.本文针对视频行人重识别问题,提出了一种基于Transformer的长短期时间关系网络(Long and Short Time Transformer,LSTT).该网络包含长短期时间关系模块,提取重要时序信息并强化特征表示.长期时间关系模块利用记忆线索存储每帧信息,并在每一帧建立全局联系;短期时间关系模块则考虑相邻帧之间交互,学习细粒度目标信息,提高特征表示能力.此外,为了提高模型对不同目标特征的适配性,本文还设计了一个包含不同规格卷积核的多尺度模块.该模块具有多种卷积感受野,能够更全面覆盖目标区域,从而进一步提高模型的泛化性能.在MARS、MARS_DL和iLIDS-VID 3个数据集上的实验结果表明,LSTT模型性能最优. 展开更多
关键词 视频行人重识别 TRANSFORMER 长期时间关系 短期时间关系 多尺度
下载PDF
基于差值扩展的音频无损信息隐藏算法 被引量:1
4
作者 严迪群 王让定 《计算机工程与应用》 CSCD 北大核心 2008年第9期98-100,共3页
在Tian算法的基础上,提出了一种基于音频的无损信息隐藏算法。该算法首先对载体音频进行溢出预处理和采样点分类,然后利用差值扩展方法,将隐秘信息嵌入到扩展差值的LSB位。在提取时,利用无损解码技术得到位置映射表,再提取出隐秘信息后... 在Tian算法的基础上,提出了一种基于音频的无损信息隐藏算法。该算法首先对载体音频进行溢出预处理和采样点分类,然后利用差值扩展方法,将隐秘信息嵌入到扩展差值的LSB位。在提取时,利用无损解码技术得到位置映射表,再提取出隐秘信息后,载体音频可以实现无损恢复。仿真结果证明,算法能获得较高的隐藏容量,并能有效地保证含秘音频的感知质量。 展开更多
关键词 信息隐藏 音频 差值扩展
下载PDF
基于MSE下限的LSB隐藏算法的分析与性能评价 被引量:1
5
作者 严迪群 王让定 《宁波大学学报(理工版)》 CAS 2007年第4期421-424,共4页
LSB算法是信息隐藏的基础方法之一.以往对经典LSB隐藏算法进行研究评价时,往往不考虑隐秘信息长度对算法性能指标的动态影响.针对该问题,对最差情况下隐秘信息长度与经典LSB隐藏算法性能之间的关系进行了分析讨论,并给出了性能评价的一... LSB算法是信息隐藏的基础方法之一.以往对经典LSB隐藏算法进行研究评价时,往往不考虑隐秘信息长度对算法性能指标的动态影响.针对该问题,对最差情况下隐秘信息长度与经典LSB隐藏算法性能之间的关系进行了分析讨论,并给出了性能评价的一般表达式.最后通过实验验证了所提出性能评价表达式的正确性,对进一步提高LSB算法性能有一定的指导意义。 展开更多
关键词 信息隐藏 LSB 性能评价
下载PDF
基于音频点播平台的保密语音隐秘传输
6
作者 严迪群 王让定 《计算机工程》 CAS CSCD 北大核心 2008年第20期172-174,共3页
提出一种基于音频点播系统的保密语音隐秘传输实现方案。采用ITUG.729A编码算法对保密语音低码率压缩编码,将保密语音码流通过改进LSB数据隐藏算法嵌入到公开音频中,利用音频点播平台发布到网络上,通过客户端点播实现保密语音提取和回... 提出一种基于音频点播系统的保密语音隐秘传输实现方案。采用ITUG.729A编码算法对保密语音低码率压缩编码,将保密语音码流通过改进LSB数据隐藏算法嵌入到公开音频中,利用音频点播平台发布到网络上,通过客户端点播实现保密语音提取和回放。测试数据结果表明,通过改进算法,载体音频的感知质量得到了提高,同时也表明该方案对于恶意攻击者具有更好的隐蔽性。 展开更多
关键词 信息隐藏 语音编码 音频点播
下载PDF
基于卷积神经网络的翻录语音检测算法 被引量:6
7
作者 李璨 王让定 严迪群 《计算机应用》 CSCD 北大核心 2018年第1期79-83,共5页
针对翻录语音攻击说话人识别系统,危害合法用户的权益问题,提出了一种基于卷积神经网络(CNN)的翻录语音检测算法。首先,通过提取原始语音与翻录语音的语谱图,并将其输入到卷积神经网络中,对其进行特征提取及分类;然后,搭建了适应于检测... 针对翻录语音攻击说话人识别系统,危害合法用户的权益问题,提出了一种基于卷积神经网络(CNN)的翻录语音检测算法。首先,通过提取原始语音与翻录语音的语谱图,并将其输入到卷积神经网络中,对其进行特征提取及分类;然后,搭建了适应于检测翻录语音的网络框架,分析讨论了输入不同窗移的语谱图对检测率的影响;最后,对不同偷录及回放设备的翻录语音进行了交叉实验检测,并与现有的经典算法进行了对比。实验结果表明,所提方法能够准确地判断待测语音是否为翻录语音,其识别率达到了99.26%,与静音段梅尔频率倒谱系数(MFCC)算法、信道模式噪声算法和长时窗比例因子算法相比,识别率分别提高了约26个百分点、21个百分点和0.35个百分点。 展开更多
关键词 卷积神经网络 翻录语音检测 语谱图 录音设备 网络框架
下载PDF
分层能力目标导向的IT专业DSP课程群改革 被引量:4
8
作者 陈芬 王晓东 +2 位作者 章联军 彭宗举 严迪群 《宁波大学学报(教育科学版)》 2016年第3期89-92,共4页
针对目前高校IT专业DSP(Digital Signal Processing)课程群技术革新快、知识覆盖面广、课程难度大、综合性实践环节缺失等问题,探索了"能力本位教育"理念下进阶式分层培养的DSP课程群教学改革。构建了分层能力目标导向的DSP... 针对目前高校IT专业DSP(Digital Signal Processing)课程群技术革新快、知识覆盖面广、课程难度大、综合性实践环节缺失等问题,探索了"能力本位教育"理念下进阶式分层培养的DSP课程群教学改革。构建了分层能力目标导向的DSP课程教学体系和实践能力培养体系,明确了各能力层级的教学任务和能力培养目标。尝试了工程素养融合培养的教学模式改革,探索应用了行业真实项目驱动下的PBL教学法、线上线下混合式教学法改革。教学实践结果表明,DSP课程群改革具有一定成效,学生创新意识与工程应用能力提升显著,得到行业用人单位的认可。 展开更多
关键词 分层式 DSP技术 能力本位教育 IT专业
下载PDF
基于数字孪生技术的编程语言实践教学过程的智能监控及优化 被引量:3
9
作者 钮俊 陈叶芳 +1 位作者 严迪群 金炜 《计算机教育》 2023年第5期86-90,共5页
为了对实践教学过程进行全息监控及智能优化,提出将数字孪生技术引入程序设计课程的编程实践教学环节,基于数字孪生概念构建学生编码过程的数字孪生过程,并给出基于机器学习的编程行为模式挖掘、编码过程实时干预反馈等实施方案。
关键词 程序设计 实践教学 数字孪生 机器学习 ECLIPSE插件
下载PDF
面向课外创新实践的低功耗广域物联网教学案例设计与研究 被引量:2
10
作者 金光 任鑫伟 +1 位作者 江先亮 严迪群 《计算机教育》 2021年第5期109-112,共4页
分析相关课程实践教学存在的问题现状和对策,提出从项目选题、学生分组、项目实施、项目提交、结果考核和成果培育等多个步骤培养学生的应用开发和实践创新能力,以紧跟主流技术的低功耗广域物联网(LoRa和NB-IoT)为例,介绍相关教学实践... 分析相关课程实践教学存在的问题现状和对策,提出从项目选题、学生分组、项目实施、项目提交、结果考核和成果培育等多个步骤培养学生的应用开发和实践创新能力,以紧跟主流技术的低功耗广域物联网(LoRa和NB-IoT)为例,介绍相关教学实践案例的设计方法,最后说明教学效果。 展开更多
关键词 课外创新实践 教学案例 低功耗广域物联网 实践能力培养
下载PDF
新的电动车用两相永磁无刷轮毂电动机的研究 被引量:1
11
作者 葛英辉 严迪群 倪光正 《中小型电机》 北大核心 2004年第5期17-21,共5页
本文设计了一种新的用于电动车的两相永磁无刷轮毂电动机 ,其结构简单 ,最大输出转矩高于传统三相无刷电动机 ,同时克服了传统两相无刷电动机的缺点。本文对电机系统性能进行了仿真 ,并实现了基于AT89C5 1控制系统。
关键词 永磁 无刷电动机 电动车 三相 车用 电机系统 样机 轮毂 实验测试 输出转矩
下载PDF
基于相位谱的翻录语音攻击检测算法 被引量:1
12
作者 李璨 王让定 +1 位作者 严迪群 陈亚楠 《电信科学》 北大核心 2017年第8期145-154,共10页
因与原始语音具有高度相似性,经高保真设备回放的翻录语音常被不法分子用于对说话人认证(ASV)系统进行攻击,以达到非法认证的目的。为提高系统抵抗翻录语音攻击的顽健性,通过研究原始语音与翻录语音产生的实际过程,发现两者在频率域相... 因与原始语音具有高度相似性,经高保真设备回放的翻录语音常被不法分子用于对说话人认证(ASV)系统进行攻击,以达到非法认证的目的。为提高系统抵抗翻录语音攻击的顽健性,通过研究原始语音与翻录语音产生的实际过程,发现两者在频率域相位上有明显差异,并在此基础上提出了一种基于相位谱的翻录语音检测方法。分析讨论了FFT和不同偷录、回放设备对翻录语音检测率的影响。实验结果表明,该方法能够准确地判断待测语音是否为翻录语音,其检测率达到了99.04%。并且,将该算法加载到说话人识别系统中,使系统的等错误概率(EER)降低了约22%,有效提高了系统抵抗翻录语音攻击的性能。 展开更多
关键词 说话人认证系统 翻录语音检测 相位谱
下载PDF
DSP芯片技术实验的探索与开发 被引量:3
13
作者 杨高波 叶富乐 严迪群 《电气电子教学学报》 2003年第5期66-69,共4页
介绍了数字信号处理器 (DSPs)的结构及技术特性 ,系统地总结了基于 TI公司 DSP芯片的 JTAG仿真开发系统的软件开发工具和系统集成、调试工具 ,详细地分析了不同的 DSP实验的硬件开发环境 ,并具体地探讨了一般的 DSP实验项目 (熟悉 CC,... 介绍了数字信号处理器 (DSPs)的结构及技术特性 ,系统地总结了基于 TI公司 DSP芯片的 JTAG仿真开发系统的软件开发工具和系统集成、调试工具 ,详细地分析了不同的 DSP实验的硬件开发环境 ,并具体地探讨了一般的 DSP实验项目 (熟悉 CC,存储器寻址测试 ,中断测试 ,D/ A转换 ,FIR,FTT等 )以及针对电信、自动化等专业的专门 DSP实验项目 (DSP直流电机调速系统扩展实验板、DSP语音回放系统扩展实验板等 )的开发方案。 展开更多
关键词 DSP 数字信号处理器 JTAG 实验项目 开发板
下载PDF
基于TMS320LF2407A的DTMF产生与检测实验系统设计
14
作者 陈芬 严迪群 彭宗举 《现代电子技术》 2005年第10期76-78,81,共4页
DTMF (双音多频)信号是音频电话中的拨号信号,广泛应用于新一代电话机。介绍了一种基于DSP的DTMF信号产生与检测实验系统的设计原理以及软硬件开发过程,该系统主要是在2台以TI的TMS32 0 L F2 4 0 7A为核心芯片的DSP教学实验箱上实现的... DTMF (双音多频)信号是音频电话中的拨号信号,广泛应用于新一代电话机。介绍了一种基于DSP的DTMF信号产生与检测实验系统的设计原理以及软硬件开发过程,该系统主要是在2台以TI的TMS32 0 L F2 4 0 7A为核心芯片的DSP教学实验箱上实现的。实验结果表明:在实验箱1上的小键盘击键信息总能准确无误地通过实验箱2上的L CD显示出来,整个系统具有很高的实时性和可靠性。该系统的开发使学生能更深刻地理解DTMF信号的实质以及用DSP产生与检测DTMF信号的软硬件开发过程。 展开更多
关键词 双音多频 DSP TMS320LF2407A GOERTZEL算法
下载PDF
高性能低成本两相无刷直流电动机
15
作者 丁志刚 严迪群 《微电机》 北大核心 2005年第2期22-24,共3页
开发的高性能低成本两相无刷直流电动机,以正交方波电压模式运行。样机的设计分析和试验结果表明:同传统两相无刷直流电动机相比,转矩密度高、功率密度高、转矩脉动小、成本低。
关键词 两相无刷直流电动机 绕组 电磁转矩 功率密度
下载PDF
基于隐写算法的保密语音传输系统(英文)
16
作者 杜呈透 严迪群 《宁波大学学报(理工版)》 CAS 2008年第4期447-452,共6页
提出了一种基于隐写算法的保密语音传输系统,首先采用G.729A编码算法对保密语音进行低码率压缩编码,然后通过改进LSB隐写算法将保密语音码流隐藏到公开音频中,并利用音频点播平台发布到网络上,最后通过客户端点播实现保密语音的提取和回... 提出了一种基于隐写算法的保密语音传输系统,首先采用G.729A编码算法对保密语音进行低码率压缩编码,然后通过改进LSB隐写算法将保密语音码流隐藏到公开音频中,并利用音频点播平台发布到网络上,最后通过客户端点播实现保密语音的提取和回放.测试数据结果表明:通过该改进算法,载体音频的感知质量得到了显著的提高,并且系统对于恶意攻击者具有更好的隐秘性. 展开更多
关键词 语音编码 隐写 音频点播
下载PDF
基于SEED-DTK6437的视频图像增强系统设计
17
作者 张陈梅 陈芬 +2 位作者 吴明昊 严迪群 彭宗举 《微型机与应用》 2013年第5期32-34,37,共4页
设计了视频图像增强系统,该系统采用基于TI公司高性能Davinci系列TMS320DM6437处理器的SEED-DEC6437EVM板作为主要硬件平台,在DSP集成开发环境CCS3.3中采用C语言和汇编语言混合编程,对摄像头采集的实时视频图像实现了图像增强算法从软... 设计了视频图像增强系统,该系统采用基于TI公司高性能Davinci系列TMS320DM6437处理器的SEED-DEC6437EVM板作为主要硬件平台,在DSP集成开发环境CCS3.3中采用C语言和汇编语言混合编程,对摄像头采集的实时视频图像实现了图像增强算法从软件到硬件平台的移植,同时使用主板上TMS320DM6437和TMS320C5402双DSP芯片进行通信,实现良好的人机交互。结果表明,该系统具有算法简单、性能稳定和实时性好的特点。 展开更多
关键词 DSP 图像增强 TMS320DM6437
下载PDF
“学-练-赛”驱动的计算机类本科生创新能力培养实践——以“无线网络技术”课程为例
18
作者 江先亮 金光 +1 位作者 陈琛 严迪群 《智能物联技术》 2021年第3期33-36,共4页
学生的创新能力培养是近年来高校本科教育的主要关注点之一,是国家实施创新驱动发展战略、促进经济提质增效升级的迫切需要。为培养符合社会和国家需要的人才,本文提出了"学-练-赛"驱动的计算机类本科生创新能力培养模式,即... 学生的创新能力培养是近年来高校本科教育的主要关注点之一,是国家实施创新驱动发展战略、促进经济提质增效升级的迫切需要。为培养符合社会和国家需要的人才,本文提出了"学-练-赛"驱动的计算机类本科生创新能力培养模式,即学好课程基础理论、强化动手实践训练,将所学知识用于解决实际的工程问题,并在竞赛中探索新思路和新方法,并以"无线网络技术"课程为案例,探讨如何将"学-练-赛"模式进行实际运用。实践表明,其在学生创新力培养方面具有较好的效果,能有效提升学生的积极性。 展开更多
关键词 创新能力培养 无线网络 物联网 “学-练-赛”模式
下载PDF
C语言课程育人功能挖掘的教学实践
19
作者 杨任尔 陆云龙 +1 位作者 严迪群 尤阳 《中国信息技术教育》 2022年第12期94-96,共3页
C语言课程是大学工科专业重要的公共基础课,为了将课程思政的理念融于C语言课程教学,既实现知识传授、技能培养等显性教育功能,又达到真正育人的隐性功能,作者结合多年的教学实践,设计了一套体系化教学方案。该方案旨在充分挖掘C语言课... C语言课程是大学工科专业重要的公共基础课,为了将课程思政的理念融于C语言课程教学,既实现知识传授、技能培养等显性教育功能,又达到真正育人的隐性功能,作者结合多年的教学实践,设计了一套体系化教学方案。该方案旨在充分挖掘C语言课程教学的育人功能,其中包含“以诗育人,以诗化人”“洞悉学情,精准教学”“思考感悟,分享反馈”等教学策略。根据课程学习效果反馈,这些教学策略实现了教书育人功能。 展开更多
关键词 课程思政 C语言课程 教书育人
下载PDF
基于噪声一致性的数字语音异源拼接篡改检测算法 被引量:8
20
作者 阳帆 严迪群 +3 位作者 徐宏伟 王让定 金超 向立 《计算机应用》 CSCD 北大核心 2017年第12期3452-3457,共6页
异源拼接是一种常见的数字语音篡改行为,其主要借助音频编辑软件将不同场景中录制的语音片段拼接在一起,以达到改变语音语义的目的。考虑到不同场景中所包含的背景噪声特性往往存在差异,提出了一种基于噪声一致性的数字语音异源拼接篡... 异源拼接是一种常见的数字语音篡改行为,其主要借助音频编辑软件将不同场景中录制的语音片段拼接在一起,以达到改变语音语义的目的。考虑到不同场景中所包含的背景噪声特性往往存在差异,提出了一种基于噪声一致性的数字语音异源拼接篡改检测算法。首先,采用时间递归平均(TRA)算法提取待检测语音中所含噪声;然后,通过突变点检测(CPD)算法检测噪声方差是否存在突变来判定待检测语音是否经过篡改,并对篡改位置作出定位。实验仿真结果表明,所提算法能对数字语音中的异源篡改位置进行有效检测。 展开更多
关键词 语音取证 噪声估计 篡改检测 突变点检测
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部