期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
语音伪造与鉴伪的发展与挑战 被引量:16
1
作者 陶建华 傅睿博 +2 位作者 易江燕 王成龙 汪涛 《信息安全学报》 CSCD 2020年第2期28-38,共11页
本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语... 本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语音鉴伪技术,首先介绍整理了针对性较强、面向参数式语音伪造、拼接式语音伪造与语音模拟技术框架的应对技术,在此基础上介绍了具有普适性更强的基于深度鉴别网络语音鉴伪研究进展。在此基础上,本文针对语音伪造技术所面临口语化、低资源的挑战,对未来多风格、低成本、鲁棒性发展趋势进行分析。对于语音鉴伪,本文从语料库、特征挖掘、异常检测三个角度对未来的研究重点进行诠释。 展开更多
关键词 语音伪造 语音鉴伪 发展与挑战
下载PDF
相机前加红外滤光片对相机成像模型的影响 被引量:2
2
作者 董秋雷 胡立华 胡占义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第9期1598-1603,共6页
为了避免可见光的干扰或适应夜间工作环境,人们往往将红外滤光片装在普通相机前进行红外目标的捕捉.近年来,这种加红外滤波片的"组合红外相机"在空间视觉领域得到了广泛的应用.然而,空间视觉需要建立严格的"组合红外相... 为了避免可见光的干扰或适应夜间工作环境,人们往往将红外滤光片装在普通相机前进行红外目标的捕捉.近年来,这种加红外滤波片的"组合红外相机"在空间视觉领域得到了广泛的应用.然而,空间视觉需要建立严格的"组合红外相机的成像模型",目前还没有文献对该问题予以关注.针对这一问题,首先从理论层面分析这种组合红外相机的成像模型是否符合针孔模型,进而通过实验分析了相机光心到空间直线的距离、滤光片厚度、空间直线与成像直线的夹角、滤光片折射率4个方面因素对其成像模型的影响.理论分析与实验结果均表明,这种组合红外相机,即使原相机的成像模型为理想的针孔模型,其成像模型理论上已不再为针孔模型.当这种组合红外相机用作相机或物体定位等空间视觉问题时,因为这些应用需要依据严格的相机成像模型,所以这种成像模型的"非针孔性"更应该得到注意,以避免由此导致的系统性误差.文中结论可望为相关研究和应用人员提供一些参考. 展开更多
关键词 组合红外相机 成像模型 针孔模型
下载PDF
基于Faster R-CNN的食品图像检索和分类 被引量:11
3
作者 梅舒欢 闵巍庆 +2 位作者 刘林虎 段华 蒋树强 《南京信息工程大学学报(自然科学版)》 CAS 2017年第6期635-641,共7页
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能... 面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能. 展开更多
关键词 食品图像 图像检索 图像分类 深度学习 FASTER R-CNN 卷积神经网络
下载PDF
一种基于高斯曲率的ICP改进算法 被引量:11
4
作者 王飞鹏 肖俊 +1 位作者 王颖 王云标 《中国科学院大学学报(中英文)》 CSCD 北大核心 2019年第5期702-708,共7页
在众多的点云配准算法中,ICP算法以其所需的信息少,配准精度高而被广泛使用。然而,因其算法迭代最优化的特点,ICP本身存在时间复杂度高、易受噪声及离群点影响等缺点。针对这些问题,提出一种基于高斯曲率的ICP改进方法。该方法首先利用... 在众多的点云配准算法中,ICP算法以其所需的信息少,配准精度高而被广泛使用。然而,因其算法迭代最优化的特点,ICP本身存在时间复杂度高、易受噪声及离群点影响等缺点。针对这些问题,提出一种基于高斯曲率的ICP改进方法。该方法首先利用高斯曲率在刚体变换中保持不变的性质,对配准点云中每个点进行高斯曲率估计;其次,通过设置阈值将配准非关键点及噪声点和离群点滤除;最后,对只包含关键点的点云使用ICP进行配准。实验结果表明,在保证配准精度的前提下,本方法不仅能显著地改善ICP的运行效率,也能有效地提高其抗噪声和离群点的能力。 展开更多
关键词 点云配准 ICP 高斯曲率
下载PDF
基于自适应知识选择的机器阅读理解
5
作者 李泽政 田志兴 +2 位作者 张元哲 刘康 赵军 《中文信息学报》 CSCD 北大核心 2022年第6期117-124,共8页
目前针对知识增强机器阅读理解的研究主要集中在如何把外部知识融入现有的机器阅读理解模型,却忽略了对外部知识的来源进行选择。该文首先基于注意力机制对外部知识进行编码,然后对不同来源的外部知识编码进行打分,最后自适应地选择出... 目前针对知识增强机器阅读理解的研究主要集中在如何把外部知识融入现有的机器阅读理解模型,却忽略了对外部知识的来源进行选择。该文首先基于注意力机制对外部知识进行编码,然后对不同来源的外部知识编码进行打分,最后自适应地选择出对回答问题最有帮助的知识。与基线模型相比,该文提出的基于自适应知识选择的机器阅读理解模型在准确率上提高了1.2个百分点。 展开更多
关键词 机器阅读理解 知识增强 自适应选择
下载PDF
基于二次曲面拟合的机械模型交互式分割方法
6
作者 吴仲琦 郭建伟 +3 位作者 肖俊 曾祥永 王颖 严冬明 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第7期1210-1220,共11页
针对三角网格全自动分割方法的自适应能力较差的问题,提出了一种基于二次曲面拟合的交互式半自动分割方法.首先采用变分方法对网格模型进行二次曲面拟合和分割,然后引入用户的交互信息来指导模型的分割,并配合迭代优化算法交替使用.具体... 针对三角网格全自动分割方法的自适应能力较差的问题,提出了一种基于二次曲面拟合的交互式半自动分割方法.首先采用变分方法对网格模型进行二次曲面拟合和分割,然后引入用户的交互信息来指导模型的分割,并配合迭代优化算法交替使用.具体地,算法包括以下3个步骤:基于random sample consensus(RANSAC)的初始化、迭代优化、交互式合并与切分.其中,初始化方法可以取得一个较好的划分结果,迭代优化可以提高算法的分割质量,而交互式合并与交互式切分步骤可以与迭代优化步骤交替使用,利用用户的主观先验知识对分割不够准确的地方进行局部操作,从而使得分割的效果更为准确、真实.通过比较不同算法对多个机械模型进行分割的效果,算法在收敛速度和拟合误差方面都有明显的优势,并且可以对具有不同特征的三维机械模型以及带有噪声的模型进行准确、合理的分割. 展开更多
关键词 网格分割 用户交互 二次曲面拟合
下载PDF
多通道人机交互信息融合的智能方法 被引量:18
7
作者 杨明浩 陶建华 《中国科学:信息科学》 CSCD 北大核心 2018年第4期433-448,共16页
本文首先简要回顾了认知科学在单通道信息加工及多通道信息融合方面的假定;其次,介绍了计算机科学在多通道信息融合方面相对于单通道信息处理增强的理论模型及实验验证.在各通道特征能够同时获得并统一表示的前提下,多通道人机交互信息... 本文首先简要回顾了认知科学在单通道信息加工及多通道信息融合方面的假定;其次,介绍了计算机科学在多通道信息融合方面相对于单通道信息处理增强的理论模型及实验验证.在各通道特征能够同时获得并统一表示的前提下,多通道人机交互信息的融合可以转化为分类或者回归问题求解.对于实际的交互系统,目前的多通道信息融合技术除了依赖单通道信息识别的准确性外,还依赖于交互系统设计的合理性.最后通过一个多通道信息融合的人机交互的实例,讨论了目前多通道交互系统的缺陷,并给出多通道人机交互信息融合智能方法未来的一个突破方向. 展开更多
关键词 多通道信息融合 人机交互 机器学习 模式识别 认知科学
原文传递
基于PSO非均匀样条插值的混合结构柔性臂抑振轨迹规划 被引量:5
8
作者 龙腾 李恩 +3 位作者 杨国栋 杨磊 范俊峰 梁自泽 《控制与决策》 EI CSCD 北大核心 2018年第6期978-988,共11页
柔性臂广泛应用于核工业、建筑业、太空探索等领域,但由于自身刚度低、大挠度、低阻尼等特点,其末端易产生振动且难以在短时间内消除.对此,研究一种具有一个旋转关节和一个伸缩关节的混合结构柔性臂的抑振轨迹规划方法.通过对其结构分... 柔性臂广泛应用于核工业、建筑业、太空探索等领域,但由于自身刚度低、大挠度、低阻尼等特点,其末端易产生振动且难以在短时间内消除.对此,研究一种具有一个旋转关节和一个伸缩关节的混合结构柔性臂的抑振轨迹规划方法.通过对其结构分解和刚柔部分分解,建立动力学和运动学模型.为了提高算法效率,引入权重因子,构造映射函数,选取非均匀插值点,采用粒子群算法(PSO)优化插值点位置增量,利用3次样条插值拟合优化后的轨迹函数.最后,通过设计混合柔性臂的控制系统,验证所提出抑振轨迹规划方法的有效性. 展开更多
关键词 混合结构柔性臂 动力学模型 抑振轨迹规划 非均匀样条插值 粒子群算法
原文传递
基于迁移学习的噪声鲁棒语音识别声学建模 被引量:5
9
作者 易江燕 陶建华 +1 位作者 刘斌 温正棋 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第1期55-60,共6页
为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。... 为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。学生模型和老师模型间的后验概率分布差异通过相对熵(KL divergence)加以最小化。CHiME-2数据集上的实验结果表明,该方法的平均词错率(WER)比基线的绝对下降了7.29%,比CHiME-2竞赛第一名的绝对下降了3.92%。 展开更多
关键词 鲁棒语音识别 声学模型 神经网络 迁移学习
原文传递
基于静音时长和文本特征融合的韵律边界自动标注 被引量:2
10
作者 傅睿博 陶建华 +1 位作者 李雅 温正棋 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第1期61-66,74,共7页
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而... 韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注。以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明:相比传统声学特征,该文所采用的静音时长特征使自动韵律标注的性能有所提高;相比直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。 展开更多
关键词 韵律边界标注 决策融合 静音时长 语料库构建 语音合成
原文传递
结合门循环单元和生成对抗网络的图像文字去除
11
作者 王超群 全卫泽 +2 位作者 侯诗玉 张晓鹏 严冬明 《中国图象图形学报》 CSCD 北大核心 2022年第4期1264-1276,共13页
目的图像文本信息在日常生活中无处不在,其在传递信息的同时,也带来了信息泄露问题,而图像文字去除算法很好地解决了这个问题,但存在文字去除不干净以及文字去除后的区域填充结果视觉感受不佳等问题。为此,本文提出了一种基于门循环单元... 目的图像文本信息在日常生活中无处不在,其在传递信息的同时,也带来了信息泄露问题,而图像文字去除算法很好地解决了这个问题,但存在文字去除不干净以及文字去除后的区域填充结果视觉感受不佳等问题。为此,本文提出了一种基于门循环单元(gate recurrent unit,GRU)的图像文字去除模型,可以高质量和高效地去除图像中的文字。方法通过由门循环单元组成的笔画级二值掩膜检测模块精确地获得输入图像的笔画级二值掩膜;将得到的笔画级二值掩膜作为辅助信息,输入到基于生成对抗网络的文字去除模块中进行文字的去除和背景颜色的回填,并使用本文提出的文字损失函数和亮度损失函数提升文字去除的效果,以实现对文字高质量去除,同时使用逆残差块代替普通卷积,以实现高效率的文字去除。结果在1080组通过人工处理得到的真实数据集和使用文字合成方法合成的1000组合成数据集上,与其他3种文字去除方法进行了对比实验,实验结果表明,在峰值信噪比和结构相似性等图像质量指标以及视觉效果上,本文方法均取得了更好的性能。结论本文提出的基于门循环单元的图像文字去除模型,与对比方法相比,不仅能够有效解决图像文字去除不干净以及文字去除后的区域与背景不一致问题,并能有效地减少模型的参数量和计算量,最终整体计算量降低了72.0%。 展开更多
关键词 文字去除 门循环单元(GRU) 生成对抗网络(GAN) 逆残差块 图像修复
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部