期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于Group-Res2Block的智能合成语音说话人确认方法
1
作者 李菲 苏兆品 +2 位作者 王年松 杨波 张国富 《应用科学学报》 CAS CSCD 北大核心 2024年第4期709-722,共14页
针对现有说话人确认任务基于自然语音条件下并不适用于智能合成语音的问题,提出一种基于Group-Res2Block的智能合成语音说话人确认方法。首先,设计了Group-Res2Block结构,在Res2Block的基础上将当前分组与相邻前后分组进行合并形成新的... 针对现有说话人确认任务基于自然语音条件下并不适用于智能合成语音的问题,提出一种基于Group-Res2Block的智能合成语音说话人确认方法。首先,设计了Group-Res2Block结构,在Res2Block的基础上将当前分组与相邻前后分组进行合并形成新的分组,以增强说话人局部特征的上下文联系;其次,设计了并行结构的多尺度通道注意力特征融合机制,利用不同大小卷积核实现同一层级的特征在通道维度的特征选择,以获取更具表现力的说话人特征,避免信息冗余;最后,设计了串行结构的多尺度层注意力特征融合机制,构建层结构,将深浅层特征整体进行融合并赋予不同权重,以获取最优的特征表达。为验证所提出特征提取网络的有效性,构建了中英文两种智能合成语音数据集进行消融实验和对比实验。结果表明本文方法在该任务的评价指标精确度(accuracy,ACC)、等错误率(equal error rate,EER)和最小检测代价函数(minimum detection cost function,minDCF)上是最优的。此外,通过对模型泛化性能进行测试,验证了本文方法对未知智能语音算法的适用性。 展开更多
关键词 说话人确认 智能合成语音 Group-Res2Block深度神经网络 多尺度特征 注意力机制
下载PDF
注意力引导的标志检测与识别
2
作者 张冬明 靳国庆 +2 位作者 鲁鼎煜 张菁 张勇东 《软件学报》 EI CSCD 北大核心 2024年第11期5116-5132,共17页
自然场景中的实体标志,如商标、交通标志等,易受拍摄角度、所依附物体形变、尺度变化等影响,导致检测精度降低.为此,提出一种注意力引导的标志检测与识别网络(attention guided logo detection and recognition network,AGLDN),联合优... 自然场景中的实体标志,如商标、交通标志等,易受拍摄角度、所依附物体形变、尺度变化等影响,导致检测精度降低.为此,提出一种注意力引导的标志检测与识别网络(attention guided logo detection and recognition network,AGLDN),联合优化模型对多尺度变化和复杂形变的鲁棒性.首先通过标志模板图像搜集及掩码生成、标志背景图像选取和标志图像生成创建标志合成数据集;然后基于RetinaNet和FPN提取多尺度特征并形成高级语义特征映射;最后利用注意力机制引导网络关注标志区域,克服目标变形对特征鲁棒性的影响,实现标志检测与识别.实验结果表明,所提方法可以有效降低尺度变化、非刚性形变的影响,提高标志检测准确率. 展开更多
关键词 标志检测和识别 数据合成 多尺度特征融合 注意力引导
下载PDF
基于神经辐射场的多尺度视图合成研究 被引量:3
3
作者 范腾 杨浩 +1 位作者 尹稳 周冬明 《图学学报》 CSCD 北大核心 2023年第6期1140-1148,共9页
针对神经辐射场(NeRF)在多尺度的视图合成任务中产生模糊和锯齿的问题,提出一种融合不同尺度的视图特征和视点特征作为先验提高合成目标视图质量的多尺度神经辐射场(MS-NeRF)。首先,对于不同尺度的目标视图,利用多级小波卷积神经网络提... 针对神经辐射场(NeRF)在多尺度的视图合成任务中产生模糊和锯齿的问题,提出一种融合不同尺度的视图特征和视点特征作为先验提高合成目标视图质量的多尺度神经辐射场(MS-NeRF)。首先,对于不同尺度的目标视图,利用多级小波卷积神经网络提取目标视图特征,将视图特征作为先验对网络合成目标场景视图进行监督。其次,扩大视点相机发出的光线在目标视图像素点上的采样面积,避免在每个像素上只对单束光线进行采样导致渲染结果产生模糊和锯齿。最后,在训练时加入不同尺度的视图特征和视点特征,提升网络合成不同尺度视图的泛化能力,并利用渐进式结构的深度神经网络拟合视图特征和视点特征到目标视图的映射关系。实验结果表明,与相关方法相比,MS-NeRF减少了训练成本,提升了合成目标视图的视觉效果。 展开更多
关键词 神经辐射场 多尺度视图合成 新视角视图合成 深度神经网络 小波变换
下载PDF
基于自适应感受野的电力设备表面缺陷检测方法 被引量:1
4
作者 于豪 蒋锦霞 +2 位作者 赖晓翰 梅峰 王庆 《系统仿真学报》 CAS CSCD 北大核心 2023年第7期1572-1580,共9页
针对变电站电力设备覆冰、锈蚀、污秽等缺陷检测问题,提出了一种新的自适应感受野网络,其中结合注意力机制的自适应感受野模块可对多尺度特征进行有效融合。考虑到缺陷检测的小样本学习属性,还提出了一种基于真实纹理的电力设备表面缺... 针对变电站电力设备覆冰、锈蚀、污秽等缺陷检测问题,提出了一种新的自适应感受野网络,其中结合注意力机制的自适应感受野模块可对多尺度特征进行有效融合。考虑到缺陷检测的小样本学习属性,还提出了一种基于真实纹理的电力设备表面缺陷仿真数据合成方法。在仿真数据集上的实验结果表明,该网络对跨设备表面缺陷的检测精度较高,同时具有体积小、运算速度快等优点。 展开更多
关键词 表面缺陷检测 自适应感受野 注意力机制 多尺度特征 仿真数据合成
下载PDF
基于多尺度引导注意力的人物图像合成方法研究
5
作者 邬成 葛斌 +1 位作者 郑海君 杨振文 《金陵科技学院学报》 2023年第1期12-19,共8页
针对现有生成对抗网络合成的人物图像存在的残缺和模糊问题,提出一种基于多尺度特征提取和姿势引导特征转换的人物图像合成方法。利用深度卷积神经网络对图像和姿势进行多尺度特征提取,有效获取丰富的语义信息;在不同尺度特征的转换过... 针对现有生成对抗网络合成的人物图像存在的残缺和模糊问题,提出一种基于多尺度特征提取和姿势引导特征转换的人物图像合成方法。利用深度卷积神经网络对图像和姿势进行多尺度特征提取,有效获取丰富的语义信息;在不同尺度特征的转换过程中注入引导注意力机制,利用姿势信息引导纹理特征进行正确转移和变换;使用马尔可夫判别网络(PatchGAN)作为判别器,增强对图像纹理细节的鉴别能力;最后在DeepFashion数据集上进行测试。结果表明:在定量上,该方法的结构相似度(SSIM)达到了0.7729,峰值信噪比(PSNR)达到了19.0604,Fréchet初始距离得分(FID)达到了11.4765,可学习感知图像块相似度(LPIPS)达到了0.2092;在定性上,比传统方法合成的人物图像具有更好的视觉效果。所提方法能有效解决残缺和模糊问题,提高合成人物图像的质量。 展开更多
关键词 生成对抗网络 多尺度特征 特征转换 人物图像合成 引导注意力机制
下载PDF
产业生态系统多尺度能值整合评价方法 被引量:8
6
作者 陆宏芳 陈飞鹏 +1 位作者 任海 彭少麟 《生态环境》 CSCD 北大核心 2006年第2期411-415,共5页
能值分析方法为自然环境资源与人类社会、经济的统一评价提供了新的思路,但面对当今产业生态学发展的实践需求,在多尺度整合分析、动态模型构建等方面仍显薄弱,需要与经济学等其他学科相对成熟的分析方法与模型加以整合。文章以能值综... 能值分析方法为自然环境资源与人类社会、经济的统一评价提供了新的思路,但面对当今产业生态学发展的实践需求,在多尺度整合分析、动态模型构建等方面仍显薄弱,需要与经济学等其他学科相对成熟的分析方法与模型加以整合。文章以能值综合方法为核心介质,从成本分析与效果分析的整合、能值分析与区域经济分析的整合,以及能值分析表与投入-产出矩阵模型的整合三个方面进行了产业生态学的能值整合研究方法的具体构建,以促进能值理论方法与产业生态学研究需求的进一步耦合。 展开更多
关键词 产业生态系统 能值 多尺度 整合评价
下载PDF
基础土壤学研究的方法论思考:基于土壤化学的视角 被引量:6
7
作者 李航 杨刚 《土壤学报》 CAS CSCD 北大核心 2017年第4期819-826,共8页
长期以来,不少人片面地认为,土壤学在学科属性上仅是应用型的,在研究手段上仅是实验型的,在研究方法上必须是整体综合的。本文系统地分析了这些片面认识对土壤学发展的危害,提出土壤学发展应特别强调"分析"的方法,并在深入分... 长期以来,不少人片面地认为,土壤学在学科属性上仅是应用型的,在研究手段上仅是实验型的,在研究方法上必须是整体综合的。本文系统地分析了这些片面认识对土壤学发展的危害,提出土壤学发展应特别强调"分析"的方法,并在深入分析的基础上实现自然而系统的综合。阐述了土壤学研究的三个基本观点:一是充分认识土壤系统的特殊性根基在于其对物质亚原子结构的重大影响。与普通水溶液中的情况相比,土壤中的离子、原子和分子在本质上已发生了很大变化。所以,如果土壤确实从亚原子尺度上改变了物质的结构与性质,开展土壤学中独特的量子效应研究将是重要的。其次,充分考虑土壤系统的特殊性,在方法上应从宏观尺度、介观尺度、分子尺度至亚原子尺度对土壤进行逐级分解简化,并借助于量子力学原理和方法,最终,在亚原子尺度上彻底剖析土壤,以获得土壤学自己的科学基础。第三,以土壤中独特的量子效应为基础的研究,可构建"亚原子结构—土壤微观机制—宏观效应"三者间的直接关联,由此实现土壤中不同尺度间科学原理的自然转换,最终构建独立的土壤学知识体系。 展开更多
关键词 先分析后综合 多尺度分解 亚原子结构 量子力学
下载PDF
集成桅杆缩比模型冲击试验方法研究 被引量:2
8
作者 张玮 韩晨健 +1 位作者 杜志鹏 李晓彬 《兵工学报》 EI CAS CSCD 北大核心 2015年第S1期206-212,共7页
集成桅杆是舰船上着重考核的典型抗冲击部位,但缺少冲击响应试验数据,制约了抗冲击设计。将集成桅杆简化为等效梁模型,提出一种基于多几何缩比的集成桅杆缩比模型冲击试验方法,包括模型相似设计、载荷输入缩比、实船换算关系等。通过数... 集成桅杆是舰船上着重考核的典型抗冲击部位,但缺少冲击响应试验数据,制约了抗冲击设计。将集成桅杆简化为等效梁模型,提出一种基于多几何缩比的集成桅杆缩比模型冲击试验方法,包括模型相似设计、载荷输入缩比、实船换算关系等。通过数值仿真验证了这种试验方法的可靠性。研究结果表明,集成桅杆缩比模型反映了集成桅杆的动力特性,使用缩比模型可以准确预报集成桅杆的冲击环境。这一套缩比模型的冲击试验方法是可行的。 展开更多
关键词 爆炸力学 水下爆炸 集成桅杆 冲击试验 悬臂梁 多几何缩比 缩比模型
下载PDF
反应器-催化剂颗粒双尺度分析费托合成的产物分布及其影响因素 被引量:4
9
作者 曹军 张莉 徐宏 《石油学报(石油加工)》 EI CAS CSCD 北大核心 2017年第2期252-260,共9页
在考虑产物液膜传质阻力的情况下,构建了反应器-催化剂颗粒双尺度费托合成产物分布的多场耦合数学模型,讨论了产物液膜及催化剂粒径对产物分布特性的影响。结果表明,产物碳原子选择性的计算结果符合费托合成经典的ASF分布。反应物浓度... 在考虑产物液膜传质阻力的情况下,构建了反应器-催化剂颗粒双尺度费托合成产物分布的多场耦合数学模型,讨论了产物液膜及催化剂粒径对产物分布特性的影响。结果表明,产物碳原子选择性的计算结果符合费托合成经典的ASF分布。反应物浓度在催化剂颗粒表面处的浓度最高,沿着半径方向向中心处不断降低,而产物的浓度分布状态则正好相反。沿着流动方向,主体气流中反应物CO的浓度要高于催化剂内部平均值,产物C_(5+)浓度则与此相反;且浓度差异在反应器入口部分最为明显,随着反应不断进行,催化剂颗粒内外组分的浓度差异逐渐缩小。此外,催化剂粒径越大,颗粒内部组分的浓度差也越大,而减小粒径可以降低液态产物传质阻力,同时有效避免催化剂的"死区"现象,有利于提高其利用效率。 展开更多
关键词 费托合成 液膜传质系数 扩散限制效应 多尺度多物理场耦合分析
下载PDF
可控的连续多尺度纹理合成 被引量:4
10
作者 李大锦 《计算机工程》 CAS CSCD 北大核心 2009年第24期211-212,215,共3页
针对同一幅合成图像的不同区域间,如何实现纹理图案的多尺度连续变化,提出一种基于像素的多尺度纹理合成算法。在逐像素点合成的基础上,通过为已知匹配点建立一个到连续的多分辨率样图的正向映射,并重新采样合成像素点,实现合成结果的... 针对同一幅合成图像的不同区域间,如何实现纹理图案的多尺度连续变化,提出一种基于像素的多尺度纹理合成算法。在逐像素点合成的基础上,通过为已知匹配点建立一个到连续的多分辨率样图的正向映射,并重新采样合成像素点,实现合成结果的任意尺度连续渐变的可控性。实验证明该方法不增加大量的处理时间,并可适用于大多数基于样图的逐点合成方法。 展开更多
关键词 纹理合成 多尺度 重采样
下载PDF
VR技术下多投影视频纹理合成方法仿真 被引量:3
11
作者 袁帅 张静 《计算机仿真》 北大核心 2021年第4期151-154,163,共5页
为解决纹理合成过程需要消耗大量时空资源的问题,提出一种VR技术下多投影视频纹理合成方法。设计以VR内容制作环节为核心的VR视频处理,经过拼接、投影映射与投影图像帧纹理合成生成一个封装帧,通过服务器显示在客户端。针对VR视频内三... 为解决纹理合成过程需要消耗大量时空资源的问题,提出一种VR技术下多投影视频纹理合成方法。设计以VR内容制作环节为核心的VR视频处理,经过拼接、投影映射与投影图像帧纹理合成生成一个封装帧,通过服务器显示在客户端。针对VR视频内三维平面或曲面场景,通过屏幕投影将三维场景透视变换投影至二维平面上。赋予二维平面上的三角网格一个连续的缩放因子场,将给定纹理缩放成不同等级,令其与网格上的缩放因子相对应。采用曲面纹理合成方法,利用矢量加平滑方法确定曲面内各三角面片的纹理方向矢量场,根据这些纹理方向合成纹理;依照扫描线顺序搜索样本纹理空间,确定对匹配的纹理坐标,结合缩放因子实现纹理合成。仿真结果表明,上述方法纹理合成用时与对比方法相比下降300%以上,存储空间与对比方法相比节省50%以上。 展开更多
关键词 VR技术 多投影 视频 纹理合成 缩放因子场 方向矢量场
下载PDF
结合编码-解码网络和条件随机场的全极化合成孔径雷达土地覆盖分类 被引量:1
12
作者 赵泉华 谢凯浪 +1 位作者 王光辉 李玉 《模式识别与人工智能》 EI CSCD 北大核心 2019年第12期1122-1132,共11页
针对多极化合成孔径雷达影像地物分类特征表征性较弱及全卷积网络分类精度较低的问题,文中提出结合编码-解码网络(E-D-Net)和条件随机场(CRF)的全极化合成孔径雷达(SAR)土地覆盖分类算法.首先,利用Freeman分解和Pauli分解建模全极化SAR... 针对多极化合成孔径雷达影像地物分类特征表征性较弱及全卷积网络分类精度较低的问题,文中提出结合编码-解码网络(E-D-Net)和条件随机场(CRF)的全极化合成孔径雷达(SAR)土地覆盖分类算法.首先,利用Freeman分解和Pauli分解建模全极化SAR影像,提取各分解对应的散射特征.再借鉴语义分割网络模型的建模思想和多尺度卷积单元构建对称网络模型,将多尺度非对称卷积单元嵌入中层,设计E-D-Net网络模型.通过E-D-Net网络模型对PolSAR影像Freeman分解散射特征进行多层自主学习,获得初始分类结果.最后,利用全连接CRF结合Pauli相干分解伪彩色图信息,对初始分类结果再进行降噪和平滑优化,得到最终分类结果.在两地区PolSAR影像上的实验验证文中算法的有效性和可行性. 展开更多
关键词 土地覆盖分类 全卷积网络(FCN) 条件随机场(CRF) 多极化合成孔径雷达(PolSAR) 多尺度卷积单元(MCU)
下载PDF
GIS中曲线综合模型的建立及拓展
13
作者 王明常 邢立新 +2 位作者 谷兰英 牛雪峰 李建平 《吉林大学学报(信息科学版)》 CAS 2006年第5期520-525,共6页
针对地图中水系、道路、境界线等线状要素的制图综合中的图形简化问题,利用小波分析的多分辨率分析原理,建立多分辨率小波分析思想和空间数据多尺度表达之间关系,提出了线状要素空间多尺度表达数学模型。对线状要素进行综合和平滑,实现... 针对地图中水系、道路、境界线等线状要素的制图综合中的图形简化问题,利用小波分析的多分辨率分析原理,建立多分辨率小波分析思想和空间数据多尺度表达之间关系,提出了线状要素空间多尺度表达数学模型。对线状要素进行综合和平滑,实现了线状要素的空间多尺度表达。结合实例探讨了数学模型的特点、拓扑一致性和模型拓展等问题。 展开更多
关键词 曲线综合 多分辨率分析 多尺度表达 数学模型
下载PDF
基于动态卷积的多模态脑MR图像生成
14
作者 孙君顶 杨鸿章 +2 位作者 闫艺丹 毋小省 唐朝生 《计算机系统应用》 2022年第8期305-313,共9页
近年来,通过自动生成方法获取多模态MR图像得到了广泛研究,但仍难以通过一种模态直接生成其他各类模态的图像.针对该问题,本文提出了动态生成对抗网络.新模型通过将生成对抗网络与动态卷积相结合,同时加入任务标签这一条件,实现从一种M... 近年来,通过自动生成方法获取多模态MR图像得到了广泛研究,但仍难以通过一种模态直接生成其他各类模态的图像.针对该问题,本文提出了动态生成对抗网络.新模型通过将生成对抗网络与动态卷积相结合,同时加入任务标签这一条件,实现从一种MR模态同时生成其他3种MR模态.同时为了提高图像生成质量,进一步提出了多尺度判别策略,通过融合多个尺度来提升判别效果.基于BRATS19数据集进行生成验证,实验结果表明,新方法不但可以同时生成多种模态的数据,而且提高了生成图像的质量. 展开更多
关键词 图像生成 多模态 动态卷积 动态生成对抗网络 多尺度判别器 深度学习 生成对抗网络
下载PDF
二芳基甲基哌嗪阿片受体激动剂DPI-3290的合成方法研究 被引量:1
15
作者 刘许歌 崔本强 +1 位作者 杨帆 沈悦海 《云南民族大学学报(自然科学版)》 CAS 2013年第4期242-245,共4页
报道了二芳基甲基哌嗪阿片受体激动剂DPI-3290的一种新的合成路线.该合成的关键步骤是一个四组分三步串联反应,通过对这一反应的条件和操作的优化,以41%的较好产率得到了预期产物.应用这一路线,以四步直线步骤和16.8%的总产率实现了DPI-... 报道了二芳基甲基哌嗪阿片受体激动剂DPI-3290的一种新的合成路线.该合成的关键步骤是一个四组分三步串联反应,通过对这一反应的条件和操作的优化,以41%的较好产率得到了预期产物.应用这一路线,以四步直线步骤和16.8%的总产率实现了DPI-3290的克级制备. 展开更多
关键词 DPI-3290 二芳基甲基哌嗪 克级制备
下载PDF
基于机械结构的动态物体设计的研究进展 被引量:2
16
作者 杜冬 王士玮 刘利刚 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第2期99-116,共18页
为了打破传统动态结构设计的专业领域束缚,研究者们提出了一种"从运动到形式"的可计算、交互式设计思路,辅以材质分析、运动学与力学仿真、模型分割、结构分析与布局、碰撞检测、3D打印快速成型等技术,自动模拟动态物体设计... 为了打破传统动态结构设计的专业领域束缚,研究者们提出了一种"从运动到形式"的可计算、交互式设计思路,辅以材质分析、运动学与力学仿真、模型分割、结构分析与布局、碰撞检测、3D打印快速成型等技术,自动模拟动态物体设计制造过程,使得缺乏专业知识的普通用户都能设计出个性化的动态物体,大大简化了结构设计,节约了设计成本.虽然可计算的动态机械结构设计已经取得很大进展,但依旧面临许多物理结构、力学分析、环境感知的问题与挑战.本文基于材料选择和结构设计的差异,将现有的研究工作分为微观、中观和宏观多个尺度进行综述,又根据设计目的和运动方式的不同,进一步将其中研究最广的宏观尺度分为运动驱动、形状驱动和功能驱动三类机械结构设计,并分别介绍各自方法的特点和不足,结合新兴技术、用户体验、场景应用等对机械结构设计今后的研究进行了展望. 展开更多
关键词 动态机械学 多尺度结构 运动综合 计算设计 3D打印
下载PDF
融合残差和对抗网络的跨模态PET图像合成方法 被引量:4
17
作者 肖晨晨 陈乐庚 王书强 《计算机工程与应用》 CSCD 北大核心 2022年第1期218-223,共6页
针对现有跨模态图像合成方法不能很好地捕获人体组织的空间信息与结构信息,合成的图像具有边缘模糊、信噪比低等问题,提出一种融合残差模块和生成对抗网络的跨模态PET图像合成方法。该算法在生成器网络中引入改进的残差初始模块和注意... 针对现有跨模态图像合成方法不能很好地捕获人体组织的空间信息与结构信息,合成的图像具有边缘模糊、信噪比低等问题,提出一种融合残差模块和生成对抗网络的跨模态PET图像合成方法。该算法在生成器网络中引入改进的残差初始模块和注意力机制,减少参数量的同时增强了生成器的特征学习能力。判别器采用多尺度判别器,以提升判别性能。损失函数中引入多层级结构相似损失,以更好地保留图像的对比度信息。该算法在ADNI数据集上与主流算法进行对比,实验结果表明,合成PET图像的MAE指标有所下降,SSIM与PSNR指标有所提升。实验结果显示,提出的模型能很好地保留图像的结构信息,在视觉和客观指标上都能提高合成图像的质量。 展开更多
关键词 跨模态图像合成 生成对抗网络 残差初始模块 多尺度判别器
下载PDF
3-溴-5-硝基苯基苄基醚的克级制备方法研究 被引量:1
18
作者 杨帆 刘许歌 +1 位作者 王应飞 沈悦海 《云南民族大学学报(自然科学版)》 CAS 2013年第5期327-329,共3页
报道了3-溴-5-硝基苯基苄基醚的制备方法 .苄醇对3,5-二硝基溴苯的芳香亲核取代反应极易受后续副反应的影响,对反应中碱、溶剂、浓度、温度、反应时间和投料量等因素进行了系统的研究,发现在DMF中50℃下与苄醇和叔丁醇钾反应10 min可以... 报道了3-溴-5-硝基苯基苄基醚的制备方法 .苄醇对3,5-二硝基溴苯的芳香亲核取代反应极易受后续副反应的影响,对反应中碱、溶剂、浓度、温度、反应时间和投料量等因素进行了系统的研究,发现在DMF中50℃下与苄醇和叔丁醇钾反应10 min可以高产率得到克级目标产物.反应体系的颜色变化可作为判断反应终点的指标. 展开更多
关键词 3-溴-5-硝基苯基苄基醚 芳香亲核取代 克级制备
下载PDF
基于条件对抗自动编码器的跨年龄人脸合成
19
作者 程志康 孙锐 +1 位作者 孙琦景 张旭东 《计算机工程》 CAS CSCD 北大核心 2022年第6期304-313,共10页
跨年龄人脸合成是指通过已知特定年龄的人脸图像合成其他年龄段的人脸图像,在动漫娱乐、公共安全、刑事侦查等领域有广泛的应用。针对跨年龄人脸合成图像容易产生器官变形扭曲、人脸局部特征保持效果不佳等问题,提出一种基于条件对抗自... 跨年龄人脸合成是指通过已知特定年龄的人脸图像合成其他年龄段的人脸图像,在动漫娱乐、公共安全、刑事侦查等领域有广泛的应用。针对跨年龄人脸合成图像容易产生器官变形扭曲、人脸局部特征保持效果不佳等问题,提出一种基于条件对抗自动编码器的合成方法。通过在解码器结构中引入通道关注和空间关注模块,分别从通道域和空间域提取重要信息,使模型在训练过程中忽略背景等无关信息,聚焦人脸图像变化的区域,有效解决合成图像器官扭曲变形等问题。此外,设计一种多尺度特征损失网络,从多个尺度更深层次地约束人脸图像的局部结构特征,从而保持人脸合成过程中局部特征结构的稳定性。在UTKFace跨年龄人脸数据集上的实验结果表明,与CAAE方法相比,该方法有效避免了人脸器官变形扭曲问题,能够更好地保持人脸局部结构特征,具有较佳的人脸合成效果和细节保持能力。 展开更多
关键词 跨年龄人脸合成 条件对抗自动编码器 通道关注模块 空间关注模块 多尺度特征损失网络
下载PDF
基于HiFi-GAN的改进型高效声码器 被引量:1
20
作者 唐君 张连海 +1 位作者 李嘉欣 李宜亭 《信号处理》 CSCD 北大核心 2022年第9期1988-1998,共11页
HiFi-GAN声码器通过采用缩减网络层的通道数或层数的方式来有效减少模型参数、提高推理速度,但此种方式也严重损害了生成语音的质量。针对此问题,提出了两点改进措施:1.采用多尺度卷积策略对输入Mel谱进行处理来有效表征特征信息;2.采... HiFi-GAN声码器通过采用缩减网络层的通道数或层数的方式来有效减少模型参数、提高推理速度,但此种方式也严重损害了生成语音的质量。针对此问题,提出了两点改进措施:1.采用多尺度卷积策略对输入Mel谱进行处理来有效表征特征信息;2.采用一维深度可分离卷积替换生成器网络中的标准一维卷积。实验结果表明,多尺度卷积策略有效提升了模型性能,提高了生成语音的质量,而一维深度可分离卷积显著减少了模型参数量并加快了模型推理速度。通过将这两者结合,有效提升了HiFi-GAN模型的性能,具体来说,模型参数量约减少了67.72%,在GPU、CPU上的推理速度分别提升了11.72%、28.98%。此外,语音质量也得到略微提升,平均主观意见分(Mean Opinion Score,MOS)提升了0.07,客观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)得分提升了0.05。 展开更多
关键词 语音合成 声码器 HiFi-GAN 深度可分离卷积 多尺度卷积策略
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部