期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于扩散模型的条件引导图像生成综述 被引量:1
1
作者 刘泽润 尹宇飞 +2 位作者 薛文灏 郭蕊 程乐超 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2023年第6期651-667,共17页
基于人工智能技术的生成内容(artificial intelligence generated content,AIGC)已成为当下的热门话题。在众多生成模型中,扩散模型因其高度可解释的数学特性及高质量和多样性的结果引起广泛关注,在条件引导的图像生成领域已取得显著成... 基于人工智能技术的生成内容(artificial intelligence generated content,AIGC)已成为当下的热门话题。在众多生成模型中,扩散模型因其高度可解释的数学特性及高质量和多样性的结果引起广泛关注,在条件引导的图像生成领域已取得显著成果,被广泛应用于电影、游戏、绘画和虚拟现实等领域,在文本引导的图像生成任务中,扩散模型不仅能生成高分辨率的图像,而且能保证生成图像的质量。首先介绍了扩散模型的定义和相关背景,然后重点介绍了扩散模型在条件引导的图像生成领域的发展历程和最新进展,最后探讨了扩散模型面临的挑战和潜在的发展方向,旨在为广大研究人员提供相关领域的研究概况和前沿动态。 展开更多
关键词 扩散模型 条件引导的图像生成 应用
下载PDF
一种自适应的EMD端点延拓方法 被引量:71
2
作者 邵晨曦 王剑 +2 位作者 范金锋 杨明 王子才 《电子学报》 EI CAS CSCD 北大核心 2007年第10期1944-1948,共5页
由美国国家航空航天局(NASA)的Huang等发明的经验模态分解(EMD)是一种先进的信号处理方法,能够有效地获得非平稳信号的时频特征,但是其利用样条曲线构造信号上下包络线的过程中存在严重的端点问题.在研究了该问题已有方法的基础上,提出... 由美国国家航空航天局(NASA)的Huang等发明的经验模态分解(EMD)是一种先进的信号处理方法,能够有效地获得非平稳信号的时频特征,但是其利用样条曲线构造信号上下包络线的过程中存在严重的端点问题.在研究了该问题已有方法的基础上,提出了一种基于波形匹配的自适应端点延拓方法,采用信号内部和端点处变化趋势最为相似的子波来对端点处的信号进行延拓.该方法充分考虑了信号的内在特性以及边缘处的变化趋势,使端点处的延拓更加合理,从而使得三次样条曲线在端点处不会发生大的摆动.实验表明该方法能够有效地抑制端点效应. 展开更多
关键词 经验模态分解 端点效应 自适应方法
下载PDF
姿态鲁棒的分块稀疏表示人脸识别算法 被引量:15
3
作者 平强 庄连生 俞能海 《中国科学技术大学学报》 CAS CSCD 北大核心 2011年第11期975-981,共7页
针对稀疏表示人脸识别算法对姿态变化敏感的问题,提出一种姿态鲁棒的分块稀疏表示人脸识别算法,通过对人脸进行分块表示并利用仿射变换模型对姿态变化建模,提高稀疏表示人脸识别算法对姿态变化的鲁棒性.同时,通过最小化图像分块重构误... 针对稀疏表示人脸识别算法对姿态变化敏感的问题,提出一种姿态鲁棒的分块稀疏表示人脸识别算法,通过对人脸进行分块表示并利用仿射变换模型对姿态变化建模,提高稀疏表示人脸识别算法对姿态变化的鲁棒性.同时,通过最小化图像分块重构误差来估计仿射变换参数初值,有效提高仿射变换参数估计精度,进而提升人脸识别算法的性能.实验结果表明,本文算法可在一定程度上克服姿态变化造成的对齐误差,比现有相关算法具有更好的姿态鲁棒性和识别性能. 展开更多
关键词 人脸识别 稀疏表示 仿射变换 分块表示
下载PDF
采用对象特征向量表示法的标签聚类算法 被引量:8
4
作者 周津 陈超 俞能海 《小型微型计算机系统》 CSCD 北大核心 2012年第3期525-530,共6页
在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标... 在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果. 展开更多
关键词 标签聚类 标记系统 特征向量 K-MEANS 余弦相似度
下载PDF
视线跟踪过程中变形瞳孔的定位 被引量:4
5
作者 张文聪 李斌 +2 位作者 邓宏平 谭文明 庄镇泉 《电子与信息学报》 EI CSCD 北大核心 2010年第2期416-421,共6页
在视线跟踪过程中,变形瞳孔的定位至关重要。针对眼部图像出现干扰情况下的变形瞳孔定位,该文提出了一种基于3点的随机采样一致性定位算法RANSAC_3,即利用随机采样到的2点(以及它们的梯度方向)和搜索获得的1个点来确定椭圆参数。由于该... 在视线跟踪过程中,变形瞳孔的定位至关重要。针对眼部图像出现干扰情况下的变形瞳孔定位,该文提出了一种基于3点的随机采样一致性定位算法RANSAC_3,即利用随机采样到的2点(以及它们的梯度方向)和搜索获得的1个点来确定椭圆参数。由于该算法在确定参数时只需随机采样两个点,从而大大降低了采样到干扰点的几率,利用搜索到的第3点来决定是否对当前点进行参数计算,有效地解决了标准随机采样一致性定位算法中的无效采样和误差累积问题,提高了椭圆拟合效率和瞳孔定位精度。实验证明,该算法对变形瞳孔具有很好的定位效果,对光斑、睫毛、头发、眼镜框以及眼球运动模糊的引起的干扰具有较强的鲁棒性,并且定位速度快,可以达到实时要求。 展开更多
关键词 视线跟踪 变形瞳孔定位 随机采样一致性 最小二乘法
下载PDF
姿态和光照可变条件下的仿射最小线性重构误差人脸识别算法 被引量:5
6
作者 平强 庄连生 俞能海 《电子学报》 EI CAS CSCD 北大核心 2012年第10期1965-1970,共6页
传统人脸识别算法通常把光照处理和姿态校正作为两个相对独立的处理过程,难以取得全局最优识别性能.针对该问题,本文根据人脸的非刚体特性,将仿射变换和分块思想融入线性重构模型中,提出了一种基于仿射最小线性重构误差(Affine Minimum ... 传统人脸识别算法通常把光照处理和姿态校正作为两个相对独立的处理过程,难以取得全局最优识别性能.针对该问题,本文根据人脸的非刚体特性,将仿射变换和分块思想融入线性重构模型中,提出了一种基于仿射最小线性重构误差(Affine Minimum Linear Reconstruction Error,AMLRE)的人脸识别算法,在处理光照问题的同时能够补偿姿态变化造成的局部区域对齐误差,以获得更好的全局识别性能.在公共数据集上的实验结果表明,本文提出的算法对光照和姿态有很好的鲁棒性,同时与现有的人脸识别算法相比,本文的算法具有更高的识别率. 展开更多
关键词 人脸识别 线性重构 仿射变换 Lucas-Kanade算法
下载PDF
基于鲁棒统计量的运动检测与目标跟踪策略 被引量:3
7
作者 胡玉锁 陈会勇 陈宗海 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第2期439-443,共5页
提出了一种基于鲁棒统计量的运动检测方法。该方法通过对全局运动的鲁棒估计和对残差进行假设检验的方法来检测运动物体区域。为了消除遮挡效应的影响,提高算法的精度,在检测过程中,利用双向运动估计的方法来对残差进行归一化。在此基础... 提出了一种基于鲁棒统计量的运动检测方法。该方法通过对全局运动的鲁棒估计和对残差进行假设检验的方法来检测运动物体区域。为了消除遮挡效应的影响,提高算法的精度,在检测过程中,利用双向运动估计的方法来对残差进行归一化。在此基础上,提出了一种鲁棒主动轮廓模型,用于跟踪运动物体轮廓,并采用LevelSet方法对该模型进行求解。实际视频的实验结果表明,该方法能够可靠、准确的检测与跟踪运动物体。 展开更多
关键词 机器视觉 运动检测 物体跟踪 鲁棒估计 主动轮廓模型:LevelSet
下载PDF
基于ASM的人脸特征点自动标定 被引量:2
8
作者 庄连生 张浩 +1 位作者 杨俊安 庄镇泉 《电路与系统学报》 CSCD 北大核心 2006年第3期101-105,95,共6页
针对经典弹性图匹配算法中人脸特征点的定位问题,本文提出了一种利用机器自标定来代替传统的手工标定的算法。本文算法首先利用可变形状模型拟合出人脸的轮廓,得到人脸关键特征点位置的初始估计,然后利用参考图像中对应特征点的Gabor系... 针对经典弹性图匹配算法中人脸特征点的定位问题,本文提出了一种利用机器自标定来代替传统的手工标定的算法。本文算法首先利用可变形状模型拟合出人脸的轮廓,得到人脸关键特征点位置的初始估计,然后利用参考图像中对应特征点的Gabor系数调整初始位置,最终实现关键特征点的精确定位。实验结果表明,算法可以有效地定位出人脸特征点,定位结果稳定。 展开更多
关键词 可变形状模型(ASM) 弹性图匹配 人脸识别 GABOR小波
下载PDF
主动表观模型在光照变化影响下的人脸特征点定位 被引量:2
9
作者 张浩 庄连生 +2 位作者 王涌 庄镇泉 李斌 《电路与系统学报》 CSCD 北大核心 2009年第1期72-76,71,共6页
在光照条件恶劣的情况下,基于主动表观模型(AAM)的人脸特征点搜索与定位算法的精度和鲁棒性会显著下降。本文提出采用全变分模型对图像进行光照预处理,通过对基于反射系数图的特征纹理建模来帮助特征点定位。通过实验对比,分析了本文算... 在光照条件恶劣的情况下,基于主动表观模型(AAM)的人脸特征点搜索与定位算法的精度和鲁棒性会显著下降。本文提出采用全变分模型对图像进行光照预处理,通过对基于反射系数图的特征纹理建模来帮助特征点定位。通过实验对比,分析了本文算法在定位精度和鲁棒性上的提高。 展开更多
关键词 特征点定位 主动表观模型 反射系数图
下载PDF
移动自组网中一种基于集群的Byzantine节点检测机制 被引量:1
10
作者 刘洋 俞能海 冯现磊 《电子与信息学报》 EI CSCD 北大核心 2006年第12期2386-2389,共4页
该文主要介绍了移动自组网中一种基于集群方法的Byzantine错误检测机制。并结合CBRP,提出了一种适合移动自组网的内部出错节点清除算法。通过算法分析证明了所提出的算法可以显著减少清除具有Byzantine错误节点时所需的消息数目,降低了... 该文主要介绍了移动自组网中一种基于集群方法的Byzantine错误检测机制。并结合CBRP,提出了一种适合移动自组网的内部出错节点清除算法。通过算法分析证明了所提出的算法可以显著减少清除具有Byzantine错误节点时所需的消息数目,降低了网络负载,有效提高了移动自组网的安全性和可信度。 展开更多
关键词 Byzantine将军问题 移动自组网 集群 安全
下载PDF
基于全变分模型的光照处理算法 被引量:1
11
作者 庄连生 龙飞 +1 位作者 庄镇泉 李斌 《电路与系统学报》 CSCD 北大核心 2008年第5期103-107,共5页
针对人脸识别中的光照问题,本文提出了一种利用全变分模型的光照处理算法。该算法模型简单,需要设置的参数少,并能有效地减少光晕现象。算法首先利用全变分模型来估计图像中的光照成分,然后恢复出人脸的反射系数图,并以该反射系数图作... 针对人脸识别中的光照问题,本文提出了一种利用全变分模型的光照处理算法。该算法模型简单,需要设置的参数少,并能有效地减少光晕现象。算法首先利用全变分模型来估计图像中的光照成分,然后恢复出人脸的反射系数图,并以该反射系数图作为光照不变量进行人脸识别。实验表明,基于全变分模型的光照处理算法能有效地提高人脸识别系统在不同光线条件下的识别率。 展开更多
关键词 人脸识别 光照处理 全变分模型 反射系数模型
下载PDF
一种针对大规模网络图像的自动标注改善算法 被引量:2
12
作者 王斌 俞能海 《电子与信息学报》 EI CSCD 北大核心 2009年第2期270-274,共5页
在对网络图像进行索引时,人们往往利用网页中图像周围的文字作为其近似标注信息,但是这些文字信息质量不高,不足以良好地描述图像内容。该文提出一种综合利用图像视觉特征、相关文本信息以及词汇间语义关系的方法对这些不精确的文本信... 在对网络图像进行索引时,人们往往利用网页中图像周围的文字作为其近似标注信息,但是这些文字信息质量不高,不足以良好地描述图像内容。该文提出一种综合利用图像视觉特征、相关文本信息以及词汇间语义关系的方法对这些不精确的文本信息进行改善,从而提高图像的索引和搜索质量。在大规模数据集上的实验证明了所提出的方法能够有效改善图像的标注。 展开更多
关键词 自动图像标注 标注改善 多模态学习
下载PDF
基于零树的视频压缩加密联合编码方案
13
作者 张荣 朱智超 +1 位作者 尹东 刘政凯 《通信学报》 EI CSCD 北大核心 2007年第6期111-116,共6页
针对可伸缩性视频流的安全性问题,提出了一种与编码相结合的加密方案。该方案以小波变换作为压缩平台,通过在零树生成的过程中对零树符号进行加密来保证视频的安全性,并且采用分级加密来满足不同用户对不同质量服务的需求。实验证明该... 针对可伸缩性视频流的安全性问题,提出了一种与编码相结合的加密方案。该方案以小波变换作为压缩平台,通过在零树生成的过程中对零树符号进行加密来保证视频的安全性,并且采用分级加密来满足不同用户对不同质量服务的需求。实验证明该方案一方面保持了编码的可伸缩性,另一方面提高了视频流的安全性,并且加密处理对压缩效率影响小,适用于网络上的视频流服务。 展开更多
关键词 小波变换 零树编码 可伸缩性 视频加密
下载PDF
基于诱导向量的CC4神经网络行为研究
14
作者 张振亚 张曙光 +1 位作者 程红梅 王煦法 《数据采集与处理》 CSCD 北大核心 2005年第4期454-457,共4页
角分类前向神经网络CC 4可以快速对文本数据进行分类处理。本文在定义二值向量的诱导向量的基础上,给出CC 4神经网络隐层、输出层的权矩阵构造方法的诱导向量分析,并给出CC 4神经网络隐层输出的基本原理、基于泛化距离的隐层权矩阵构造... 角分类前向神经网络CC 4可以快速对文本数据进行分类处理。本文在定义二值向量的诱导向量的基础上,给出CC 4神经网络隐层、输出层的权矩阵构造方法的诱导向量分析,并给出CC 4神经网络隐层输出的基本原理、基于泛化距离的隐层权矩阵构造方法的几何解释,以及输出层权矩阵构造的约束条件;揭示了角分类神经网络学习、工作的基本原理。本文为基于实向量输入的快速角分类神经网络的设计提供了借鉴及必要的理论基础。 展开更多
关键词 前向神经网络 快速分类 泛化半径 泛化距离
下载PDF
一种用于鲁棒性说话人确认的分段概率分布参数规整方法
15
作者 解焱陆 刘青松 +1 位作者 戴蓓蒨 李辉 《电路与系统学报》 CSCD 北大核心 2008年第6期91-95,90,共6页
目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意... 目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意义上降低特征参数偏离高斯分布的程度,从而可以用较低混合度的高斯混合模型对其建模。同时,这种映射也是一种无监督规整,因此可以提高系统的鲁棒性及其确认性能。在NIST'03数据库上的实验表明,在使用相同混合度模型的情况下,概率分布规整后的参数相对于变换前的参数系统性能可以提高11%左右。 展开更多
关键词 概率分布规整 高斯分布 MFCC GMM-UBM 说话人确认
下载PDF
一种基于运动特征的快速有效的视频镜头全拼图方法
16
作者 梅涛 周荷琴 华先胜 《中国图象图形学报》 CSCD 北大核心 2007年第3期511-516,共6页
由于全拼图能比关键帧提供更多的视觉信息,因此它已经成为视觉计算中一个重要的分析工具。为了提高全拼图的质量和拼图速度,提出了一种基于运动特征的快速有效的全拼图生成方法。该方法首先给定一个视频镜头,并基于运动相位熵的分析方... 由于全拼图能比关键帧提供更多的视觉信息,因此它已经成为视觉计算中一个重要的分析工具。为了提高全拼图的质量和拼图速度,提出了一种基于运动特征的快速有效的全拼图生成方法。该方法首先给定一个视频镜头,并基于运动相位熵的分析方法决定该镜头内容是否适合生成全拼图;然后,对于适合生成全拼图的镜头,通过构造全局运动路径的方法,仅需要挑选全部视频帧的一个子集用来生成高质量的全拼图。实验结果表明,与传统的全拼图方法相比,该新方法在提高全拼图的视觉质量的同时,显著地降低了计算时间。 展开更多
关键词 视频全拼图 运动相位熵 全局运动路径 视频内容表征
下载PDF
人脸像素画生成算法
17
作者 栾青 徐迎庆 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第12期1733-1739,共7页
为了让普通用户方便地得到像素画卡通头像,提出一种自动从人脸照片生成像素画的算法.首先通过对脸部特征定位找到关键特征,然后在低分辨率下对特征的形状和位置进行优化调整;在调整后的各个区域采用"画家调色盘"色彩校正方法... 为了让普通用户方便地得到像素画卡通头像,提出一种自动从人脸照片生成像素画的算法.首先通过对脸部特征定位找到关键特征,然后在低分辨率下对特征的形状和位置进行优化调整;在调整后的各个区域采用"画家调色盘"色彩校正方法对其颜色进行校正,生成像素画.实验结果表明,该算法能够生成结构清晰、色彩明快的像素画. 展开更多
关键词 像素画 画家调色盘 ASM人脸定位模型
下载PDF
关于学习空间及分类风险评价的非单调一致性
18
作者 何劲松 《计算机学报》 EI CSCD 北大核心 2007年第2期168-175,共8页
允许经验风险不为0是现代模式分类器构造方法区别于传统模式分类器构造方法的标志.为了进一步研究分类器构造观点的变化对模式分类系统所产生的更深入的影响,拓展模式分类系统的学习空间,作者讨论了限制经验风险必须为0的传统模式分类... 允许经验风险不为0是现代模式分类器构造方法区别于传统模式分类器构造方法的标志.为了进一步研究分类器构造观点的变化对模式分类系统所产生的更深入的影响,拓展模式分类系统的学习空间,作者讨论了限制经验风险必须为0的传统模式分类系统在分类性能问题上所受的限制,分析了影响模式分类系统分类性能的关键因素,给出了学习空间可拓展的必要条件,并构造了一种投机学习方法,证明了学习空间可拓展的充分条件.同时,在实验中观察到,分类器评价与测试集上的分类风险是非一致单调的.这一结论对于模式识别及其应用研究是严峻的. 展开更多
关键词 模式分类 机器学习 特征选择 混合学习 经验风险 实际风险
下载PDF
Laplace核函数的衰减系数研究
19
作者 何劲松 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第20期4848-4851,共4页
核函数的衰减系数是影响核函数方法分类性能的重要因素。分析了信号分析理论中关于采样信号的不失真重建问题与Parzen窗函数方法的关系,讨论了核函数残留边带信息量与指定采样频率条件下特征变量的自信息量之间的关系。推导了Laplace核... 核函数的衰减系数是影响核函数方法分类性能的重要因素。分析了信号分析理论中关于采样信号的不失真重建问题与Parzen窗函数方法的关系,讨论了核函数残留边带信息量与指定采样频率条件下特征变量的自信息量之间的关系。推导了Laplace核函数在均匀采样条件下的衰减系数的计算公式,分析并给出了非均匀采样情况下衰减系数计算和处理方法。实验结果表明,与传统的基于Gauss核函数的Parzen窗函数法、经典的KNN方法、BP神经网络以及SVM方法相比,提出的Laplace核函数参数设置方法具有较高的总体分类性能。 展开更多
关键词 模式分类 核函数 概率密度估计
下载PDF
一种新的基于语义聚类和图算法的自动图像标注方法 被引量:9
20
作者 芮晓光 袁平波 +1 位作者 何芳 俞能海 《中国图象图形学报》 CSCD 北大核心 2007年第2期239-244,共6页
针对图像检索中的语义鸿沟问题,提出了一种新颖的自动图像标注方法。该方法首先采用了一种基于软约束的半监督图像聚类算法(SHMRF-Kmeans)对已标注图像的区域进行语义聚类,这种聚类方法可以同时考虑图像的视觉信息和语义信息。并利用图... 针对图像检索中的语义鸿沟问题,提出了一种新颖的自动图像标注方法。该方法首先采用了一种基于软约束的半监督图像聚类算法(SHMRF-Kmeans)对已标注图像的区域进行语义聚类,这种聚类方法可以同时考虑图像的视觉信息和语义信息。并利用图算法——Manifold排序学习算法充分发掘语义概念与区域聚类中心的关系,得到两者的联合概率关系表。然后利用此概率关系表标注未知标注的图像。该方法与以前的方法相比可以更加充分地结合图像的视觉特征和高层语义。通过在通用图像集上的实验结果表明,本文提出的自动图像标注方法是有效的。 展开更多
关键词 半监督聚类 软约束 图像标注 Manifold排序学习算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部