期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于非定长编码和滑动窗口的隐私保护记录链接方法
1
作者 叶晓东 赵迎迎 +2 位作者 孙永奇 赵思聪 刘真 《计算机工程》 CAS CSCD 北大核心 2024年第2期154-164,共11页
隐私保护记录链接(PPRL)是一种跨不同数据库高效识别同一实体对象对应的记录而不泄露记录所代表实体对象的敏感或机密信息的方法。布隆过滤器(BF)广泛应用于PPRL,其将记录中的敏感信息进行编码并使用字符q-gram实现近似匹配。但是,BF编... 隐私保护记录链接(PPRL)是一种跨不同数据库高效识别同一实体对象对应的记录而不泄露记录所代表实体对象的敏感或机密信息的方法。布隆过滤器(BF)广泛应用于PPRL,其将记录中的敏感信息进行编码并使用字符q-gram实现近似匹配。但是,BF编码容易遭受密码分析攻击,且由于对q-gram位置不敏感,会导致记录匹配的精确率较低。提出一种基于非定长编码和滑动窗口的PPRL方法,其采用的非定长编码记录生成方式不仅使记录具有位置敏感性,而且通过对有效位前后添加随机位数组隐藏了实体的位数组频率信息,从而能够有效防御频率攻击。此外,设计一种基于滑动窗口的记录链接方式,先通过快速过滤筛除大量不匹配的记录,再使用双向滑动窗口的精确匹配策略对剩余记录进行匹配,提高隐私保护记录的匹配效率。在公开数据集上的实验结果表明,相比BF方法,该方法在编码速度上快100倍左右,其同时具有更高的匹配精度,在跨数据库PPRL方面的安全性也更强。 展开更多
关键词 布隆过滤器 字符串比较 隐私保护 记录链接 安全实体对齐
下载PDF
基于高光谱的枣树叶片氮素表征方法
2
作者 李旭 石子琰 +4 位作者 刘伟 白铁成 吴翠云 张宇阳 邬竞明 《华中农业大学学报》 CAS CSCD 北大核心 2023年第3期203-210,共8页
为提高枣树种植过程中施用氮肥的精准性,本研究以南疆重要经济作物骏枣(Ziziphus jujuba Mill.)为研究对象,通过对枣树叶片原始光谱和一阶微分光谱与全氮含量的相关性进行分析,利用光谱敏感变量构建植被指数作为衍生变量,再以衍生变量... 为提高枣树种植过程中施用氮肥的精准性,本研究以南疆重要经济作物骏枣(Ziziphus jujuba Mill.)为研究对象,通过对枣树叶片原始光谱和一阶微分光谱与全氮含量的相关性进行分析,利用光谱敏感变量构建植被指数作为衍生变量,再以衍生变量作为变量建立多种线性和非线性的氮素含量预测模型,并对氮素含量预测模型进行精度检验。结果显示:基于枣树原始光谱和一阶微分光谱的模型拟合决定系数均大于0.75,原始光谱变量的预测效果整体好于一阶微分光谱;预测效果最好的是基于原始光谱变量4的幂函数模型:Nit=1.097x^(0.735),R^(2)为0.821,RMSE为0.024 5。研究表明,建立的氮素含量预测模型能够实现基于高光谱反射率特征对枣树氮素的较好监测效果,能够作为枣树营养素诊断的重要理论依据。 展开更多
关键词 高光谱 枣树叶片 全氮含量 预测建模 线性模型
下载PDF
基于情感可控文本生成的可解释推荐系统
3
作者 邬俊 刘林 +1 位作者 卢香葵 罗芳媛 《闽南师范大学学报(自然科学版)》 2023年第4期24-34,共11页
文本生成是实现可解释推荐系统的有效技术途径之一,有利于提升用户对平台的满意度和信任感.然而,现有方法忽略了用户历史评论与目标物品之间的情感一致性问题,使得所生成的解释文本差强人意.以电商推荐场景为例,提出一种基于情感可控文... 文本生成是实现可解释推荐系统的有效技术途径之一,有利于提升用户对平台的满意度和信任感.然而,现有方法忽略了用户历史评论与目标物品之间的情感一致性问题,使得所生成的解释文本差强人意.以电商推荐场景为例,提出一种基于情感可控文本生成的可解释推荐框架.该框架由评分回归模型与解释生成模型串联而成,前者输出的预估评分作为情感查询,用于辅助后者从历史评论中甄选出情感一致的评论语料,并产生情感可控的解释文本.通过建立多任务联合学习机制,实现了评分回归模型与解释生成模型之间的双向互通和协同优化.四个电商场景下的实验结果表明,所提出方法在评分预测精度和文本生成质量两类指标上均具有显著的性能优势. 展开更多
关键词 可解释推荐系统 情感可控文本生成 评分回归 预训练语言模型
下载PDF
基于安全多方计算的图像分类方法
4
作者 孙永奇 宋泽文 +1 位作者 朱卫国 赵思聪 《信息网络安全》 CSCD 北大核心 2023年第11期27-37,共11页
文章针对基于安全多方计算(Secure Multi-Party Computation,MPC)的图像分类方法进行研究,针对基于ABY^(3)协议的PaddleFL方法无法支持复杂模型中的一些网络加密操作问题,提出一种面向ABY^(3)协议重复秘密共享的维度变换和维度压缩操作... 文章针对基于安全多方计算(Secure Multi-Party Computation,MPC)的图像分类方法进行研究,针对基于ABY^(3)协议的PaddleFL方法无法支持复杂模型中的一些网络加密操作问题,提出一种面向ABY^(3)协议重复秘密共享的维度变换和维度压缩操作的加密方法;针对基于Beaver协议的CrypTen方法在密文训练时出现的模型崩溃问题,提出一种基于标志位的检测方法,通过舍弃异常值避免模型训练的环绕错误;针对近似计算错误问题,提出一种基于阈值限制的Softmax函数密文计算方法,满足更大数值范围的密文计算。在公开数据集上进行实验,结果表明,该方法能够在保证模型准确性的前提下有效保护用户数据的隐私。 展开更多
关键词 图像分类 隐私保护机器学习 安全多方计算 PaddleFL CrypTen
下载PDF
前沿导向的人工智能课程内容重构——以上海交通大学“人工智能理论及应用”课程为例 被引量:6
5
作者 高岳 杨小康 《高等工程教育研究》 CSSCI 北大核心 2022年第6期52-55,共4页
前沿性融合与教学是工学类专业课程的重要内容之一,也是课程建设和教学实施过程中的一大难点。本文从上海交通大学“人工智能理论及应用”课程出发,总结教学团队在建设过程中前沿导向的教学理念以及前沿性课程建设的思路、举措和成效。... 前沿性融合与教学是工学类专业课程的重要内容之一,也是课程建设和教学实施过程中的一大难点。本文从上海交通大学“人工智能理论及应用”课程出发,总结教学团队在建设过程中前沿导向的教学理念以及前沿性课程建设的思路、举措和成效。通过对教学内容、课程实践、课程项目以及课程思政的内容重构,实现了前沿性与课程体系的有机融合,取得了显著的成效,并能够有效延伸推广至其他工学类专业课程,实现传统工学类课程的改造升级。 展开更多
关键词 前沿思维 高阶能力培养 人工智能 工学类专业课程
原文传递
面向可信联邦学习公平性的研究综述
6
作者 陈颢瑜 李浥东 +1 位作者 张洪磊 陈乃月 《电子学报》 EI CAS CSCD 北大核心 2023年第10期2985-3010,共26页
联邦学习能够促进多方参与者之间的数据共享和协同计算,其已经成为一种流行的分布式机器学习范式.联邦学习目前的研究主要集中在性能提升和隐私保护方面.近年来,随着可信人工智能研究的深入,可信联邦学习的研究也受到越来越多的关注.其... 联邦学习能够促进多方参与者之间的数据共享和协同计算,其已经成为一种流行的分布式机器学习范式.联邦学习目前的研究主要集中在性能提升和隐私保护方面.近年来,随着可信人工智能研究的深入,可信联邦学习的研究也受到越来越多的关注.其中,保证联邦学习的公平性是面临的关键问题之一.提升联邦学习的公平性能够保证客户端参与的积极性和联邦学习训练的可持续性.然而,由于联邦学习中通常存在着数据异构性和设备异构性,传统的联邦学习方法会导致客户端之间具有很大的差异,无法保证所有参与者之间的公平,这会极大地影响用户参与联邦学习的动力.基于此,对近年来联邦学习公平性的研究方法进行全面归纳梳理与深度探讨分析.首先对当前联邦学习公平性研究的主要方向进行划分,并对每个方向的公平性定义与评价标准进行了解释及对比.随后详细探讨了联邦学习公平性不同方向面临的挑战和主要解决方案.最后对联邦学习公平性研究中常用的数据集、实验场景设置和公平评价指标进行了归纳梳理,并对未来研究方向与发展趋势进行探讨和展望. 展开更多
关键词 可信赖 联邦学习 公平性 数据异构 协同计算
下载PDF
一种面向大场景3维显示的地形建模方法 被引量:18
7
作者 涂震飚 刘永才 +1 位作者 苏康 田金文 《测绘学报》 EI CSCD 北大核心 2004年第1期71-76,共6页
提出一种面向大范围3维场景显示的地形建模方法。该方法基于数字高程模型DEM(DigitalElevationModel)固有的栅格特点,将大范围场景划分成小的子块。根据应用对这些子块的精度要求,采用不同地形建模方法构建相应的细节层次LoD(LevelofDet... 提出一种面向大范围3维场景显示的地形建模方法。该方法基于数字高程模型DEM(DigitalElevationModel)固有的栅格特点,将大范围场景划分成小的子块。根据应用对这些子块的精度要求,采用不同地形建模方法构建相应的细节层次LoD(LevelofDetail)模型。最终,通过拼接这些子块模型完成对整个大场景的多分辨率建模,试验结果表明,该算法具有较好的实用性和有效性。 展开更多
关键词 数字高程模型 DEM 栅格 子块 地形建模 格网简化 3维可视化
下载PDF
非致冷红外探测器用氧化钒多晶薄膜的制备 被引量:8
8
作者 王宏臣 易新建 +2 位作者 陈四海 黄光 李雄伟 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2004年第1期64-66,共3页
采用离子束溅射镀膜和氧化工艺在Si(110 )和石英衬底上制备了用于非致冷红外探测器阵列热敏材料的混合相氧化钒多晶薄膜 .扫描电子显微镜 (SEM)照片显示 :薄膜表面呈针状晶粒状 ,而且薄膜表面光滑、致密 ,均匀性好 .测试结果表明 :氧化... 采用离子束溅射镀膜和氧化工艺在Si(110 )和石英衬底上制备了用于非致冷红外探测器阵列热敏材料的混合相氧化钒多晶薄膜 .扫描电子显微镜 (SEM)照片显示 :薄膜表面呈针状晶粒状 ,而且薄膜表面光滑、致密 ,均匀性好 .测试结果表明 :氧化钒薄膜的方块电阻和电阻温度系数 (TCR)在 2 0℃分别为 5 0KΩ和 - 0 .0 2 1K-1. 展开更多
关键词 非致冷红外探测器 氧化钒多晶薄膜 离子束溅射镀膜 电阻温度系数 半导体材料 薄膜结构
下载PDF
一种制备氧化钒薄膜的新工艺 被引量:11
9
作者 王宏臣 易新建 +2 位作者 黄光 肖静 陈四海 《半导体光电》 CAS CSCD 北大核心 2003年第4期280-282,共3页
 采用两步法工艺,即先在衬底上溅射一层金属钒膜,再对其进行氧化的方法,在硅和氮化硅衬底上制备了高电阻温度系数的混合相VOx多晶薄膜。电学测试结果表明:厚度为50nm的氧化钒薄膜的方块电阻和电阻温度系数(TCR)在室温时分别达到50kΩ和...  采用两步法工艺,即先在衬底上溅射一层金属钒膜,再对其进行氧化的方法,在硅和氮化硅衬底上制备了高电阻温度系数的混合相VOx多晶薄膜。电学测试结果表明:厚度为50nm的氧化钒薄膜的方块电阻和电阻温度系数(TCR)在室温时分别达到50kΩ和0.021K-1。 展开更多
关键词 红外探测器 氧化钒薄膜 离子束溅射淀积 热敏薄膜
下载PDF
三维海浪场的数值模拟及其动态仿真 被引量:13
10
作者 马杰 田金文 +2 位作者 柳健 王长青 沈秩厥 《系统仿真学报》 CAS CSCD 2001年第S2期39-41,44,共4页
根据研究线性海浪理论、海浪谱反演海浪数据的线性叠加法,反演出三维海浪场数据并进行多角度分析。结合飞行器掠海飞行仿真的实际需要,深入研究了PC机平台上大量三维海浪场数据的产生方法和显示方法。大量的仿真实验结果表明,本文所提... 根据研究线性海浪理论、海浪谱反演海浪数据的线性叠加法,反演出三维海浪场数据并进行多角度分析。结合飞行器掠海飞行仿真的实际需要,深入研究了PC机平台上大量三维海浪场数据的产生方法和显示方法。大量的仿真实验结果表明,本文所提方法是可行且有效的,对实际海浪场具有良好的模拟,可广泛应用于动态仿真、虚拟现实及相关领域。 展开更多
关键词 海浪 反演 海浪谱 仿真 三维
下载PDF
一种面向大场景仿真的显示方法 被引量:2
11
作者 涂震飚 刘永才 +2 位作者 苏康 关世义 田金文 《战术导弹技术》 2003年第5期58-62,67,共6页
为了实时显示多分辨率的大场景模型 ,提出一种面向三维大场景显示的场景数据结构 ,并基于该结构得到一种具有自适应性的显示算法 .试验结果表明 。
关键词 实时绘制 多细节层次 数据调度
下载PDF
马尔可夫决策过程和先验控制向量在弱约束自然语言生成中的应用 被引量:2
12
作者 刘奇 马娆 俞凯 《计算机学报》 EI CAS CSCD 北大核心 2022年第2期289-301,共13页
自然语言生成是目前非常重要且具有挑战性的一类人工智能任务.长短时记忆(Long Short-Term Memory,LSTM)语言模型是目前最为主流的自然语言生成模型.但是,LSTM语言模型的训练准则是词语级别的交叉熵,这会导致暴露偏差问题.此外,一般自... 自然语言生成是目前非常重要且具有挑战性的一类人工智能任务.长短时记忆(Long Short-Term Memory,LSTM)语言模型是目前最为主流的自然语言生成模型.但是,LSTM语言模型的训练准则是词语级别的交叉熵,这会导致暴露偏差问题.此外,一般自然语言生成任务的评测指标是序列级别的BLEU分数或者词错误率,这与训练使用的交叉熵准则也不匹配.在本文中,我们使用马尔可夫决策过程重定义了自然语言生成问题,并通过从训练数据中提取的先验控制向量来指导生成过程.先验控制向量可以视作是对序列空间的一种先验划分的抽象,通过在自然语言生成中引入先验控制向量,我们可以更好的约束自然语言生成的空间.再通过马尔可夫决策过程的定义,我们可以使用策略梯度算法来直接使用测试使用的BLEU分数来代替交叉熵训练LSTM网络.在多个数据集上的实验显示本文提出的方法相比于普通使用LSTM语言模型的基线系统在BLEU分数上有大约绝对2%~3%的提升. 展开更多
关键词 自然语言生成 马尔可夫决策过程 先验控制向量 策略梯度算法 深度强化学习
下载PDF
大规模人类移动行为建模及其智慧城市应用 被引量:1
13
作者 许岩岩 黄宗源 +2 位作者 严骏驰 金耀辉 杨小康 《人工智能》 2021年第5期53-60,共8页
在城市复杂系统中,人类移动行为是其运转的核心要素,探索人在地理空间中的移动行为规律是构建数字化城市的关键基础,并为传染病管控、城市规划、社会治理等提供科学指导。本研究利用大规模移动信令数据建模城市居民日常移动行为,并将移... 在城市复杂系统中,人类移动行为是其运转的核心要素,探索人在地理空间中的移动行为规律是构建数字化城市的关键基础,并为传染病管控、城市规划、社会治理等提供科学指导。本研究利用大规模移动信令数据建模城市居民日常移动行为,并将移动行为建模应用于解决城市发展面临的重大问题,包括优化新能源汽车移动和充电行为缓解电网压力,设计个体出行需求管理方案缓解交通拥堵,提出个体层面估测居民全天候空气污染物吸入量等。 展开更多
关键词 人类移动行为 轨迹大数据 智慧城市
下载PDF
一种基于结构张量的运动物体分割方法
14
作者 翟素兰 汤进 罗斌 《计算机工程与应用》 CSCD 北大核心 2008年第7期54-56,88,共4页
视频中运动物体的分割是众多视频应用的前提。视频可以看作是三维时空中的对象,通过邻域的灰度值的结构方向来分析视频的运动。提出了时空结构张量进行运动物体分割的方法。首先分析了视频中物体的运动与灰度的变化的关系,然后删除了三... 视频中运动物体的分割是众多视频应用的前提。视频可以看作是三维时空中的对象,通过邻域的灰度值的结构方向来分析视频的运动。提出了时空结构张量进行运动物体分割的方法。首先分析了视频中物体的运动与灰度的变化的关系,然后删除了三维结构张量中与时间无关的信息,并将此时空结构张量用于视频中运动物体的分割。实验表明时空结构张量运动物体分割方法相对于传统的结构张量,分割准确,计算简单。 展开更多
关键词 结构张量 运动物体分割 视频分析
下载PDF
Lü混沌系统的全局同步控制
15
作者 乔宗敏 程家兴 《昆明理工大学学报(理工版)》 2007年第1期45-49,共5页
研究了Lü提出的一个新的混沌系统的混沌同步问题,利用非线性控制方法设计了3种混沌同步控制器,并用李雅普诺夫方法证明了在混沌控制器作用下,驱动、响应混沌系统可以实现全局同步.数值仿真结果表明,所设计的3种混沌控制器都能有效... 研究了Lü提出的一个新的混沌系统的混沌同步问题,利用非线性控制方法设计了3种混沌同步控制器,并用李雅普诺夫方法证明了在混沌控制器作用下,驱动、响应混沌系统可以实现全局同步.数值仿真结果表明,所设计的3种混沌控制器都能有效的实现混沌同步,并且具有很强的鲁棒性. 展开更多
关键词 混沌系统 混沌同步 非线性控制
下载PDF
面向通用空域错误隐藏的自适应混合填充算法
16
作者 邓开连 刘浩 +1 位作者 黄荣 袁浩东 《中国体视学与图像分析》 2020年第3期284-294,共11页
在现有的空域错误隐藏算法中,运行快速的多方向插值算法在处理多种丢失模式时效果不甚理想,而恢复质量好的迭代类算法又难以满足实时性需求。为此,本文提出了一种面向通用空域错误隐藏的自适应混合填充(Adaptive Hybrid Filling,AHF)算... 在现有的空域错误隐藏算法中,运行快速的多方向插值算法在处理多种丢失模式时效果不甚理想,而恢复质量好的迭代类算法又难以满足实时性需求。为此,本文提出了一种面向通用空域错误隐藏的自适应混合填充(Adaptive Hybrid Filling,AHF)算法,以更好地进行多性能指标的联合优化。对于当前受损块的错误隐藏,AHF算法首先通过各向同性梯度检测器学习延拓区域的邻域梯度特征,根据收缩填充次序执行局部预测过程,从外层素组到内层素组逐一地恢复受损块的各个素组;若预测相关性足够低,AHF算法将转而执行非局部片匹配过程,利用相似片对同样位置的未隐藏像素进行填充。实验结果表明相比于其他代表性的空域错误隐藏算法,AHF算法较好地平衡了通用性、计算复杂度和恢复质量等多指标性能,在典型丢失模式下取得了具有竞争力的综合性能。 展开更多
关键词 空域错误隐藏 混合填充 局部预测 非局部片匹配
下载PDF
基于颜色校正和去模糊的水下图像增强方法 被引量:10
17
作者 魏冬 刘浩 +1 位作者 陈根龙 宫晓蕙 《计算机科学》 CSCD 北大核心 2021年第4期144-150,共7页
由于光在水下传播时会出现吸收和散射的情况,水下图像往往存在色偏、对比度低、模糊、光照不均匀等问题。根据水下图像成像模型,人们在海底拍摄所获得的图像往往是退化的图像,而退化的图像不能完整地表达海洋场景信息,难以满足实际的应... 由于光在水下传播时会出现吸收和散射的情况,水下图像往往存在色偏、对比度低、模糊、光照不均匀等问题。根据水下图像成像模型,人们在海底拍摄所获得的图像往往是退化的图像,而退化的图像不能完整地表达海洋场景信息,难以满足实际的应用需要。为此,文中提出了一种基于颜色校正和去模糊的水下图像增强方法。该方法有效融合了颜色校正和去模糊两个阶段,取得了递增的增强效果。在颜色校正阶段,首先对原始图像进行对比度拉伸,在对比度拉伸完成之后,图像可能存在拉伸过度或拉伸不足的现象。因此,所提方法根据灰度世界先验,在对比度拉伸后进一步使用伽马校正来优化和调整图像的对比度和色彩,使图像的R,G,B三通道的灰度值之和趋于相等。接着,在去模糊阶段,通过融合暗通道先验对颜色校正后的图像进行去模糊,得到最终的增强图像。实验结果表明,所提方法具有良好的整体恢复效果,能有效地恢复图像信息,在主观评价和客观评价上均展现出较好的效果。另外,所提方法可以作为水下图像分类等计算机视觉任务的预处理步骤,在实验中能够将水下图像集的分类精度提升16%左右。 展开更多
关键词 水下图像 对比度拉伸 颜色校正 去模糊 灰度世界 图像分类
下载PDF
元宇宙视角下的沉浸式灵境媒体服务演进
18
作者 宋利 郭帅 +1 位作者 王秋文 陈梓煜 《人工智能》 2022年第5期51-60,共10页
媒体服务指的是媒体内容与用户的交互形式,是用户获取媒体内容的主要方式,在生产生活中占据重要地位。随着“元宇宙”概念的快速兴起,新型消费场景与服务场景不断涌现,媒体服务形式不断创新。近年来的媒体服务发展主要经历了四个阶段(... 媒体服务指的是媒体内容与用户的交互形式,是用户获取媒体内容的主要方式,在生产生活中占据重要地位。随着“元宇宙”概念的快速兴起,新型消费场景与服务场景不断涌现,媒体服务形式不断创新。近年来的媒体服务发展主要经历了四个阶段(即“所见即所得”“强交互渲染”“虚实融合渲染”“神经渲染”),并逐渐朝着“灵境媒体”目标前进。与此同时,自由视角视频(Free viewpoint video)以其高沉浸与强交互特性得到了越来越多的关注。为了满足新需求,迎接新挑战,本文以自由视角视频技术为切入点,归纳近年来媒体服务技术的演进道路,介绍面向媒体融合发展的最新媒体服务技术。 展开更多
关键词 媒体服务 自由视角视频 沉浸式 灵境媒体
下载PDF
小数据下的音素级别说话人嵌入的语音合成自适应方法 被引量:7
19
作者 徐志航 陈博 +1 位作者 张辉 俞凯 《计算机学报》 EI CAS CSCD 北大核心 2022年第5期1003-1017,共15页
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度... 在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度的问题.使用少量的用户录制数据微调预训练的语音合成模型的自适应方法尽管能提升合成音频的相似度,但是也常伴随着自然度的下降.为了解决这个问题,本文提出了一种基于音素级别的说话人嵌入的语音合成自适应方法.在训练阶段,从真实的特征片段中提取音素级别的说话人嵌入,控制语音合成模型的训练.在自适应阶段,通过对说话人嵌入预测网络进行快速自适应,在推理阶段代替真实音频得到音素级别说话人嵌入帮助模型合成音频.实验使用了少量真实的用户录制数据,对现在主流的不同粒度的说话人嵌入方法进行了性能比较.实验表明,相比较各种不同的说话人嵌入方法,本文提出的方法在不更新语音合成模型的情况下保持自然度不明显下降,并取得了最好相似度;在更新语音合成模型的情况下,该方法同时达到了最好的自然度和相似度.分析发现音素级别的说话人嵌入方法在几乎不增加自适应训练时间的情况下,提供了更好的模型自适应初始点,有效地提高了自适应模型合成声音的质量. 展开更多
关键词 语音合成 说话人嵌入 时长模型 小数据 说话人自适应
下载PDF
基于无标签视频数据的深度预测学习方法综述 被引量:2
20
作者 潘敏婷 王韫博 +3 位作者 朱祥明 高思宇 龙明盛 杨小康 《电子学报》 EI CAS CSCD 北大核心 2022年第4期869-886,共18页
基于视频数据的深度预测学习(以下简称“深度预测学习”)属于深度学习、计算机视觉和强化学习的交叉融合研究方向,是气象预报、自动驾驶、机器人视觉控制等场景下智能预测与决策系统的关键组成部分,在近年来成为机器学习的热点研究领域... 基于视频数据的深度预测学习(以下简称“深度预测学习”)属于深度学习、计算机视觉和强化学习的交叉融合研究方向,是气象预报、自动驾驶、机器人视觉控制等场景下智能预测与决策系统的关键组成部分,在近年来成为机器学习的热点研究领域.深度预测学习遵从自监督学习范式,从无标签的视频数据中挖掘自身的监督信息,学习其潜在的时空模式表达.本文对基于深度学习的视频预测现有研究成果进行了详细综述.首先,归纳了深度预测学习的研究范畴和交叉应用领域.其次,总结了视频预测研究中常用的数据集和评价指标.而后,从基于观测空间的视频预测、基于状态空间的视频预测、有模型的视觉决策三个角度,分类对比了当前主流的深度预测学习模型.最后,本文分析了深度预测学习领域的热点问题,并对研究趋势进行了展望. 展开更多
关键词 深度学习 自监督学习 计算机视觉 视频预测 有模型的视觉决策
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部