期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种稳健的基于VisemicLDA的口形动态特征及听视觉语音识别 被引量:4
1
作者 谢磊 付中华 +4 位作者 蒋冬梅 赵荣椿 Werner Verhelst Hichem Sahli Jan Conlenis 《电子与信息学报》 EI CSCD 北大核心 2005年第1期64-68,共5页
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。... 视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将'VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将这种视觉特征与多数据流HMM结合之后,在信噪比为10dB的强噪声情况下,识别率仍可以达到80%以上。 展开更多
关键词 语音识别 听视觉语音识别 ASM LINEAR DISCRIMINANT Analysis(LDA) Viseme
下载PDF
脑皮层的立体脑回图展成平面的新方法 被引量:2
2
作者 杨新 郭均峰 +3 位作者 施鹏飞 SalomieA DeklerckR CornelisJ 《计算机学报》 EI CSCD 北大核心 2001年第7期753-757,共5页
用核磁共振 (MRI)大脑断层图 ,分析患者的脑皮层解剖特征是一项困难的工作 .一个可能的途径是将分割后的脑皮层进行三维重建 .但是重建后的三维立体脑皮层图 ,如不经过 36 0°旋转仅能看到脑皮层上脑回的一部分 .因此还需要展开成... 用核磁共振 (MRI)大脑断层图 ,分析患者的脑皮层解剖特征是一项困难的工作 .一个可能的途径是将分割后的脑皮层进行三维重建 .但是重建后的三维立体脑皮层图 ,如不经过 36 0°旋转仅能看到脑皮层上脑回的一部分 .因此还需要展开成平面脑回图以看到脑回的完整走向 .文中提出的投影方法能够在变形尽量小的前提下将立体脑回图展开在平面上 ,直观地看到脑回走向的全貌 。 展开更多
关键词 三维图形展开 图像重建 核磁共振图像 脑回图 脑皮层 临床诊断 医学
下载PDF
基于Viseme的连续语音识别系统及Talking Head 被引量:2
3
作者 蒋冬梅 谢磊 +3 位作者 Ilse Ravyse 赵荣椿 Hichem Sahli Jan Cornelis 《电子与信息学报》 EI CSCD 北大核心 2004年第3期375-381,共7页
为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要... 为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据。该文根据viseme图像及其相似度权值(VSW)定义视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享。为比较系统性能,基于phoneme(听觉领域的语音基本单位)的语音识别结果也被映射为viseme序列。在评价准则上,定义viseme图像相似度加权识别精度,更全面地考虑输出和参考图像序列的差别,并用嘴形圆度和VSW曲线中的突变点来评估所得viseme序列的平滑性。结果表明,基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列。 展开更多
关键词 说话人头部动画 Viseme 连续语音识别 Triseme决策树 图像相似度加权 嘴形圆度
下载PDF
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统 被引量:1
4
作者 谢磊 I.Cravyse +5 位作者 蒋冬梅 赵荣椿 H.Sahli Werner Verhelst J Cornelis Ignace Lemahieu 《计算机工程与应用》 CSCD 北大核心 2003年第16期3-5,35,共4页
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更... 文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。 展开更多
关键词 音频-视频混合连续语音识别 主分量分析 特征口形 多数据流 HMM
下载PDF
一种用于说话人头部动画的Viseme语音识别系统
5
作者 谢磊 赵荣椿 +5 位作者 蒋冬梅 Ilse Cravyse Hichem Sahli Werner Verhelst Jan Corlenis Ignace Lemahieu 《计算机应用与软件》 CSCD 北大核心 2004年第5期22-24,79,共4页
Viseme是在语音驱动说话人头部动画中一种常用的为口形建立的音频 -视频模型。本文尝试建立viseme隐马尔可夫模型(HMM) ,用于驱动说话人头部的语音识别系统 ,称为前映射系统。为了得到更精确的模型以提高识别率 ,引入考虑发音口形上下文... Viseme是在语音驱动说话人头部动画中一种常用的为口形建立的音频 -视频模型。本文尝试建立viseme隐马尔可夫模型(HMM) ,用于驱动说话人头部的语音识别系统 ,称为前映射系统。为了得到更精确的模型以提高识别率 ,引入考虑发音口形上下文的Triseme模型。但是引入Triseme模型后 ,随着模型数量的急剧增加将导致训练数据的严重不足。本文使用决策树状态捆绑方法来缓解这一问题 ,同时引入了一种以口形相似度为基础的决策树视频问题设计方法。为了比较viseme系统的性能 ,本文也建立了一个以phoneme为基本HMM模型的语音识别系统。在评价准则上 ,使用了一种客观评价说话人头部动画的加权识别率。实验表明 ,以viseme为基本HMM模型的前映射系统可以为说话人头部提供更加合理的口形。 展开更多
关键词 说话人头部动画 三维动画 计算机 Viseme 语音识别系统 隐马尔可夫模型
下载PDF
MACF1对成骨细胞微丝骨架和细胞力学性能的调节作用
6
作者 胡丽芳 吴自祥 +5 位作者 丛晓岚 Mitchel Alioscha-Perez 王哲 蒋冬梅 骞爱荣 Hichem Sahli 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期98-104,111,共8页
为探索细胞骨架关键交联分子微管微丝交联因子1(microtubule actin crosslinking factor 1,MACF1)对成骨细胞微丝骨架和细胞力学性能的调节作用,以MACF1低表达的小鼠成骨细胞及其对照细胞为研究对象,通过细胞免疫荧光染色和激光扫描共... 为探索细胞骨架关键交联分子微管微丝交联因子1(microtubule actin crosslinking factor 1,MACF1)对成骨细胞微丝骨架和细胞力学性能的调节作用,以MACF1低表达的小鼠成骨细胞及其对照细胞为研究对象,通过细胞免疫荧光染色和激光扫描共聚焦显微镜,观察成骨细胞微丝骨架;运用微丝图像分析系统对微丝特性进行定量分析;采用原子力显微镜检测细胞弹性模量。结果发现,与对照组相比,MACF1低表达显著改变了小鼠成骨细胞的微丝分布角度,增加了成骨细胞的微丝长度与数量,显著减小了成骨细胞的刚度。研究结果为深入认识MACF1在成骨细胞中的功能奠定了实验基础,并为由成骨细胞功能改变引起的骨质疏松等骨骼疾病防治研究提供了新靶标。 展开更多
关键词 MACF1 成骨细胞 微丝 图像分析 细胞力学性能
下载PDF
Color retargeting:Interactive time-varying color image composition from time-lapse sequences 被引量:7
7
作者 Shao-Ping Lu Guillaume Dauphin +1 位作者 Gauthier Lafruit Adrian Munteanu 《Computational Visual Media》 2015年第4期321-330,共10页
In this paper,we present an interactive static image composition approach,namely color retargeting,to flexibly represent time-varying color editing effect based on time-lapse video sequences.Instead of performing prec... In this paper,we present an interactive static image composition approach,namely color retargeting,to flexibly represent time-varying color editing effect based on time-lapse video sequences.Instead of performing precise image matting or blending techniques,our approach treats the color composition as a pixel-level resampling problem. In order to both satisfy the user's editing requirements and avoid visual artifacts,we construct a globally optimized interpolation field. This field defines from which input video frames the output pixels should be resampled.Our proposed resampling solution ensures that(i) the global color transition in the output image is as smooth as possible,(ii) the desired colors/objects specified by the user from different video frames are well preserved,and(iii) additional local color transition directions in the image space assigned by the user are also satisfied.Various examples have been shown to demonstrate that our efficient solution enables the user to easily create time-varying color image composition results. 展开更多
关键词 time-lapse sequence image composition color retargeting time-varying transition optimized interpolation field
原文传递
A Survey on Multiview Video Synthesis and Editing 被引量:1
8
作者 Shaoping Lu Taijiang Mu Songhai Zhang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2016年第6期678-695,共18页
Multiview video can provide more immersive perception than traditional single 2-D video. It enables both interactive free navigation applications as well as high-end autostereoscopic displays on which multiple users c... Multiview video can provide more immersive perception than traditional single 2-D video. It enables both interactive free navigation applications as well as high-end autostereoscopic displays on which multiple users can perceive genuine 3-D content without glasses. The multiview format also comprises much more visual information than classical 2-D or stereo 3-D content, which makes it possible to perform various interesting editing operations both on pixel-level and object-level. This survey provides a comprehensive review of existing multiview video synthesis and editing algorithms and applications. For each topic, the related technologies in classical 2-D image and video processing are reviewed. We then continue to the discussion of recent advanced techniques for multiview video virtual view synthesis and various interactive editing applications. Due to the ongoing progress on multiview video synthesis and editing, we can foresee more and more immersive 3-D video applications will appear in the future. 展开更多
关键词 multiview video view synthesis video editing color correction SURVEY
原文传递
The state-of-the-art in computer generated holography for 3D display 被引量:6
9
作者 David Blinder Tobias Birnbaum +1 位作者 Tomoyoshi Ito Tomoyoshi Shimobaba 《Light(Advanced Manufacturing)》 2022年第3期168-196,共29页
Holographic displays have the promise to be the ultimate 3D display technology,able to account for all visual cues.Recent advances in photonics and electronics gave rise to high-resolution holographic display prototyp... Holographic displays have the promise to be the ultimate 3D display technology,able to account for all visual cues.Recent advances in photonics and electronics gave rise to high-resolution holographic display prototypes,indicating that they may become widely available in the near future.One major challenge in driving those display systems is computational:computer generated holography(CGH)consists of numerically simulating diffraction,which is very computationally intensive.Our goal in this paper is to give a broad overview of the state-of-the-art in CGH.We make a classification of modern CGH algorithms,we describe different algorithmic CGH acceleration techniques,discuss the latest dedicated hardware solutions and indicate how to evaluate the perceptual quality of CGH.We summarize our findings,discuss remaining challenges and make projections on the future of CGH. 展开更多
关键词 Digital holography Holographic display Computer generated holography High-performance computing FPGA Deep learning Visual quality assessment
原文传递
Compression strategies for digital holograms in biomedical and multimedia applications 被引量:2
10
作者 Peter Schelkens Ayyoub Ahar +6 位作者 Antonin Gilles Raees Kizhakkumkara Muhamad Thomas J.Naughton Cristian Perra Antonio Pinheiro Piotr Stepien Malgorzata Kujawinska 《Light(Advanced Manufacturing)》 2022年第3期234-254,共21页
While 60 years of successful application of holography is celebrated in this special issue,efficient representation and compression of holographic data has received relatively little attention in research.Notwithstand... While 60 years of successful application of holography is celebrated in this special issue,efficient representation and compression of holographic data has received relatively little attention in research.Notwithstanding this observation,and particularly due to the digitization that is also penetrating the holographic domain,interest is growing on how to efficiently compress holographic data such that interactive exchange of content,as well as digital storage can be facilitated proficiently.This is a particular challenge,not only because of its interferometric nature and the various representation formats,but also the often extremely large data volumes involved in pathological,tomographic,or high-end visualization applications.In this paper,we provide an overview of the state of the art in compression techniques and corresponding quality metrics for various practical applications in digital holography.We also consider the future by analyzing the emerging trends for addressing the key challenges in this domain. 展开更多
关键词 HOLOGRAPHY Compression Image quality assessment STANDARDIZATION
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部