期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
多模式汉语连续语音识别中视觉特征的提取和应用 被引量:6
1
作者 刘鹏 王作英 《中文信息学报》 CSCD 北大核心 2004年第4期79-84,共6页
本文对在汉语多模式汉语语音识别系统中利用视觉特征进行了研究 ,给出了基于多流隐马尔科夫模型 (Multi streamHMM ,MSHMM)的听视觉融合方案 ,并对有关视觉特征的两项关键技术 :嘴唇定位和视觉特征提取进行了详细讨论。首先 ,我们研究... 本文对在汉语多模式汉语语音识别系统中利用视觉特征进行了研究 ,给出了基于多流隐马尔科夫模型 (Multi streamHMM ,MSHMM)的听视觉融合方案 ,并对有关视觉特征的两项关键技术 :嘴唇定位和视觉特征提取进行了详细讨论。首先 ,我们研究了基于模板匹配的嘴唇跟踪方法 ;然后研究了基于线性变换的低级视觉特征 ,并与基于动态形状模型的特征作了比较 ;实验结果表明 ,引入视觉信息后无噪环境下语音识别声学层首选错误率相对下降 36 0 9% 。 展开更多
关键词 计算机应用 中文信息处理 多模式 听一视觉融合 视觉特征提取 鲁棒性
下载PDF
基于肤色检测的快速五官定位算法 被引量:5
2
作者 赵苏琦 赵明生 《电视技术》 北大核心 2003年第7期70-72,共3页
根据视频应用的特点,结合人脸的肤色和特征部位几何分布特征,提出了一种应用于视频序列人脸部位的五官定位算法。实验表明,该算法定位速度快,误检率低。
关键词 肤色检测 五官定位算法 人脸 视频序列 视频会议
下载PDF
基于ARM和DSP的视频会议终端设计与实现 被引量:4
3
作者 赵苏琦 赵明生 《电视技术》 北大核心 2003年第8期76-77,共2页
从控制部分设计、数据处理部分设计以及两部分联合工作这3个方面介绍了一个视频会议终端的设计和实现,并给出了一个嵌入式系统的基本架构和数据处理器在嵌入式系统中的应用,对嵌入式系统的开发和应用有一定的积极作用。
关键词 ARM DSP 视频会议 控制模块 数据处理模块 嵌入式系统
下载PDF
一种头肩像序列的人脸快速定位算法 被引量:4
4
作者 阮鹏 赵明生 《计算机工程与应用》 CSCD 北大核心 2003年第29期125-127,共3页
该文根据视频应用的特点,结合人脸的肤色和特征部位几何分布特征,提出了一种应用于头肩像序列视频编码的快速人脸定位算法。实验表明,该方法定位速度快,误检率低,可以在实时系统中应用。
关键词 人脸定位 头肩像序列
下载PDF
基于鲁棒波束形成的麦克风阵列系统
5
作者 杨毅 余达太 +1 位作者 宋辉 刘加 《计算机应用与软件》 CSCD 北大核心 2008年第4期155-157,共3页
为了提高噪声消除的鲁棒性,传统的通用旁瓣消除器采用固定波束形成作为输出的系数约束自适应滤波器,采用CCAF的输出作为输入的标准约束自适应滤波器。此系统的跟踪性能随信号频率变化而改变,并且由于波束带宽的影响使得目标语音在低频... 为了提高噪声消除的鲁棒性,传统的通用旁瓣消除器采用固定波束形成作为输出的系数约束自适应滤波器,采用CCAF的输出作为输入的标准约束自适应滤波器。此系统的跟踪性能随信号频率变化而改变,并且由于波束带宽的影响使得目标语音在低频发生畸变。采用优化波束形成方法来得到较宽的带宽,对输出进行后滤波处理来消除残余噪声。试验表明本方法可明显提高语音信噪比。 展开更多
关键词 麦克风阵列 波束形成 通用旁瓣消除器
下载PDF
麦克风阵列应用于鲁棒自适应噪声消除
6
作者 杨毅 余达太 +1 位作者 宋辉 刘加 《电子技术应用》 北大核心 2007年第1期105-107,共3页
提出一种应用于鲁棒自适应噪声消除的新结构,用优化波束形成方法取代GSC中的固定波束形成(Fixed Beamforming)以得到较宽的带宽;对GSC的输出进行后滤波处理消除残余噪声。
关键词 麦克风阵列 波束形成 通用旁瓣消除器
下载PDF
一种面向Internet视频会议应用的码率控制方案
7
作者 扈旻 赵明生 《计算机工程与应用》 CSCD 北大核心 2003年第17期166-169,共4页
该文根据Internet视频会议的特点,参考了网络视频应用的经验,综合了一些常见的码率控制算法,设计并实现了一种含有用户反馈的码率控制策略,以及包括I帧频率控制、编码帧的选择、量化参数估计的一套码率控制方案。模拟试验表明,在不同信... 该文根据Internet视频会议的特点,参考了网络视频应用的经验,综合了一些常见的码率控制算法,设计并实现了一种含有用户反馈的码率控制策略,以及包括I帧频率控制、编码帧的选择、量化参数估计的一套码率控制方案。模拟试验表明,在不同信道速率条件下,实现了视频时域质量和空域质量的良好折中,使视频速率与信道速率得到良好匹配。 展开更多
关键词 H.263+ 码率控制
下载PDF
基于最低有效位和最高有效位替换法的熵理论模型 被引量:2
8
作者 肖洪华 黄永峰 朱明方 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第A02期42-45,共4页
信息隐藏是一个新兴的技术领域,从现在的研究结果来看,熵的概念对于信息隐藏技术的理解是很有好处的,因此,从信息论理论的角度出发,用熵和互信息的原理分析最低有效位(LSB)替换法和基于位图调色板的最高有效位(MSB)替换法的具体实现。... 信息隐藏是一个新兴的技术领域,从现在的研究结果来看,熵的概念对于信息隐藏技术的理解是很有好处的,因此,从信息论理论的角度出发,用熵和互信息的原理分析最低有效位(LSB)替换法和基于位图调色板的最高有效位(MSB)替换法的具体实现。从信息论理论角度解释LSB替换法和MSB方法,建立了一种用信息熵分析隐写术的理论模型。 展开更多
关键词 信息隐藏 最低有效位(LSB) 最高有效位(MSB)
下载PDF
VoIP网关H.323协议栈中多路呼叫处理技术 被引量:2
9
作者 白逸之 黄永峰 李星 《计算机工程》 CAS CSCD 北大核心 2004年第10期98-100,共3页
IP电话网关主要功能为连接传统电话网与IP网络,完成多路呼叫的信令协议和语音格式的转换。因此,在网关的实现过程中,会涉及到多路呼叫的资源分配与维护、多线程的处理与同步、呼叫状态的迁移与超时处理等问题。该文针对上述问题,提... IP电话网关主要功能为连接传统电话网与IP网络,完成多路呼叫的信令协议和语音格式的转换。因此,在网关的实现过程中,会涉及到多路呼叫的资源分配与维护、多线程的处理与同步、呼叫状态的迁移与超时处理等问题。该文针对上述问题,提供了独特的实现方法,很好地解决了多路呼叫的资源占用、同步和超时等关键技术,有效地优化了网关系统性能。最后给出了网关指标中最重要的两个参数互通性与多路同时呼叫建立延时的测试结果及分析。 展开更多
关键词 VOIP 网关 多路呼叫
下载PDF
基于SL811HST和S3C4510B的嵌入式USB主机与设备的设计 被引量:5
10
作者 冉光志 赵明生 《微计算机信息》 北大核心 2005年第11Z期77-79,共3页
本文介绍了基于USB接口芯片SL811HST和ARM微处理器S3C4510B的嵌入式USB主机及设备的设计与实现,详细介绍了Linux平台下主机控制器驱动程序和USB设备固件与驱动程序的设计。文中也简要介绍了USB规范及Linux中的USB子系统。
关键词 USB SL811HST S3C4510B
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部