视频会议中音频多点处理器的研究被引量：17

Audio MP in Video Conference

下载PDF

导出

摘要 H .32 3视频会议系统中的多点处理单元 (MCU )能在多点会议中提供音频、视频或数据流的集中处理。针对音频信息的处理需求 ,提出了一种实用的混音处理策略 ,它具有计算复杂度低、会议重点突出的特点 ,并且一般情况下不会发生溢出问题。 ITU_T H.323 describes the components for multimedia communication systems in those situations where the underlying transport is a packet_based network.The multipoint control unit (MCU) can provide centralized processing of audio,video,and/or data stream in a multipoint conference.MCU is composed of the multipoint processor (MP) and the multipoint controller (MC).MP takes responsibilities of collecting audio,video,and/or data streams from all the terminals of the multipoint conference,processing all the information in the streams,and sending the processed data to the appointed terminals under the control of MC. In this paper,the authors bring forward some solutions for the request of processing audio stream,and then particularly present a practical policy aiming at the audio signals mixing operation.In the centralized multipoint conference mode,it is necessary to do the audio mixing operation on the speech from all the audio channels. The basic audio mixing technology includes three steps.First,MCU decodes the audio code streams from every audio channel respectively,and gets the sum of all the decoded speech.Second,the target speech corresponding to every terminal is gained after subtracting the source signal from the sum.Lastly,the target speech of every terminal is coded respectively,and transmitted to the specific terminal.So each of the terminals receives the audio signal containing all the signal of other terminals. There are many shortcomings in the method above.First,the more the terminals accessing the videoconference are,the more number of speech Codec used by MCU consequently is.Thus the calculating burden of MCU becomes heavy.Second,it is not necessary to mix all the speech from every audio channel equally.It is difficult for the perceptual ability to distinguish the useful information when the speech signals taken into the audio_mixer are more than 4 channels. Therefore,we design an improved audio_mixer that employs a kind of competitive mechanism.When the number of terminals accessing MCU is more than 4,we select 4 channels with the higher speech energy within fixed time interval and take them into the audio_mixer.The speech signals of other channels are regarded as the background noise after a certain of attenuation.The audio_mixer calculates the energy of speech in a fixed time interval and decides the state of every channel according to their speech energy.The state of every channel is preserved until to the end of the following time interval.

作者涂卫平胡瑞敏艾浩军谢兄

机构地区武汉大学多媒体网络通信工程湖北省重点实验室

出处《武汉大学学报（信息科学版）》 EI CSCD 北大核心 2002年第1期98-101,106,共5页 Geomatics and Information Science of Wuhan University

关键词视频会议音频多点处理器多点控制器语音编码音频混合 multipoint processor videoconference speech coding audio signal mixing

分类号 TN949.23 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献2

1Jerry D G 李煜晖（译）.多媒体数字压缩原理与标准[M].北京:电子工业出版社,2000..
2艾浩军,胡瑞敏,高戈,李德仁.H.323多点处理器任务调度策略[J].计算机工程与应用,2001,37(8):6-8. 被引量：5

二级参考文献3

1[1]ITU-T Recommendation H.323 - Packet-based Multimedia Communications Systems
2[2]ITU-T Recommendation G.723.1-Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s. 1996.3
3[3]The Concise Handbook Of Real-Time Systems,TimeSys Corporation.www.timesys.com

共引文献4

1肖进胜,沈燕飞,徐正全,黄云霞.视频会议中的多画面码流合成的研究与实现[J].计算机应用研究,2005,22(1):255-257. 被引量：2
2谢兄,胡瑞敏,艾浩军.基于TM1300的G.728语音编解码器实现与优化[J].计算机应用,2003,23(2):82-84.
3谢兄,胡瑞敏,艾浩军,涂卫平.基于DSP的多通道G.728语音编码器实现[J].数据采集与处理,2003,18(2):226-231. 被引量：1
4肖进胜,谢文娟,肖胜华,沈未名.基于MAP-CA的视频多点处理系统的研究与实现[J].计算机应用,2004,24(7):54-57. 被引量：2

同被引文献77

1王振宇,张凌,袁华.视频会议控制管理系统的设计和实现[J].通信学报,2006,27(z1):269-272. 被引量：1
2何青林,陈朝武,卢煜,崔云红,王艳艳.基于SIP的视频监控联网系统的设计与实现[J].电视技术,2009,33(5):116-118. 被引量：18
3辛杰,康丹丹,张飞弦,王馨宁,王玥,万济萍.可扩展语音与音频编解码技术的专利分析[J].电声技术,2012,36(S1):59-62. 被引量：1
4赵代强.基于数字语音交换技术的多方会议系统[J].计算机工程,2004,30(13):87-88. 被引量：11
5徐建波.交流“面对面”——谈软件化的视频会议系统[J].中国计算机用户,2004(9):54-54. 被引量：4
6卜忠贵.基于IP网络的视频会议系统关键技术[J].电信工程技术与标准化,2004,17(10):77-81. 被引量：6
7樊星,顾伟康,叶秀清.多媒体会议中的快速实时自适应混音方案研究[J].软件学报,2005,16(1):108-115. 被引量：18
8黄东军,陈松乔.基于源根组播的多点视频会议系统模型及其实现[J].电子学报,2005,33(1):47-51. 被引量：10
9江正战.串行通信接口标准RS-423/422/485及其应用[J].电子技术应用,1994,20(9):26-29. 被引量：37
10段炼,唐海娜,李俊.针对IP视频会议基于网络的QoS综述[J].通信学报,2005,26(3):111-116. 被引量：6

引证文献17

1肖进胜,沈燕飞,徐正全,黄云霞.视频会议中的多画面码流合成的研究与实现[J].计算机应用研究,2005,22(1):255-257. 被引量：2
2樊星,顾伟康,叶秀清.多媒体会议中的快速实时自适应混音方案研究[J].软件学报,2005,16(1):108-115. 被引量：18
3蔡必强.视频会议中混音技术研究[J].现代电子技术,2006,29(20):85-87. 被引量：7
4张微,毛敏.多方电话会议系统中混音溢出问题的一种改进算法[J].电子器件,2007,30(1):294-296. 被引量：4
5王文林,廖建新,朱晓民,沈奇威.多媒体会议中新型快速实时混音算法[J].电子与信息学报,2007,29(3):690-695. 被引量：15
6冉骥,朱翠涛.基于SIP的多媒体会议系统中混音设计与实现[J].中南民族大学学报（自然科学版）,2007,26(4):62-65.
7谢红刚,易本顺.基于DSP的数字化机载通话系统[J].计算机工程,2008,34(15):247-249. 被引量：1
8韩钰,普杰信.一种新的网络电话会议混音算法[J].计算机应用,2010,30(2):564-566. 被引量：5
9李宇,郭雷勇,陈建铭,谭洪舟.一种多媒体会议系统的实时同步混音转发算法[J].中山大学学报（自然科学版）,2010,49(2):31-36. 被引量：2
10王玲,陈春生,刘正,邹爱国.语音通讯、视频会议和视频监控融合系统的设计与实现[J].计算机与现代化,2010(11):100-102. 被引量：2

二级引证文献50

1刘新华,李方敏,旷海兰,张小麟.基于数字语音教室的多路混音算法及应用[J].微计算机信息,2005,21(10Z):34-36. 被引量：4
2周智君.远程体育互动教学CAL的数码+IP技术设计与实现[J].中国现代教育装备,2005(9):8-11. 被引量：1
3宋旭刚,李喆.基于局域网三方通信系统的实现[J].电脑知识与技术,2006,1(3):36-37. 被引量：1
4薛卫,都思丹,叶迎宪,方承志.基于变分辨率频谱特征的向量机静音检测和实时混音技术[J].中国科学技术大学学报,2006,36(8):898-901. 被引量：3
5张微,毛敏.多方电话会议系统中混音溢出问题的一种改进算法[J].电子器件,2007,30(1):294-296. 被引量：4
6王文林,廖建新,朱晓民,沈奇威.多媒体会议中新型快速实时混音算法[J].电子与信息学报,2007,29(3):690-695. 被引量：15
7薛绍伟,耿卫东,缪永伟.一种交互式SIP会议实现方案[J].计算机工程与设计,2007,28(7):1699-1701. 被引量：4
8刘新华,旷海兰,薛立功,胡鹏.基于嵌入式技术的数字语言教学系统设计与实现[J].衡阳师范学院学报,2007,28(6):108-112.
9冉骥,朱翠涛.基于SIP的多媒体会议系统中混音设计与实现[J].中南民族大学学报（自然科学版）,2007,26(4):62-65.
10周敬利,马志龙,范晔斌,陈小平.一种新的多媒体会议实时混音方案[J].小型微型计算机系统,2009,30(1):169-172. 被引量：7

1时光,王长利.基于H.323协议的音频混合方案设计[J].信息与电脑（理论版）,2010(3):51-51.
2张海峰,白骋宇.多媒体会议系统音频多点处理器的软件设计[J].机电工程,2010,27(6):104-107. 被引量：2
3王中元,胡瑞敏,傅佑铭,边学工.H.323视频会议系统中视频编解码子系统设计若干问题的研究[J].电子与信息学报,2007,29(7):1596-1599. 被引量：4
4赵靖,裘正定.类H．323关守软件的实现[J].中国多媒体视讯,2004(7):76-78.
5CS485xx:数字音频DSP处理方案[J].世界电子元器件,2011(11):11-12.
6曹宁,闫朝敏.H.323视频会议系统中的多线程技术解析[J].电视技术,2003,27(11):98-100.
7张友桥.煤矿H.323视频会议系统中视频编解码子系统设计研究[J].煤炭技术,2013,32(7):98-99. 被引量：2
8柳森.音频混合方法初探[J].戏剧之家,2012(6):93-93.
9海洋.CirrusLogic音频混合信号解决方案[J].电子设计应用,2005(9):131-131.
10G．A．托马斯.融合全景图像、3D拾音与传统报道的浸润式互动内容制作[J].世界广播电视,2012,26(3):54-54.

武汉大学学报（信息科学版）

2002年第1期

浏览历史

内容加载中请稍等...

视频会议中音频多点处理器的研究被引量：17

参考文献2

二级参考文献3

共引文献4

同被引文献77

引证文献17

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

视频会议中音频多点处理器的研究 被引量：17

参考文献2

二级参考文献3

共引文献4

同被引文献77

引证文献17

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

视频会议中音频多点处理器的研究被引量：17