期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于分层联邦框架的音频模型生成技术研究
1
作者 王健宗 张旭龙 +2 位作者 姜桂林 程宁 肖京 《智能系统学报》 CSCD 北大核心 2024年第5期1331-1339,共9页
针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题... 针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题;提出一种基于对比学习的音频模型的预训练方法,利用<音频,文本描述>数据学习语义特征,提高模型的泛化能力和多样化能力;提出一种基于提示学习的音频生成微调方法,利用少量标注数据提高模型的适应能力和定制化能力;提出一种音频模型分布式优化算法进行模型压缩,降低模型的复杂度和资源消耗,提高模型的部署效率和运行效率。通过在下游任务音效转换上的实验,提出的方法在语音质量平均意见得分可以达到3.81。实验结果表明,该方法在音效转换任务上取得了良好的效果。 展开更多
关键词 音频模型 联邦学习框架 音频表征学习 数据异构性 隐私保护 对比学习 提示学习 模型压缩
下载PDF
基于通用桌面视频会议系统方案的研究和设计 被引量:8
2
作者 张兵 陈云志 《计算机工程与设计》 CSCD 北大核心 2007年第9期2089-2091,共3页
桌面视频会议是利用多媒体技术和数据通信技术通过计算机网络实现的两地或多地信息交互或视频会议的一种高效率、低成本的多媒体通信手段。通过对目前流行的视频会议系统的介绍和分析,提出了一种较为通用的视频会议模型,并对其方案进行... 桌面视频会议是利用多媒体技术和数据通信技术通过计算机网络实现的两地或多地信息交互或视频会议的一种高效率、低成本的多媒体通信手段。通过对目前流行的视频会议系统的介绍和分析,提出了一种较为通用的视频会议模型,并对其方案进行了研究和设计。最后对视频会议未来的发展做出了展望。 展开更多
关键词 桌面视频会议 通信协议 视频 音频 数据压缩
下载PDF
Ogg Vorbis数字音频编码技术 被引量:6
3
作者 阎建新 董在望 窦维蓓 《电声技术》 北大核心 2003年第9期7-11,共5页
简述了一种无专利要求的OggVorbis数字音频编码的算法,深入分析了其关键技术,并给出了主观测试结果。结果表明这种编码算法的主观声音质量超过MP3和MPEG-4AAC。
关键词 OGG Vorbis 数字音频编码 数据压缩 矢量量化 LPC MDCT
下载PDF
飞行数据综合记录与分析系统的设计与实现 被引量:7
4
作者 韩玮 翟正军 +1 位作者 姜红梅 丁楠 《计算机工程与设计》 CSCD 北大核心 2007年第17期4195-4197,4222,共4页
随着数字化航电系统的发展,飞行数据记录系统越来越向着综合化数据记录的方向发展,根据数字化飞行数据记录器对综合数据尤其是音视频数据采集的需要,设计和实现了飞行数据综合纪录与分析系统,该系统不仅可进行的飞行数据特别是音视频数... 随着数字化航电系统的发展,飞行数据记录系统越来越向着综合化数据记录的方向发展,根据数字化飞行数据记录器对综合数据尤其是音视频数据采集的需要,设计和实现了飞行数据综合纪录与分析系统,该系统不仅可进行的飞行数据特别是音视频数据的采集和存储,还对数据量庞大的音视频数据进行基于MPEG4的压缩。系统集中管理分布式数据,存储并能提供数据回放分析功能。分析这些音视频数据,对于更准确的评估飞行训练水平具有十分重要的现实意义。 展开更多
关键词 飞行综合数据采集 数据记录 音视频数据采集压缩 429接口器 数据回放分析
下载PDF
基于FPGA和DSP的音频采集卡的实现 被引量:3
5
作者 马吉林 李鹤鸣 喻方平 《微计算机信息》 北大核心 2008年第8期219-221,共3页
本文介绍了一种基于FPGA和DSP的多通道音频采集卡的设计和实现方案,该卡能够工作在多种采样率下并可以使用DSP中不同的音频算法用于满足不同场合,并通过PC104接口将处理后的数据上传至主机。采集卡已应用在船舶航行数据纪录仪VDR中。
关键词 FPGA DSP PC104 多采样率 音频数据压缩 航行数据记录仪VDR
下载PDF
新型低复杂度心理声学模型 被引量:1
6
作者 马鸿飞 夏雨 郭泽华 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2010年第5期842-845,878,共5页
针对现有心理声学模型算法复杂度高、不易实现的问题,设计了一种算法简单的心理声学模型.该模型直接计算修正离散余弦变换参数的最大和最小主导分量的扩展包络,并以此为基础,利用谱平坦测度函数计算心理声学模型的掩蔽门限.与传统模型相... 针对现有心理声学模型算法复杂度高、不易实现的问题,设计了一种算法简单的心理声学模型.该模型直接计算修正离散余弦变换参数的最大和最小主导分量的扩展包络,并以此为基础,利用谱平坦测度函数计算心理声学模型的掩蔽门限.与传统模型相比,该模型的算法复杂度降低了30%到50%,并能够估算出与其他心理声学模型相近的掩蔽门限. 展开更多
关键词 心理声学模型 音频编码 音频处理 数据压缩
下载PDF
网上语音数据传输的Delphi实现技术 被引量:3
7
作者 蒋先刚 涂晓斌 陈海雷 《华东交通大学学报》 2002年第3期58-61,共4页
介绍并分析语音数据在网上的传递技术和应用 ,主要介绍用Delphi在网上开发语音传输程序的关键技术和技巧 。
关键词 语音数据传输 DELPHI 实现技术 音频压缩管理器 嵌套字控件 数据流 网络
下载PDF
多媒体数据压缩技术 被引量:5
8
作者 李向军 高寅生 《西安联合大学学报》 2001年第2期44-49,共6页
简要地介绍了多媒体数据压缩技术 ,给出了数据压缩应遵循的原则、技术指标、常用编码方法及分类、基本原理与方法 .同时介绍了声音及图像的压缩编码标准与方法 .最后给出了压缩与解压缩的一个具体算法———Huffman算法 。
关键词 多媒体数据压缩技术 声音压缩算法 图像压缩算法 HUFFMAN算法 压缩编码 数据压缩技术
下载PDF
网上多点实时语音交互系统的设计和实现 被引量:1
9
作者 陈恩义 温津伟 韩臻 《计算机工程与应用》 CSCD 北大核心 1999年第11期84-86,89,共4页
文章讨论了网上多点实时语音交互系统的设计和实现,提出了合理实用的多点语音实时交互模型。采用了客户机/服务器模式及UDP通信技术和简捷的数据压缩技术,以Windows环境下TCP/IP协议的Winsock编程接口、有关... 文章讨论了网上多点实时语音交互系统的设计和实现,提出了合理实用的多点语音实时交互模型。采用了客户机/服务器模式及UDP通信技术和简捷的数据压缩技术,以Windows环境下TCP/IP协议的Winsock编程接口、有关多媒体的API、DirectX为工具,并以VC++5.0为开发环境,在局域网内实现了一个多点语音实时交互系统。 展开更多
关键词 多媒体通信 语音交互系统 TCP/IP协议 语音通信
下载PDF
VCD、DVD技术与发展 被引量:1
10
作者 李文渊 张安康 《电子器件》 CAS 1998年第3期194-198,共5页
本文介绍了VCD、DVD的有关技术及规格,并将之作了比较,据此,分析了VCD、DVD产品在我国市场的发展前景。
关键词 VCD DVD 数据压缩 活动图象 伴音 光盘
下载PDF
用VC++实现语音全双工实时通信
11
作者 王晓军 王生保 《机床与液压》 北大核心 2003年第5期225-227,229,共4页
计算机间的语音通信在现代社会中具有重要应用前景。本文介绍在Windows环境下用Winsock实现语音全双工实时通信的方法。这里主要涉及如何用Winsock完成话音数据的传输 ;如何实现话音的实时采集、处理、播放 ;如何用ACM实现音频数据的压... 计算机间的语音通信在现代社会中具有重要应用前景。本文介绍在Windows环境下用Winsock实现语音全双工实时通信的方法。这里主要涉及如何用Winsock完成话音数据的传输 ;如何实现话音的实时采集、处理、播放 ;如何用ACM实现音频数据的压缩。噪音和延时是此类软件要解决的重要的问题。本分析了噪音和延时产生的原因 ,并且采取了相应的算法来抑制噪音和减小延时。因为某些因素是矛盾的 ,本文努力使它们达到最佳组合。 展开更多
关键词 语音通信 VC++ 语音全双工实时通信 WINSOCK 音频数据压缩 ACM接口编程
下载PDF
基于BP网络的音频数据压缩方案
12
作者 薛辉 刘小双 吴跃 《计算机应用研究》 CSCD 北大核心 2006年第7期145-146,共2页
介绍了BP神经网络的基本原理,并通过构造特殊的映射关系、精心设计的BP神经网络获得一套基于神经网络的高效无损音频数据压缩方案。通过试验证明该方案行之有效,并且压缩比为7∶1。
关键词 数据压缩 音频压缩 神经网络
下载PDF
DVR中的音/视频采集压缩卡及其Linux驱动 被引量:1
13
作者 付永华 傅尔胜 《陕西科技大学学报(自然科学版)》 2006年第1期95-99,共5页
描述了DVR数字监控管理系统中音/视频采集压缩卡的基本原理,分析了数据流向,说明了其Linux驱动程序模块,对嵌入式DVR的设计具有积极的参考作用。
关键词 DVR 音频/视频采集压缩 LINUX驱动
下载PDF
声波测井井下数据压缩算法压缩效果测试 被引量:5
14
作者 贾安学 乔文孝 +3 位作者 鞠晓东 车小花 陆蓉 王瑞甲 《测井技术》 CAS CSCD 北大核心 2011年第3期288-291,共4页
由于电缆传输带宽有限,大量声波测井全波列数据从井下传送至井上存储和处理时井孔信息丢失,因此需要采用数据压缩技术在井下对声波数据进行实时压缩。介绍了算术编码、预测编码、FLAC(Free Lossless AudioCodec)和APE等无损压缩算法和... 由于电缆传输带宽有限,大量声波测井全波列数据从井下传送至井上存储和处理时井孔信息丢失,因此需要采用数据压缩技术在井下对声波数据进行实时压缩。介绍了算术编码、预测编码、FLAC(Free Lossless AudioCodec)和APE等无损压缩算法和有损压缩算法,并将无损压缩算法应用于正交多极子声波测井仪MPAL专家模式井下数据,并从压缩率和失真度2个方面测试了压缩效果。结果表明,FLAC和APE压缩算法具有较好的压缩率,特别是APE算法达到50%左右的压缩率,并且压缩率较稳定。在对小信号质量要求不高时,可以采用有损压缩算法。 展开更多
关键词 声波测井 数据压缩 算术编码 预测编码 无损音频压缩解码(FLAC) APE 压缩率
下载PDF
论音视频数据采集传输系统的设计与实现 被引量:3
15
作者 陈宗仁 《科技情报开发与经济》 2011年第27期120-122,共3页
采用了Linux操作系统,设计了适用于流媒体视频和音频的采集系统,并可应用到视频监控、IPTV以及流媒体服务器等方面;主要研究了硬件部分,包括采集卡的设计、将模拟信号进行数字转换,然后进行硬编码。
关键词 音视频数据采集传输系统 流媒体 MPEG4 压缩格式 LINUX
下载PDF
船载航行数据记录仪的设计与实现 被引量:1
16
作者 王臣业 魏宇 刘富强 《佳木斯大学学报(自然科学版)》 CAS 2008年第4期448-449,455,共3页
船载航行数据记录仪可以实时记录近期舰船运动的航向、航速、声纳信息、船长指挥口令、舱内温度与湿度、舱内压力等信息,当舰船发生事故时,这些数据在分析事故时起到不可替代的作用.本文设计了船载航行数据记录仪,并介绍了它的组成及其... 船载航行数据记录仪可以实时记录近期舰船运动的航向、航速、声纳信息、船长指挥口令、舱内温度与湿度、舱内压力等信息,当舰船发生事故时,这些数据在分析事故时起到不可替代的作用.本文设计了船载航行数据记录仪,并介绍了它的组成及其功能模块的工作原理,分析了其功能的实现,为船载航行数据记录仪的产品化设计提供指导. 展开更多
关键词 船用黑匣子 数据信息处理 监控报警 音频压缩
下载PDF
基于神经网络的高效音频数据压缩方案
17
作者 薛辉 刘小双 +1 位作者 吴跃 章毅 《计算机与数字工程》 2005年第12期154-157,共4页
介绍了BP神经网络的基本原理和算法,并通过构造特殊的映射关系,精心设计的BP神经网络,获得一套基于神经网络的高效无损音频数据压缩方案。通过试验证明该方案行之有效,并且压缩比为7:1。
关键词 数据压缩 音频压缩 神经网络
下载PDF
无线数字多媒体采集、压缩、广播系统的软件研究
18
作者 李宽 黄兴嘉 宋占伟 《仪器仪表用户》 2006年第3期146-147,共2页
详细介绍了一种基于UDP协议及IP网络的组播方式传输的无线数字多媒体采集、压缩、广播系统的软件实现方法,并给出了系统的部分算法程序及程序流程图。
关键词 无线广播 多媒体捕捉 图像 数据 声音压缩
下载PDF
通信音视频编解码技术的研究与应用 被引量:1
19
作者 李胜辉 王文敏 《微型电脑应用》 2022年第11期202-205,共4页
针对通信中音视频数据量过大、传输时间过长的问题。本研究基于用户对通信过程中音视频信号编解码需求,设计出通信音视频编解码系统,构建在Linux系统下的开源框架,应用Hi3531处理器,将AD9886A作为视频输入芯片,使用TW2984芯片用来采集... 针对通信中音视频数据量过大、传输时间过长的问题。本研究基于用户对通信过程中音视频信号编解码需求,设计出通信音视频编解码系统,构建在Linux系统下的开源框架,应用Hi3531处理器,将AD9886A作为视频输入芯片,使用TW2984芯片用来采集音频信号。音视频编解码算法对视频信息图像进行帧间预测、运动估计、变换量化和滤波,使用离散余弦变换,避免了音视频信息逆变换中出现错配的问题。实验结果表明,本研究的编码时延为65 ms,传输、解码时延为168 ms,解码效率高。 展开更多
关键词 音视频数据 编码解码 量化压缩 音视频采集 编码损耗
下载PDF
硅音频电路的发展与应用
20
作者 岳云 《电子元器件应用》 2002年第3期37-40,共4页
简要介绍硅音频系统所采用的压缩格式、记录媒体和版权保护技术。
关键词 数据压缩 记录媒体 版权保护 压缩格式 硅音频电路
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部