期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
一种两步判决的说话人分割算法 被引量:7
1
作者 杨继臣 贺前华 +1 位作者 李艳雄 王伟凝 《电子与信息学报》 EI CSCD 北大核心 2010年第8期2006-2009,共4页
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻... 为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻说话人基频差异大的说话人改变检测出来;第2步采用基于性别的改进T2判决公式进行SS,实现相邻说话人基频差异小的同性别SS,为此,该文提出了一个基于块的潜在说话人改变点检测算法。实验结果表明,本文算法提高了分割准确率,F1度量值可达85.14%。对于短时长(<2s)语音段的SS,该算法和传统的贝叶斯信息判决算法相比,漏检率减少了16%。 展开更多
关键词 语音信号处理 两步判决 说话人分割 基频信息 性别信息
下载PDF
一种改进的BIC说话人改变检测算法 被引量:5
2
作者 杨继臣 贺前华 +2 位作者 潘伟锵 徐益君 李艳雄 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第9期47-51,共5页
针对贝叶斯信息准则(BIC)算法在说话人改变检测中计算量大、检测精度低的问题,文中提出了一种改进的BIC说话人改变检测算法.该算法通过限制分析窗内第一个数据窗的最大长度来降低计算量,并通过增加分析窗内第二个数据窗的有效长度(... 针对贝叶斯信息准则(BIC)算法在说话人改变检测中计算量大、检测精度低的问题,文中提出了一种改进的BIC说话人改变检测算法.该算法通过限制分析窗内第一个数据窗的最大长度来降低计算量,并通过增加分析窗内第二个数据窗的有效长度(提高可测度)来提高检测精度;同时,该算法只在新增区间内寻找潜在说话人改变点,从而解决了长时间无说话人改变时计算量不断增大的问题.实验结果表明,该算法和传统的BIC算法相比,偏移误差范围由0.10-0.80降低到0.03-0.20;当分析窗长为40s时,计算时间节省了约75%. 展开更多
关键词 说话人检测 改进贝叶斯信息准则 检测精度 可测度 数据窗
下载PDF
一种基于随机段的固定音频检索方法 被引量:4
3
作者 杨继臣 王伟凝 《计算机应用》 CSCD 北大核心 2010年第1期230-232,共3页
在固定音频检索的整体检索方法中,当检索目标较长时,检索时间会变得很长。为了减小检索时间,提出了一种基于随机段的音频检索方法。把整个检索过程分成随机段检索和整体匹配两个阶段:随机段检索是从参考模板中随机选择一段(随机段)作为... 在固定音频检索的整体检索方法中,当检索目标较长时,检索时间会变得很长。为了减小检索时间,提出了一种基于随机段的音频检索方法。把整个检索过程分成随机段检索和整体匹配两个阶段:随机段检索是从参考模板中随机选择一段(随机段)作为检索目标进行检索;整体匹配是在随机段检索出的基础上,判断潜在目标信号是否为参考模板。把这种随机检索的方法应用到计算特征距离和直方图交集方法中,结果证明该检索方法的准确率可以达到90%以上,而且平均检索时间可以降低到随机段与参考模板的比值和整体检索时间的积。 展开更多
关键词 直方图交集法 特征距离 过零率
下载PDF
新闻故事中的关键说话人发现方法 被引量:1
4
作者 杨继臣 李艳雄 《计算机工程与设计》 CSCD 北大核心 2012年第6期2353-2357,共5页
为了发现新闻故事中的关键说话人,用以提高多媒体检索效率,在说话人索引的基础上,提出了关键人发现方法:根据新闻故事中说话人的特点,基于说话人频率、说话人持续时间、平均每次说话人时长和说话人位置因子4个因素,综合定义了说话人关键... 为了发现新闻故事中的关键说话人,用以提高多媒体检索效率,在说话人索引的基础上,提出了关键人发现方法:根据新闻故事中说话人的特点,基于说话人频率、说话人持续时间、平均每次说话人时长和说话人位置因子4个因素,综合定义了说话人关键度,用以判断说话人的重要性,把每个新闻故事中说话人关键度最大的人作为关键说话人。实验结果表明,该种算法可以找到故事中绝大部分的关键说话人,验证了该算法的有效性和可行性。 展开更多
关键词 新闻故事 关键说话人 多媒体检索 主要角色 说话人关键度
下载PDF
“微机原理与接口技术”课程教学改革 被引量:5
5
作者 杨继臣 陈旭娟 梁庆茵 《教育教学论坛》 2016年第33期92-93,共2页
针对很多学生在学习《微机原理与接口技术》后,反映该门课程的学习效果不是很理想,为了能提高学生的学习积极性、帮助教师建立合理的教学体系、提高教师的教学质量、提升学生掌握微机原理和接口技术,本文对该课程了提出了教学改革方法:... 针对很多学生在学习《微机原理与接口技术》后,反映该门课程的学习效果不是很理想,为了能提高学生的学习积极性、帮助教师建立合理的教学体系、提高教师的教学质量、提升学生掌握微机原理和接口技术,本文对该课程了提出了教学改革方法:对该门课程的主要内容进行介绍以及它们之间的逻辑关系进行总结,并对该门课程教学难的具体原因进行分析;从端正学生学习态度提高学习积极性、精简教学内容提高教学效率、融合多种教学方法提高课堂趣味性以及改革实验方法激发实验兴趣四个方面对该门课程进行教学改革,最后进行了总结。 展开更多
关键词 微机原理与接口技术 学习态度 教学内容 教学方法 实验兴趣
下载PDF
基于Matlab GUI的水质信息应用系统的设计 被引量:1
6
作者 杨继臣 张新政 《广东工业大学学报》 CAS 2006年第4期6-11,共6页
介绍了在M atlab GUI环境下,通过访问数据库,如何对水质信息进行管理,读取水质信息,作出水质信息图像;通过观察已知数据图像,不仅可以总结过去的规律,还可以对未来水质信息发展趋势进行预测.
关键词 MATLAB GUI 数据库 水质信息管理 图像 趋势 预测
下载PDF
BP神经网络在水质参数预测中的应用 被引量:1
7
作者 杨继臣 张新政 《计算机与数字工程》 2006年第11期24-26,共3页
介绍了如何使用BP神经网络在已经有大量历史数据的基础上来预测未来的水质参数和如何使用函数来实现BP算法来预测未来水质参数的程序。
关键词 BP神经网络 预测 水质参数 函数
下载PDF
基于MATLAB编程的数字信号处理教学改革 被引量:3
8
作者 杨继臣 刘磊安 《福建电脑》 2016年第4期83-84,共2页
针对很多学生在学习《数字信号处理》时,对数字信号处理兴趣不高,积极性不大的问题,本文提出将MATLAB引入数字信号处理教学过程中,从MATLAB处理音频数字信号方面入手,由浅入深,逐步提高学生使用MATLAB处理音频数字信号的能力,目的是激... 针对很多学生在学习《数字信号处理》时,对数字信号处理兴趣不高,积极性不大的问题,本文提出将MATLAB引入数字信号处理教学过程中,从MATLAB处理音频数字信号方面入手,由浅入深,逐步提高学生使用MATLAB处理音频数字信号的能力,目的是激发学生对这门课的兴趣,提高学生的MATLAB编程能力和提升学生使用MATLAB处理数字信号的能力。 展开更多
关键词 MATLAB编程 数字信号处理 提升兴趣 提高能力
下载PDF
一种基于性别的说话人索引算法
9
作者 杨继臣 何俊 李艳雄 《计算机工程与科学》 CSCD 北大核心 2012年第6期79-82,共4页
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需... 为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。 展开更多
关键词 说话人索引 性别信息 说话人模型自举法
下载PDF
基于时空相关度融合的语音唇动一致性检测算法 被引量:5
10
作者 朱铮宇 贺前华 +3 位作者 奉小慧 叶婉玲 李艳雄 杨继臣 《电子学报》 EI CAS CSCD 北大核心 2014年第4期779-785,共7页
本文在传统发音唇动分析模型的基础上,构建一个发音唇动时空模型.提出了唇动时域特征、空域特性与语音的相关度度量方法,以及融合时空度量的语音唇动一致性检测方法.利用唇宽、唇高与音频幅度变化之间的联系获得语音唇动的时域一致性评... 本文在传统发音唇动分析模型的基础上,构建一个发音唇动时空模型.提出了唇动时域特征、空域特性与语音的相关度度量方法,以及融合时空度量的语音唇动一致性检测方法.利用唇宽、唇高与音频幅度变化之间的联系获得语音唇动的时域一致性评分;通过协惯量分析法获得语音与唇部空域特征的初始相关度,并提出了针对语音、唇动自然延时的相关度修订方法;最后将时空上的得分进行融合以判断语音唇动是否一致.初步实验结果表明,对于四种不一致音视频数据,与常用的协惯量方法相比,EER(Equal Error Rate)平均下降了约8.2%. 展开更多
关键词 时空特性 一致性分析 协惯量分析 相关度融合
下载PDF
基于稀疏表示权重张量的音频特征提取算法 被引量:5
11
作者 林静 杨继臣 +1 位作者 张雪源 李新超 《计算机应用》 CSCD 北大核心 2016年第5期1426-1429,1438,共5页
为了更好地描述非平稳音频信号的特征,提出了一种基于Gabor字典和稀疏表示权重张量的时-频音频特征提取方法。该方法基于Gabor字典将音频信号编码为稀疏的权重向量,并进一步将权重向量中的元素重新排列为张量形式,该张量各阶分别刻画了... 为了更好地描述非平稳音频信号的特征,提出了一种基于Gabor字典和稀疏表示权重张量的时-频音频特征提取方法。该方法基于Gabor字典将音频信号编码为稀疏的权重向量,并进一步将权重向量中的元素重新排列为张量形式,该张量各阶分别刻画了信号的时间、频率以及时长特性,为信号的联合时-频-长表示。通过对该张量进行因子分解,将分解后得到的频率因子和时长因子拼接为音频特征。针对稀疏张量分解时容易产生过拟合的问题,提出一种自调整惩罚参数分解算法并进行了改进。实验结果显示,所提出的特征相对于传统梅尔倒谱系数(MFCC)特征、MFCC特征及匹配追踪算法(MP)求解的特征联合拼接得到的MFCC+MP特征和非均匀尺度-频率图特征对15类音效分类效果分别提升了28.0%、19.8%和6.7%。 展开更多
关键词 稀疏表示 张量因子分解 音效分类 时-频特征
下载PDF
一种基于指纹因子的鲁棒音频检索方法 被引量:3
12
作者 林静 杨继臣 +1 位作者 张雪源 李新超 《数据采集与处理》 CSCD 北大核心 2016年第5期1020-1027,共8页
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解... 针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。 展开更多
关键词 音频检索 音频指纹 非负矩阵分解 音频字典 倒排索引
下载PDF
基于高频加权CQT谱的音符起始点检测 被引量:3
13
作者 林静 贺前华 +1 位作者 李新超 杨继臣 《计算机工程与设计》 北大核心 2015年第9期2485-2489,共5页
为提高音符起始点检测的准确率,提出高频加权CQT谱能量的音符起始点检测算法。对音乐信号进行CQT变换得到音阶分布矩阵后,结合不同信号CQT分布的特点滤除噪声。在采用CQT谱能量差分进行音符起始点检测时,针对CQT变换变窗长计算带来的低... 为提高音符起始点检测的准确率,提出高频加权CQT谱能量的音符起始点检测算法。对音乐信号进行CQT变换得到音阶分布矩阵后,结合不同信号CQT分布的特点滤除噪声。在采用CQT谱能量差分进行音符起始点检测时,针对CQT变换变窗长计算带来的低频时间分辨率较低、时间误差较大可能导致误判的问题,利用音乐中谐波丰富且时间分辨率较高的特点,进行高频加权计算,突出高频成分的作用,降低检测误差。选取标注的音乐数据文件进行测试,应用高频加权CQT谱进行起始点检测的结果中,F值为0.8541,效果良好。 展开更多
关键词 音符起始点 常数Q变换 频域去噪 谱能量 高频加权
下载PDF
基于两步判决的口语中非文字音频事件检测方法 被引量:1
14
作者 贺前华 李艳雄 +2 位作者 李韬 张虹 杨继臣 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第2期20-25,31,共7页
为了有效利用非文字音频事件进行会话语音的语义分析,在分析口语中频繁出现的音频事件特征差异的基础上,提出了一种基于两步判决的口语中非文字音频事件的检测方法.该方法利用音频事件的信号特征构造音频事件信号段,采用门限判决来检测... 为了有效利用非文字音频事件进行会话语音的语义分析,在分析口语中频繁出现的音频事件特征差异的基础上,提出了一种基于两步判决的口语中非文字音频事件的检测方法.该方法利用音频事件的信号特征构造音频事件信号段,采用门限判决来检测长掌声(第一步判决),而用统计模型来检测其它音频事件(第二步判决).实验结果表明:该方法检测填音、笑声、掌声3种非文字音频事件的平均准确率、召回率和F1度量值分别为87.3%、93.8%和90.4%;与现有文献数据相比,F1度量值平均提高了7.5%,且文中方法能更精确地确定非文字音频事件的边界. 展开更多
关键词 非文字音频事件 门限判决 统计模型检测 口语语音 语音处理
下载PDF
一种三层判决的说话人索引算法 被引量:1
15
作者 陈雪芳 杨继臣 《计算机工程》 CAS CSCD 2012年第2期184-185,共2页
为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配... 为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配问题。实验结果表明,采用惩罚距离公式,与贝叶斯信息判决方法相比不需调整参数,与DISTBIC方法相比F1值提高2%,使用GMM说话人超级矢量,在说话人索引准确率和数量准确率方面分别提高8.95%、18.25%。 展开更多
关键词 三层判决 说话人索引 惩罚距离 模型自举法 GMM说话人超级矢量
下载PDF
交叉验证KNN支持向量预选取算法在说话人识别上的应用 被引量:1
16
作者 陈雪芳 杨继臣 《科学技术与工程》 北大核心 2013年第20期5839-5842,5847,共5页
针对传统支持向量机算法时空复杂度较高的不足,提出了一种基于交叉验证KNN的支持向量预选取算法。该算法首先对原始样本求k个的邻近样本,然后计算邻近样本中异类样本的比例p1,最后选取满足p1大于阈值p的原始样本作为支持向量。通过交叉... 针对传统支持向量机算法时空复杂度较高的不足,提出了一种基于交叉验证KNN的支持向量预选取算法。该算法首先对原始样本求k个的邻近样本,然后计算邻近样本中异类样本的比例p1,最后选取满足p1大于阈值p的原始样本作为支持向量。通过交叉验证方法确定k与p的最合适的数值。在UCI标准数据集和说话人识别数据集上的仿真实验显示算法可有效地降低支持向量机分类器的运行时间,同时又具有较好的分类性能。 展开更多
关键词 支持向量机 交叉验证 KNN算法 说话人识别
下载PDF
新时期气象探测环境保护执法现状及其对策 被引量:1
17
作者 杨继臣 《科技传播》 2010年第23期53-53,69,共2页
综合气象观测系统是国家重要的公共基础设施,是气象和地球相关学科业务与科研的重要基础,保护气象探测环境就是保护气象事业发展的生命线。本文根据塔城地区气象探测环境现状和存在的问题进行了分析,提出了通过提高认识加强宣传和加大... 综合气象观测系统是国家重要的公共基础设施,是气象和地球相关学科业务与科研的重要基础,保护气象探测环境就是保护气象事业发展的生命线。本文根据塔城地区气象探测环境现状和存在的问题进行了分析,提出了通过提高认识加强宣传和加大执法力度,从而保证气象观测资料的连续性、准确性和代表性,做好防灾减灾服务工作。 展开更多
关键词 气象探测 环境保护 执法现状
下载PDF
基于远近距离的说话人聚类算法
18
作者 陈雪芳 杨继臣 《科学技术与工程》 北大核心 2013年第12期3297-3300,共4页
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在... 提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。 展开更多
关键词 说话人聚类 近距离聚类 远距离聚类
下载PDF
山东泰安市玉米高效种植技术要点
19
作者 杨继臣 《农业工程技术》 2024年第25期69-70,共2页
该文结合泰安市玉米生产实际,总结了玉米高效种植技术要点,包括选种与种子处理、地块准备、播种、播种后管理、病虫害防治、适时机械收获等,以供种植者参考。
关键词 玉米 高效 种植 技术要点 泰安市
下载PDF
基于子带双特征的自适应保留似然比鲁棒语音检测算法 被引量:1
20
作者 何伟俊 贺前华 +1 位作者 吴俊峰 杨继臣 《电子与信息学报》 EI CSCD 北大核心 2016年第11期2879-2886,共8页
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利... 为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利用已过去固定时长的VAD判决结果及对应的子带特征参数自适应地估计似然比的保留阈值。实验结果表明,此算法的VAD检测准确率相比原保留似然比算法在10 d B,0 d B和-10 d B平稳白噪声下分别提高了1.2%,7.2%和8.1%,在10 d B和0 d B非平稳Babble噪声下分别提高了1.6%和3.4%。当其被用于2.4 kbps低速率声码器系统时,合成语音的感知语音质量评价(PESQ)比原声码器系统在白噪声下提高了0.098~0.153,在Babble噪声下提高了0.157~0.186。 展开更多
关键词 语音激活检测 似然比 低信噪比 子带过零率
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部