期刊文献+
共找到406篇文章
< 1 2 21 >
每页显示 20 50 100
杨立东:用高品质的产品和服务回报社会
1
作者 杨立东 《智能建筑与城市信息》 2004年第4期71-71,共1页
2003年下半年施耐德电气正式进入了中国综合布线市场。随着技术的进步、语音、数据、图像(VDI)在信息处理和工业自动化控制领域成为了不可分割的整体,满足VDI信息传输的布线系统成为施耐德电气全球范围内服务用户的“透明工厂,透明建... 2003年下半年施耐德电气正式进入了中国综合布线市场。随着技术的进步、语音、数据、图像(VDI)在信息处理和工业自动化控制领域成为了不可分割的整体,满足VDI信息传输的布线系统成为施耐德电气全球范围内服务用户的“透明工厂,透明建筑”这一系统解决方案的基本组成。 展开更多
关键词 智能建筑 综合布线工程 品牌 杨立东
下载PDF
基于改进残差和注意力的CT肺癌辅助诊断
2
作者 谷宇 迟靖千 +3 位作者 张宝华 杨立东 李建军 唐思源 《传感器与微系统》 CSCD 北大核心 2024年第9期30-34,共5页
为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和... 为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和大小的结节特征的能力。实验结果表明:该模型在DSB数据集上表现良好,结节检测的灵敏度和特异性分别达到了99.15%和99.99%,肺癌诊断的准确率和AUC值分别达到了80.43%和0.86。可见,本文方法对于多种多样的结节特征具有高度敏感性,具有一定的临床价值。 展开更多
关键词 肺结节辅助检测 肺癌辅助诊断 CT图像 卷积神经网络 ResNeXt模块 注意力机制
下载PDF
改进知识蒸馏Transformer的新冠肺炎医学影像分类
3
作者 白浩田 谷宇 +7 位作者 杨立东 张宝华 李建军 吕晓琪 唐思源 张祥松 贾成一 贺群 《激光杂志》 CAS 北大核心 2024年第2期152-160,共9页
针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches... 针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches的位置信息编码上,通过更适合视觉任务的相对位置编码方式,使tokens之间的依赖关系能够被更好地捕捉;为了关注到更多的局部特征,在Transformer Encoder模块中引入了传统的卷积模块提取局部特征。实验在四分类测试集上平均分类准确率达到92.11%,对新冠肺炎分类准确率达到97.85%。实验结果表明,所提出的网络对新冠肺炎及其他肺部病变分类准确率较高,有一定的临床应用价值。 展开更多
关键词 医学图像分类 Vision Transformer架构 深度学习 计算机X线摄影 新冠肺炎
下载PDF
脉冲噪声下基于CNN-FRFT的线性调频信号参数估计方法
4
作者 卢景琳 郭勇 杨立东 《探测与控制学报》 CSCD 北大核心 2024年第1期96-104,113,共10页
由于脉冲噪声破坏了线性调频(LFM)信号的分数谱特征,使得基于分数谱特征的参数估计方法无法有效估计参数。针对这个问题,提出一种脉冲噪声环境下基于CNN-FRFT的LFM信号参数估计方法。首先,利用α稳定分布拟合随机脉冲噪声,构建加性含噪... 由于脉冲噪声破坏了线性调频(LFM)信号的分数谱特征,使得基于分数谱特征的参数估计方法无法有效估计参数。针对这个问题,提出一种脉冲噪声环境下基于CNN-FRFT的LFM信号参数估计方法。首先,利用α稳定分布拟合随机脉冲噪声,构建加性含噪信号,输入卷积神经网络(CNN)进行训练和测试;其次,利用训练好的CNN模型对信号进行去噪,并验证模型的去噪能力和泛化能力;最后,利用分数阶傅里叶变换(FRFT)建立去噪信号的分数谱,通过峰值点位置来估计LFM信号的参数。实验结果表明,相比于传统的基于非线性函数的方法,该方法在强脉冲噪声环境下具有更好的精度和噪声鲁棒性,CNN的应用使其具有更强的泛化能力,在实测脉冲噪声下仍可以准确估计参数。 展开更多
关键词 脉冲噪声 线性调频信号 参数估计 卷积神经网络 分数阶傅里叶变换
下载PDF
脉冲噪声下基于Sigmoid的LFM信号参数估计
5
作者 王厚友 郭勇 杨立东 《电子测量技术》 北大核心 2024年第2期176-184,共9页
由于脉冲噪声具有的短时大幅值特性,使得基于高斯假设的信号参数估计方法无法在脉冲噪声环境下有效估计参数。针对此问题,利用α稳定分布模拟随机脉冲噪声,提出了一种基于Sigmoid-CFRFT的LFM信号参数估计方法。首先,建立了一种自适应Sig... 由于脉冲噪声具有的短时大幅值特性,使得基于高斯假设的信号参数估计方法无法在脉冲噪声环境下有效估计参数。针对此问题,利用α稳定分布模拟随机脉冲噪声,提出了一种基于Sigmoid-CFRFT的LFM信号参数估计方法。首先,建立了一种自适应Sigmoid函数,证明了信号经过此非线性变换后,信号的2阶矩由无界变为有界,且信号的相位信息保持不变。其次,将变换后的信号进行离散时间CFRFT,建立了数学优化模型,并使用水循环算法搜索最优值点。最后,利用了非标准SαS分布噪声的修正方法,分析了标准和非标准分布下参数估计的性能。仿真结果说明,所提方法不仅可以有效抑制脉冲噪声对LFM信号分数谱特征的影响,而且能够实现低信噪比信号参数的高精度估计。相比于现有的基于非线性变换的参数估计方法,本文方法具有更好的精度,稳定性和噪声鲁棒性。 展开更多
关键词 线性调频信号 SIGMOID函数 简明分数阶傅里叶变换 脉冲噪声 参数估计
下载PDF
基于MySQL数据库的大学生档案管理系统开发
6
作者 李惠娟 张红亮 +1 位作者 杨立东 张晓明 《办公自动化》 2024年第13期73-76,共4页
学生档案是人事档案的重要组成部分,在后续求职、升学、社保等环节发挥着重要的凭证和参考作用。为了推进学院档案管理的现代化和信息化进程,针对目前学院学生档案管理工作存在的问题,基于MySQL数据库和WebStorm开发一套学生档案管理系... 学生档案是人事档案的重要组成部分,在后续求职、升学、社保等环节发挥着重要的凭证和参考作用。为了推进学院档案管理的现代化和信息化进程,针对目前学院学生档案管理工作存在的问题,基于MySQL数据库和WebStorm开发一套学生档案管理系统,可实现学生档案信息管理、滞留档案管理、学籍异动档案管理和账号管理的功能,为缓解管理人员的工作压力、提高档案管理质量提供支撑。 展开更多
关键词 学生档案 管理系统 MYSQL数据库
下载PDF
结合高效通道注意力机制的语音增强算法仿真 被引量:1
7
作者 杨立东 曾江蛟 董桂官 《计算机仿真》 北大核心 2023年第3期258-262,535,共6页
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力... 语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可懂度(STOI)平均提升了0.95%;在NoiseX-92数据集下,ESQ平均提升了3.8%,STOI平均提升了2.03%。实验结果表明,该方法在没有增加很大的计算量的情况下提高了模型的性能。 展开更多
关键词 语音增强 生成对抗网络 通道注意力 神经网络
下载PDF
基于并行胶囊网络的声学场景分类
8
作者 杨立东 赵飞焱 《传感器与微系统》 CSCD 北大核心 2023年第12期155-159,共5页
为解决卷积神经网络(CNN)忽略音频特征之间的空间关系、丢失姿态特征和时序性特征的问题,提出了基于并行胶囊网络的声学场景分类模型,选用胶囊网络和双向门控循环单元弥补CNN的缺陷。首先,该模型通过提取音频对数梅尔能量谱特征;然后,... 为解决卷积神经网络(CNN)忽略音频特征之间的空间关系、丢失姿态特征和时序性特征的问题,提出了基于并行胶囊网络的声学场景分类模型,选用胶囊网络和双向门控循环单元弥补CNN的缺陷。首先,该模型通过提取音频对数梅尔能量谱特征;然后,结合各模块优点对音频特征处理;最后,根据场景特征完成分类。通过在“国际声学场景和事件检测及分类(DCASE)挑战赛2019”挑战任务1数据集下进行实验,在开发集和验证集上分别获得了71.1%和70.2%的准确率,优于基线系统的准确率,证明了该网络模型适用于声学场景分类任务。 展开更多
关键词 声学场景分类 胶囊网络 双向门控循环单元 并行神经网络 动态路由机制
下载PDF
融合注意力特征及动态卷积的肺结节辅助诊断 被引量:3
9
作者 谷宇 刘佳琪 +3 位作者 杨立东 张宝华 张祥松 贾成一 《科学技术与工程》 北大核心 2023年第16期6834-6844,共11页
针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating atten... 针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating attention features,DcANet),并在有效实现肺结节良恶性分类的基础上对所提模型的诊断结果进行可视化分析。此网络以适应肺结节三维小尺寸输入特点的残差网络为基本框架,在DcABlock部分使用可以自适应调整卷积参数的动态卷积以及迭代注意特征融合模块,使模型能够更准确地获取肺结节信息,提高模型的表征能力。此外,还使用类激活映射将三维图像的各层切片进行可视化分析。实验在最终测试集上的准确率为85.87%,平衡F分数(F1)值为82.67%,敏感度和特异性的综合指标Gmean值为85.51%。实验结果表明:该网络可以提升对肺结节良恶性分类的准确性,诊断结果具有可信性,有一定的临床应用价值。 展开更多
关键词 肺结节辅助诊断 动态卷积 迭代注意特征融合模块 深度学习 类激活映射
下载PDF
基于改进残差网络和动态ReLU肺癌病理图像分类 被引量:1
10
作者 谷宇 李思敏 +5 位作者 张宝华 杨立东 吕晓琪 张祥松 贾成一 贺群 《激光杂志》 CAS 北大核心 2023年第5期154-161,共8页
为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高... 为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高模型性能。实验结果表明,该网络模型在肺良性图像、肺腺癌图像和肺鳞状细胞癌图像准确率分别达到100.00%、99.96%、99.96%,整个数据集准确率达到99.96%。因此,表明本实验所改进的网络模型可以有效地提高肺癌病理图像分类的准确率。 展开更多
关键词 肺癌病理图像 残差网络 注意力机制 图像分类
下载PDF
用户粒度级的个性化社交文本生成模型
11
作者 高永兵 高军甜 +1 位作者 马蓉 杨立东 《计算机应用》 CSCD 北大核心 2023年第4期1021-1028,共8页
针对开放性的社交文本领域的文本生成技术生成的文本内容缺少个性化特征的问题,提出了一种用户级的细粒度控制生成模型,即PTG-GPT2-Chinese(Personalized Text Generation Generative Pre-trained Transformer 2-Chinese)。所提模型基于... 针对开放性的社交文本领域的文本生成技术生成的文本内容缺少个性化特征的问题,提出了一种用户级的细粒度控制生成模型,即PTG-GPT2-Chinese(Personalized Text Generation Generative Pre-trained Transformer 2-Chinese)。所提模型基于GPT2(Generative Pre-trained Transformer 2.0)结构设计了Encoder-Decoder模型框架。首先在Encoder端对用户的静态个性化信息建模并编码,在Decoder端添加了双向独立的注意力模块,用于接收该静态的个性化特征向量,并利用原始GPT2结构中的注意力模块捕获用户文本中的动态个性化特征;然后,动态加权融合各注意力模块分数并参与后续解码,从而自动生成以用户个性化特征属性作为约束的社交文本;此外,为了解决用户基本信息的语义稀疏性导致的生成文本偶尔与某些个性化特征存在矛盾的问题,采用BERT模型对Decoder端输出数据与用户个性化特征进行一致性理解的二次增强生成,最终实现个性化的社交文本生成。实验结果表明,与GPT2模型相比,所提模型的流畅度提高了0.36%~0.72%,且在不损失语言流畅度的基础上,二次生成使个性化和一致性两个评价指标分别提高了10.27%和13.24%。这验证了所提模型能够有效辅助用户创作,生成流畅且符合用户个性的社交文本。 展开更多
关键词 个性化 文本生成 预训练语言模型 GPT2-Chinese 社交文本
下载PDF
超声乳化术联合SBL-3区域折射型非球面IOL治疗年龄相关白内障的效果及对视觉质量的影响
12
作者 王彦 杨立东 张立友 《临床误诊误治》 CAS 2024年第3期125-129,共5页
目的 探究超声乳化术联合SBL-3区域折射型非球面人工晶状体(IOL)治疗年龄相关白内障的效果及对视觉质量的影响。方法 选取2022年1—12月收治的年龄相关白内障110例,采用随机数字表法分为单焦点组55例和SBL-3组55例,单焦点组予超声乳化... 目的 探究超声乳化术联合SBL-3区域折射型非球面人工晶状体(IOL)治疗年龄相关白内障的效果及对视觉质量的影响。方法 选取2022年1—12月收治的年龄相关白内障110例,采用随机数字表法分为单焦点组55例和SBL-3组55例,单焦点组予超声乳化术联合ADAPT AO非球面单焦点IOL植入,SBL-3组给予超声乳化术联合SBL-3区域折射型非球面IOL植入。比较2组术后3个月对比敏感度[明光、暗光、明光炫光、暗光炫光],术前和术后3个月视觉质量[客观散射指数(OSI)、斯特列尔比(SR)、调制传递函数截止频率(MTF cut off)]、视力[最佳矫正近视力(BCNVA)、最佳矫正远视力(BCDVA)、远视矫正下的近视力(DCNVA)]及生活质量[视功能与生存质量问卷(VF-QOL)]。结果 术后3个月,SBL-3组对比敏感度高于单焦点组(P<0.05);术后3个月,2组OSI、BCNVA、BCDVA、DCNVA水平均较术前降低,SBL-3组低于单焦点组(P<0.05);术后3个月,2组SR、MTF cut off水平及VF-QOL评分均较术前升高,SBL-3组高于单焦点组(P<0.05)。结论 超声乳化术联合SBL-3区域折射型非球面IOL能够提高年龄相关白内障患者对比敏感度及视觉质量,改善视力水平及生活质量。 展开更多
关键词 年龄相关白内障 超声乳化白内障吸除术 区域折射型非球面人工晶状体 视觉质量 客观散射指数 对比敏感度 视力 生活质量
下载PDF
基于频谱图转换器的音频场景分类 被引量:3
13
作者 袁双 杨立东 +2 位作者 郭勇 牛大伟 张丹丹 《信号处理》 CSCD 北大核心 2023年第4期730-736,共7页
音频场景分类是场景理解重要的一环,学习音频场景特征并精准分类能加强机器与环境的交互能力,在大数据时代其重要性不言而喻。鉴于分类任务表现依赖数据集规模,但实际任务中又面临数据集严重不足的情况,本文提出了数据增强和网络模型预... 音频场景分类是场景理解重要的一环,学习音频场景特征并精准分类能加强机器与环境的交互能力,在大数据时代其重要性不言而喻。鉴于分类任务表现依赖数据集规模,但实际任务中又面临数据集严重不足的情况,本文提出了数据增强和网络模型预训练策略,将频谱图转换器模型和音频场景分类任务相结合。首先,提取音频信号对数梅尔能量频谱图输入模型,然后通过模型动态交互能力,加强音频序列空间关系,最后由标记向量完成分类。将本文方法在DCASE2019task1和DCASE2020task1公开数据集上进行测试,分类准确率分别达到了96.489%和93.227%,与已有算法相比有明显的提升,说明本方法适用高精度音频场景分类任务,为高精度智能设备感知环境内容、检测环境动态打下了基础。 展开更多
关键词 音频场景分类 转换器 预训练 数据增强
下载PDF
基于生成对抗网络的车载语音增强应用 被引量:1
14
作者 石瑞 杨立东 +2 位作者 郭勇 牛大伟 张丹丹 《国外电子测量技术》 北大核心 2023年第2期151-156,共6页
语音增强对智能车载系统和未来汽车工业的发展具有重要意义,为了解决汽车行驶过程中驾驶员语音被噪声污染的问题,提出一种基于高效通道注意力机制的最小二乘生成对抗网络模型。首先在生成网络模型中引入注意力机制,自适应选择一维卷积... 语音增强对智能车载系统和未来汽车工业的发展具有重要意义,为了解决汽车行驶过程中驾驶员语音被噪声污染的问题,提出一种基于高效通道注意力机制的最小二乘生成对抗网络模型。首先在生成网络模型中引入注意力机制,自适应选择一维卷积核大小生成通道权重,在降低模型复杂度的同时带来了明显的性能增益;然后利用最小二乘损失函数来代替Sigmoid交叉熵损失函数,使收敛速度更快,避免出现梯度消失的问题;最后经过生成对抗网络对抗博弈不断优化训练,从而实现语音增强。实验表明,该方法相较基线方法在语音质量和清晰度方面都有良好的提升,语音质量感知评估(PESQ)指标平均提升了3.79%,短时客观可懂度(STOI)指标平均提升了4.76%,因此更适合实际应用。 展开更多
关键词 生成对抗网络 语音增强 注意力机制 车载语音系统
下载PDF
改进DeepLabV3+网络的露天矿挡墙分割方法
15
作者 马旭 杨立东 +1 位作者 郭勇 赵艳锋 《电子测量技术》 北大核心 2023年第10期92-97,共6页
为抑制露天矿场复杂环境下的背景干扰,对安全挡墙进行精确的语义分割,提出了一种基于改进DeepLabV3+网络的露天矿安全挡墙分割方法。首先,主干网络采用轻量级的MobileNetV2网络,通过深度可分离卷积和倒残差结构有效降低了网络参数量和... 为抑制露天矿场复杂环境下的背景干扰,对安全挡墙进行精确的语义分割,提出了一种基于改进DeepLabV3+网络的露天矿安全挡墙分割方法。首先,主干网络采用轻量级的MobileNetV2网络,通过深度可分离卷积和倒残差结构有效降低了网络参数量和计算量。然后,加入混合注意力模块进行通道及空间上的特征强化,可避免边缘信息丢失。最后,利用数据增强和迁移学习解决目标数据集较少的问题,提高模型的泛化能力。实验结果证明,该方法有较好的分割效果,MIOU和MPA分别为85.06%、92.94%,均优于原网络和其他经典网络模型。该方法能够精确地分割露天矿安全挡墙,有较好的实际应用价值。 展开更多
关键词 语义分割 MobileNetV2 混合注意力
下载PDF
基于SET和AlexNet的雷达动目标检测方法
16
作者 郭勇 孙齐 杨立东 《现代雷达》 CSCD 北大核心 2023年第3期43-50,共8页
针对传统的雷达动目标检测方法在杂波背景下目标识别率低的问题,提出了基于时频分析和卷积神经网络的雷达动目标检测方法。首先,通过同步提取变换将动目标的回波信号转换为时频分布,初步提取回波信号的时频特征;然后,对回波信号时频分... 针对传统的雷达动目标检测方法在杂波背景下目标识别率低的问题,提出了基于时频分析和卷积神经网络的雷达动目标检测方法。首先,通过同步提取变换将动目标的回波信号转换为时频分布,初步提取回波信号的时频特征;然后,对回波信号时频分布的脊线进行提取,并基于此构建数据集;最后,将数据集输入AlexNet进行训练和测试,实现雷达动目标的识别和分类。仿真实验表明,基于SET和AlexNet的方法在噪声环境下能够有效检测动目标,对匀速、匀减速、匀加速三类动目标都具有较高的识别率。脊线提取的应用增强了低信噪比下回波信号的时频特征,提高了检测方法的准确率和噪声鲁棒性。 展开更多
关键词 动目标检测 时频分析 卷积神经网络 同步提取变换 脊线提取
下载PDF
河北省沧州城区6~14岁学龄儿童眼病现况调查 被引量:10
17
作者 杨立东 赵华 +7 位作者 杨云东 张歆 贾洪强 梁四妥 周畅达 周文宗 李亚楠 徐深 《国际眼科杂志》 CAS 2014年第5期908-912,共5页
目的:了解沧州地区学龄儿童眼部多发眼病种类及其相关危险因素,为学龄儿童眼部疾病预防及治疗提供可靠的流行病学依据。方法:我们对河北省沧州市区及所辖县市单纯随机抽取20所学校作为调查点,抽取调查对象3 150例6 299眼,一到三年级儿... 目的:了解沧州地区学龄儿童眼部多发眼病种类及其相关危险因素,为学龄儿童眼部疾病预防及治疗提供可靠的流行病学依据。方法:我们对河北省沧州市区及所辖县市单纯随机抽取20所学校作为调查点,抽取调查对象3 150例6 299眼,一到三年级儿童只接受医生眼部健康状况检查,四到六年级儿童接受医生眼部健康状况检查及眼表疾病指数问卷调查。所有结果资料采用SPSS 16.0进行统计学分析。结果:视力<0.9者42.42%,共2 672眼;干眼858例,患病率27.24%;睑缘及结膜炎症1 423眼,患病率22.59%;斜视189例,患病率6.00%。其他:先天性白内障8眼,患病率为0.13%;先天性上睑下垂78眼,患病率1.90%;下睑倒睫89眼,患病率1.41%;陈旧性眼外伤13眼,先天小视乳头4眼,男性儿童中有1眼为义眼。结论:学龄期儿童视力<0.9者比例较高,而低视力中近视所占的比例最高,提示广大眼科医师及家长儿童眼病的防治工作必须从保健入手,从小抓起,早发现、早治疗各种眼病以确保儿童较好的视力。 展开更多
关键词 流行病学调查 学龄期儿童 低于正常视力 屈光不正 弱视 眼压 干眼症
下载PDF
基于低秩张量补全的多声道音频信号恢复方法 被引量:5
18
作者 杨立东 王晶 +2 位作者 谢湘 赵毅 匡镜明 《电子与信息学报》 EI CSCD 北大核心 2016年第2期394-399,共6页
多声道音频信号在r采集、压缩、传输过程中可能造成音频数据丢失,为了确保给听众带来更真实的听觉感受,该文提出一种基于低秩张量补全的音频丢失数据恢复方法。首先,把多声道音频信号表示为一个张量;其次,把张量补全作为一个凸优化问题... 多声道音频信号在r采集、压缩、传输过程中可能造成音频数据丢失,为了确保给听众带来更真实的听觉感受,该文提出一种基于低秩张量补全的音频丢失数据恢复方法。首先,把多声道音频信号表示为一个张量;其次,把张量补全作为一个凸优化问题建模,利用松弛技术和变量分离技术得到闭合的增强拉格朗日函数;最后,通过交替迭代方法求解得到恢复的音频张量。在不同数据丢失率的实验中,通过与线性预测、加权优化的CANDECOMP/PARAFAC分解方法进行对比分析,表明利用张量补全方法具有更高的音频信号恢复精度,隐藏参考和基准的多激励测试结果也显示低秩张量补全方法能够有效地恢复多声道音频的丢失数据,从而获得更好的听觉效果。 展开更多
关键词 音频信号恢复 张量补全 迹范数 凸优化
下载PDF
基于张量分解模型的语音信号特征提取方法 被引量:7
19
作者 杨立东 王晶 +1 位作者 谢湘 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2013年第11期1171-1175,共5页
提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分... 提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分解得到各阶投影矩阵,从而建立语音信号在高阶空间上的特征体系,以便充分表征语音信号的特征.实验结果表明,本文提出的方法与传统特征参数体系比较,有利于语音识别系统性能的提高,并且对于带噪语音的识别具有一定的鲁棒性. 展开更多
关键词 张量分解 特征提取 投影矩阵
下载PDF
基于特征增强的挡墙及缺口检测方法
20
作者 周晓阳 张明 +1 位作者 杨立东 黄显武 《信息与电脑》 2023年第9期170-172,共3页
工业对煤炭的大量需求,激发了煤炭的开采。煤矿车辆的大量增加给煤矿安全带来了巨大的隐患,其中煤矿道路挡墙的安全更是保障煤矿安全的重中之重,因此监测露天矿运输道路安全挡墙势在必行。为了提高露天煤矿道路挡墙及缺口的检测性能,文... 工业对煤炭的大量需求,激发了煤炭的开采。煤矿车辆的大量增加给煤矿安全带来了巨大的隐患,其中煤矿道路挡墙的安全更是保障煤矿安全的重中之重,因此监测露天矿运输道路安全挡墙势在必行。为了提高露天煤矿道路挡墙及缺口的检测性能,文章基于U-Net网络提出了一种结合多尺度卷积模块的煤矿道路挡墙检测方法。该方法基于U-Net网络进行改进,在主干特征提取网络中加入了多尺度卷积模块,提升了检测精度。大量实验结果证明,该方法能够提高检测露天煤矿道路挡墙的性能和煤矿道路挡墙安全系数,为实现智慧矿山贡献一份力量。 展开更多
关键词 U-Net 多尺度卷积 目标检测
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部