期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于1D-Concatenate的信道估计DNN模型优化方法 被引量:2
1
作者 卢敏 秦泽豪 +2 位作者 陈志辉 张敏 乐光学 《电信科学》 2023年第4期71-86,共16页
为提高DNN模型在无线通信中信道估计精度,提出一种基于1D-Concatenate的信道估计DNN模型优化方法。该方法将Concatenate进行一维(1D)数据转换,以跳跃连接的方式引入DNN模型,抑制梯度消失问题,运用1D-Concatenate恢复网络训练过程中丢失... 为提高DNN模型在无线通信中信道估计精度,提出一种基于1D-Concatenate的信道估计DNN模型优化方法。该方法将Concatenate进行一维(1D)数据转换,以跳跃连接的方式引入DNN模型,抑制梯度消失问题,运用1D-Concatenate恢复网络训练过程中丢失的数据特征,提高DNN信道估计精度。为验证优化方法的有效性,选取较典型的基于DNN的无线通信信道估计模型进行对比仿真实验。实验结果表明,本文提出的优化方法对已有DNN模型的估计增益提升可达77.10%,在高信噪比下信道增益提升可达3 dB。该优化方法能有效提高DNN模型在无线通信中的信道估计精度,特别是高信噪比下提升效果显著。 展开更多
关键词 信道估计 深度神经网络 concatenate维度转换 数据特征恢复
下载PDF
融合点云和体素信息的目标检测网络
2
作者 刘慧 董振阳 田帅华 《计算机工程与设计》 北大核心 2024年第9期2771-2778,共8页
为解决复杂自动驾驶场景下小目标检测效果不佳和漏检的问题,提出一种融合点云和体素信息的高性能网络架构。通过预处理模块、空间语义特征关联模块、坐标注意力机制模块等改进PV-RCNN网络的检测性能,构建网络架构PSC-RCNN。在KITTI上进... 为解决复杂自动驾驶场景下小目标检测效果不佳和漏检的问题,提出一种融合点云和体素信息的高性能网络架构。通过预处理模块、空间语义特征关联模块、坐标注意力机制模块等改进PV-RCNN网络的检测性能,构建网络架构PSC-RCNN。在KITTI上进行验证,实验结果表明,PSC-RCNN在简单、中等、困难3种检测难度的类别下,对于自行车这种形状复杂的小物体识别精度分别为82.99%、67.03%、59.88%,相对原有的PV-RCNN网络,识别精度分别提高了4.39%、3.32%、2.23%;相对于现有3D目标检测网络,识别精度分别提高了0.51%、2.93%、2.23%。 展开更多
关键词 机器视觉 三维点云 三维体素 目标检测 空间语义特征关联 坐标注意力 特征融合
下载PDF
基于特征级联的联合平滑多视图子空间聚类算法
3
作者 张悦辰 葛洪伟 李婷 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期586-599,共14页
近年来,多视图聚类问题受到国内外的广泛关注.联合平滑多视图子空间聚类算法通过视图共识分组效应,利用多个视图的局部结构来规范视图共性表示,取得了不错的聚类效果,但是该算法对于不一致性的探索仍然存在一定的局限性,限制了聚类性能... 近年来,多视图聚类问题受到国内外的广泛关注.联合平滑多视图子空间聚类算法通过视图共识分组效应,利用多个视图的局部结构来规范视图共性表示,取得了不错的聚类效果,但是该算法对于不一致性的探索仍然存在一定的局限性,限制了聚类性能的进一步提升.为了进一步挖掘多视图的不一致性,提出一种基于特征级联的联合平滑多视图子空间聚类算法,它不仅同时学习视图间的一致性与不一致性,增强视图的多样性,还将不一致性划分为特定于集群的不一致性与特定于样本的不一致性,通过核范数进一步与低秩表示相关联,并在此基础上使用交替方向最小化进行迭代.在四个公共数据集上与其他优秀算法进行了对比实验,证明了所提算法的优越性. 展开更多
关键词 多视图 特征级联 子空间聚类 联合平滑
下载PDF
Breast Pathological Image Classification Based on VGG16 Feature Concatenation
4
作者 Liu Min Yi Ming +2 位作者 Wu Minghu Wang Juan He Yu 《Journal of Shanghai Jiaotong university(Science)》 EI 2022年第4期473-484,共12页
Breast cancer is one of the malignancies that endanger women’s health all over the world.Considering that there is some noise and edge blurring in breast pathological images,it is easier to extract shallow features o... Breast cancer is one of the malignancies that endanger women’s health all over the world.Considering that there is some noise and edge blurring in breast pathological images,it is easier to extract shallow features of noise and redundant information when VGG16 network is used,which is affected by its relative shallow depth and small convolution kernel.To improve the pathological diagnosis of breast cancers,we propose a classification method for benign and malignant tumors in the breast pathological images which is based on feature concatenation of VGG16 network.First,in order to improve the problems of small dataset size and unbalanced data samples,the original BreakHis dataset is processed by data augmentation technologies,such as geometric transformation and color enhancement.Then,to reduce noise and edge blurring in breast pathological images,we perform bilateral filtering and denoising on the original dataset and sharpen the edge features by Sobel operator,which makes the extraction of shallow features by VGG16 model more accurate.Based on transfer learning,the network model trained with the expanded dataset is called VGG16-1,and another model trained with the image denoising and sharpening and mixed with the original dataset is called VGG16-2.The features extracted by VGG16-1 and VGG16-2 are concatenated,and then classified by support vector machine.The final experimental results show that the average accuracy is 98.44%,98.89%,98.30%and 97.47%,respectively,when the proposed method is tested with the breast pathological images of 40×,100×,200×and 400×on BreakHis dataset. 展开更多
关键词 breast cancer BreakHis transfer learning convolutional neural network feature concatenation
原文传递
基于改进STDC的井下轨道区域实时分割方法
5
作者 马天 李凡卉 +2 位作者 杨嘉怡 张杰慧 丁旭涵 《工矿自动化》 CSCD 北大核心 2023年第11期107-114,共8页
目前中国大部分井下轨道运输场景较为开放,存在作业人员、散落物料或煤渣侵入到轨道上的问题,从而给机车行驶带来威胁。煤矿井下轨道区域多呈线性或弧形不规则区域,且轨道会逐渐收敛,采用目标识别框或检测轨道线的方法划分轨道区域难以... 目前中国大部分井下轨道运输场景较为开放,存在作业人员、散落物料或煤渣侵入到轨道上的问题,从而给机车行驶带来威胁。煤矿井下轨道区域多呈线性或弧形不规则区域,且轨道会逐渐收敛,采用目标识别框或检测轨道线的方法划分轨道区域难以精确获得轨道范围,采用轨道区域的分割可实现像素级别的精确轨道区域检测。针对目前井下轨道区域分割方法存在边缘信息分割效果差、实时性低的问题,提出了一种基于改进短期密集连接(STDC)网络的轨道区域实时分割方法。采用STDC作为骨干架构,以降低网络参数量与计算复杂度。设计了基于通道注意机制的特征注意力模块(FAM),用于捕获通道之间的依赖关系,对特征进行有效的细化和组合。使用特征融合模块(FFM)融合高级语义特征与浅层特征,并利用通道和空间注意力丰富融合特征表达,从而有效获取特征并减少特征信息丢失,提升模型性能。采用二值交叉熵损失、骰子损失及图像质量损失来优化详细信息的提取,并通过消除冗余结构来提高分割效率。在自建的数据集上对基于改进STDC的轨道区域实时分割方法进行验证,结果表明:该方法的平均交并比(MIoU)为95.88%,较STDC提高了3%;参数量为6.74 MiB,较STDC降低了18.3%;随着迭代次数增加,优化后的损失函数值持续减小,且较STDC降低更为明显;基于改进STDC的轨道区域实时分割方法的MIoU达95.88%,帧速率为37.8帧/s,参数量为6.74 MiB,准确率为99.46%。该方法可完整识别轨道区域,轨道被准确地分割且边缘轮廓完整准确。 展开更多
关键词 井下轨道区域 语义分割 短期密集连接网络 特征注意力 特征融合 注意力机制
下载PDF
基于改进多尺度残差网络的行人检测方法 被引量:5
6
作者 孙佩珺 张仲荣 +1 位作者 李琦铭 李俊 《计算机工程与设计》 北大核心 2023年第3期762-769,共8页
针对行人检测的尺度变化问题,提出一种基于改进多尺度残差网络无锚检测算法(IMSNet)。将Res2Net残差模块中多尺度特征提取融入ResNeXt,将改进后的网络作为主干网络(Res2NeXt*),使主干网络包含不同数量、不同组合的感受野;利用多个较小... 针对行人检测的尺度变化问题,提出一种基于改进多尺度残差网络无锚检测算法(IMSNet)。将Res2Net残差模块中多尺度特征提取融入ResNeXt,将改进后的网络作为主干网络(Res2NeXt*),使主干网络包含不同数量、不同组合的感受野;利用多个较小卷积核等效替代单个较大卷积核,增加网络深度并减少网络参数量;对细化的多尺度卷积特征级联融合做卷积运算,将行人检测简化为中心点和尺度预测任务。实验结果表明,IMSNet对CityPersons和Caltech数据集Reasonable设置分别实现了10.6%和2.6%的平均漏检率,检测每张图像仅需0.28 s。 展开更多
关键词 机器视觉 行人检测 深度学习 尺度变化 多尺度残差网络 特征融合 级联融合 感受野
下载PDF
基于双分支特征拼接的行人重识别 被引量:1
7
作者 潘凤 王杰 +3 位作者 张艳莎 谭棉 何兴 王林 《计算机与现代化》 2023年第5期93-99,共7页
针对不同监控视觉的拍摄,行人重识别任务存在类内(同一行人)前后变化大被误判、类间(相似行人)模糊造成区分度低的问题,提出一种双分支特征拼接的行人重识别方法(Dual-branch Feature Concatenation Network,DFCNet)。该方法通过对网络... 针对不同监控视觉的拍摄,行人重识别任务存在类内(同一行人)前后变化大被误判、类间(相似行人)模糊造成区分度低的问题,提出一种双分支特征拼接的行人重识别方法(Dual-branch Feature Concatenation Network,DFCNet)。该方法通过对网络的深度特征进行拼接,使特征信息互补,获得辨别性特征,并用批归一化层代替基础网络全局平均池化层后的全连接层,使用标签平滑交叉熵损失函数训练网络,解决类内变化大及类间模糊造成提取特征辨别性差的问题。为验证所建议方法的有效性,在Market1501、DukeMTMC-reID公开数据集上进行验证,其中在Market1501数据集上,Rank-1和mAP指标分别达到95.8%和94.3%。结果表明所建议方法在处理类内误判与类间难区分问题上具有良好性能,且识别精度优于对比的流行算法。 展开更多
关键词 模式识别 行人重识别 特征提取 双分支特征拼接
下载PDF
Text Extraction with Optimal Bi-LSTM
8
作者 Bahera H.Nayef Siti Norul Huda Sheikh Abdullah +1 位作者 Rossilawati Sulaiman Ashwaq Mukred Saeed 《Computers, Materials & Continua》 SCIE EI 2023年第9期3549-3567,共19页
Text extraction from images using the traditional techniques of image collecting,and pattern recognition using machine learning consume time due to the amount of extracted features from the images.Deep Neural Networks... Text extraction from images using the traditional techniques of image collecting,and pattern recognition using machine learning consume time due to the amount of extracted features from the images.Deep Neural Networks introduce effective solutions to extract text features from images using a few techniques and the ability to train large datasets of images with significant results.This study proposes using Dual Maxpooling and concatenating convolution Neural Networks(CNN)layers with the activation functions Relu and the Optimized Leaky Relu(OLRelu).The proposed method works by dividing the word image into slices that contain characters.Then pass them to deep learning layers to extract feature maps and reform the predicted words.Bidirectional Short Memory(BiLSTM)layers extractmore compelling features and link the time sequence fromforward and backward directions during the training phase.The Connectionist Temporal Classification(CTC)function calcifies the training and validation loss rates.In addition to decoding the extracted feature to reform characters again and linking them according to their time sequence.The proposed model performance is evaluated using training and validation loss errors on the Mjsynth and Integrated Argument Mining Tasks(IAM)datasets.The result of IAM was 2.09%for the average loss errors with the proposed dualMaxpooling and OLRelu.In the Mjsynth dataset,the best validation loss rate shrunk to 2.2%by applying concatenating CNN layers,and Relu. 展开更多
关键词 Deep neural network text features dual max-pooling concatenating convolution neural networks bidirectional long short memory text connector characteristics
下载PDF
深度学习无人机遥感影像车辆快速检测方法研究 被引量:1
9
作者 杨秀伶 《测绘技术装备》 2023年第1期23-30,共8页
以无人机遥感影像为数据源实施多类别车辆目标的快速、精准检测,在城市道路管理及智慧城市建设等领域有重要的应用价值。针对无人机遥感影像中存在的背景复杂、车辆目标分布密集交错等问题,本文提出一种基于单阶段回归方法的车辆检测模... 以无人机遥感影像为数据源实施多类别车辆目标的快速、精准检测,在城市道路管理及智慧城市建设等领域有重要的应用价值。针对无人机遥感影像中存在的背景复杂、车辆目标分布密集交错等问题,本文提出一种基于单阶段回归方法的车辆检测模型。在特征提取网络中,以3×3小尺寸卷积核为基础构建带有自适应校正(Squeeze and Excitation,SE)通道注意力机制的特征提取层作为网络前三层,对小尺寸目标特征进行细粒度提取,以级联非对称卷积组构成后网络的后两层,通过更少的计算量来完成对大尺度目标的特征提取。在特征增强网络中,将所有尺度特征图融合为三层输出特征图,并利用自适应锚点框机制实现目标框定位。试验结果表明,本文提出的模型能够达到0.906的综合检测精度与31帧/秒的检测速度,并且对于多种背景下不同密集程度的汽车目标表现出良好的泛化能力。 展开更多
关键词 无人机遥感影像 车辆检测 分组级联卷积 多尺度特征融合
下载PDF
基于多尺度近端特征拼接网络的高光谱图像分类方法 被引量:4
10
作者 高红民 曹雪莹 +3 位作者 陈忠昊 花再军 李臣明 陈月 《通信学报》 EI CSCD 北大核心 2021年第2期92-102,共11页
针对基于传统卷积神经网络模型的高光谱图像分类算法细节表现力不强及网络结构过于复杂的问题,设计了一种基于多尺度近端特征拼接网络的高光谱图像分类方法。通过引入多尺度滤波器和空洞卷积,在保持模型轻量化的同时可以获取更丰富的空... 针对基于传统卷积神经网络模型的高光谱图像分类算法细节表现力不强及网络结构过于复杂的问题,设计了一种基于多尺度近端特征拼接网络的高光谱图像分类方法。通过引入多尺度滤波器和空洞卷积,在保持模型轻量化的同时可以获取更丰富的空间−光谱判别特征,并提出利用卷积神经网络近端特征间的相互联系进一步增强细节表现力。在3个基准高光谱图像数据集上的实验结果表明,所提方法优于其他分类模型。 展开更多
关键词 卷积神经网络 高光谱图像分类 特征拼接 多尺度滤波器 空洞卷积
下载PDF
带标签信息子字典级联学习的复合电能质量扰动识别方法 被引量:2
11
作者 刘慧 李光武 +1 位作者 沈跃 滕成龙 《电子测量与仪器学报》 CSCD 北大核心 2017年第12期2009-2016,共8页
针对传统字典学习方法的训练样本信号单一、重构效果差等缺点,提出一种带标签信息子字典级联的学习方法,对电能质量扰动信号进行扰动识别。该方法首先对不同类别电能质量扰动测试和训练样本采用主成分分析方法进行降维特征提取,对训练... 针对传统字典学习方法的训练样本信号单一、重构效果差等缺点,提出一种带标签信息子字典级联的学习方法,对电能质量扰动信号进行扰动识别。该方法首先对不同类别电能质量扰动测试和训练样本采用主成分分析方法进行降维特征提取,对训练样本添加标签信息,其次对不同类别的电能质量样本训练成冗余子字典并级联成结构化字典,最后将级联的字典优化学习并由冗余误差最小值来判断目标的归属类别。仿真实验结果表明,该方法下的识别效果优于支持向量机(SVM)和稀疏表达分类(SRC),抗噪声鲁棒性更强,在信噪比20 dB以上的环境中电能质量复合扰动识别率达到91.40%以上。 展开更多
关键词 标签信息 电能质量 子字典级联学习 特征提取
下载PDF
基于改进PSPnet的无人机农田场景语义分割 被引量:5
12
作者 刘尚旺 张杨杨 +2 位作者 蔡同波 唐秀芳 王长庚 《灌溉排水学报》 CSCD 北大核心 2022年第4期101-108,共8页
【目的】改进PSPnet语义分割模型在无人机农田场景下的性能。【方法】对PSPnet语义分割模型进行3方面改进:(1)通过不同维度特征级联,在强化场景解析的基础上保留更多图像细节特征。(2)利用深度可分离卷积模块构建轻量级语义分割模型,使... 【目的】改进PSPnet语义分割模型在无人机农田场景下的性能。【方法】对PSPnet语义分割模型进行3方面改进:(1)通过不同维度特征级联,在强化场景解析的基础上保留更多图像细节特征。(2)利用深度可分离卷积模块构建轻量级语义分割模型,使其更加高效。(3)改进激活函数,提升模型分割效果。【结果】所建模型的平均像素准确率和平均交并比分别为89.48%和82.38%,比改进前的模型提高了18.12%和18.93%,且分割结果优于Unet和DeeplabV3+等模型。【结论】改进后的模型能够有效进行无人机遥感农田场景语义分割。 展开更多
关键词 PSPnet 语义分割 特征级联 深度可分离卷积 激活函数
下载PDF
基于联结残差网络的单幅图像去雨 被引量:2
13
作者 陈清江 吴田田 《液晶与显示》 CAS CSCD 北大核心 2021年第4期605-614,共10页
本文通过改进的残差网络,学习有雨图像和无雨图像之间的映射关系来实现图像去雨,提出了一种基于联结残差网络的单幅图像去雨算法。首先,利用改进的残差块简化网络模块,减少网络参数,提升网络训练速度;其次,设计的联结结构不仅实现了多... 本文通过改进的残差网络,学习有雨图像和无雨图像之间的映射关系来实现图像去雨,提出了一种基于联结残差网络的单幅图像去雨算法。首先,利用改进的残差块简化网络模块,减少网络参数,提升网络训练速度;其次,设计的联结结构不仅实现了多特征提取,有效减少了参数,而且增加了特征图的输出,有利于保留更多的图像细节信息;最后,利用单尺度卷积实现图像细节重建,提高去雨图像的视觉效果。实验结果表明本文算法在合成雨天图像数据集上,其结构相似度和峰值信噪比的平均值分别高于0.95和33 dB,而真实雨天图像数据集的盲图像质量评价值较低。本文算法不仅能有效去除图像中的雨,雨纹残留较少,而且能更多地保留图像的纹理和边缘细节,视觉效果清晰自然。 展开更多
关键词 单幅图像去雨 卷积神经网络 残差学习 联结结构 多特征提取 盲图像质量评价
下载PDF
“蒙面影像特征”引导下的多案串并及实战应用
14
作者 张大治 郭勇 《四川警察学院学报》 2021年第1期61-68,共8页
虽然人工智能在蒙面犯罪行为的智能侦测与自动识别方面有了一些重大突破,但是,在一些复杂环境中或特殊情况下,对蒙面人的智能侦测与自动识别,只是作为一个实验验证,并不能代替视频侦查技术人员的人工审看、手动跟踪及分析研判的最终结... 虽然人工智能在蒙面犯罪行为的智能侦测与自动识别方面有了一些重大突破,但是,在一些复杂环境中或特殊情况下,对蒙面人的智能侦测与自动识别,只是作为一个实验验证,并不能代替视频侦查技术人员的人工审看、手动跟踪及分析研判的最终结果。研究"蒙面影像特征"引导下的多案串并思路及人工操作方法,一方面有助于跟踪与锁定同一"蒙面人"连续作案或间歇作案的活动轨迹,另一方面也有助于辨认与比对蒙面以后的人脸特征、行为动作特征、衣着特征、随身物品特征、作案工具特征等。在蒙面犯罪案件的多案串并或个案侦破中,"蒙面影像特征"跟踪分析法、辨认比对法,以及"蒙面影像特征"引导下的视频导侦法、多侦联动法,可以作为一种迅速发现侦查线索或寻找案件串并依据的途径与方法。 展开更多
关键词 蒙面犯罪 多案串并 影像跟踪 特征辨认 侦查方法
下载PDF
汉语语音合成的研究进展 被引量:7
15
作者 冯哲 孙吉贵 +1 位作者 张长胜 王岩 《吉林大学学报(信息科学版)》 CAS 2007年第2期198-206,共9页
为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上... 为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上的应用以及目前评价语音合成系统性能的一些新方法,并对当前语音合成技术的研究热点和语音合成技术存在的问题进行了分析,为语音合成技术的进一步研究提供了借鉴作用。 展开更多
关键词 文语转换 自动分词 PSOLA算法 PSFC算法 韵律特征
下载PDF
结合双深度学习特征的高光谱遥感图像分类 被引量:11
16
作者 曾锐 陈锻生 《小型微型计算机系统》 CSCD 北大核心 2018年第2期396-400,共5页
光谱信息和空间信息相结合在高光谱遥感图像分类领域是提高分类准确率的一种手段.因此提出了结合两种光谱-空间特征的分类方法:一种是使用保边松弛算法对图像进行保边去噪预处理,然后使用卷积神经网络提取光谱维的特征;另一种是先对预... 光谱信息和空间信息相结合在高光谱遥感图像分类领域是提高分类准确率的一种手段.因此提出了结合两种光谱-空间特征的分类方法:一种是使用保边松弛算法对图像进行保边去噪预处理,然后使用卷积神经网络提取光谱维的特征;另一种是先对预处理后的图像的光谱维降维,取像素的一定邻域大小形成的图像块,并使用另外一个卷积神经网络提取图像块的空间特征;然后将这两个提取的特征串行拼接,最后使用支持向量机进行分类.为了验证本文提出的方法的有效性,在两个常用的高光谱图像数据集进行分类实验,结果显示提取的两种特征光谱-空间特征结合后能有效提高图像分类准确率. 展开更多
关键词 卷积神经网络 保边松弛 特征提取 特征拼接
下载PDF
基于改进卷积神经网络的快速车辆检测 被引量:13
17
作者 朱锋彬 应娜 《传感器与微系统》 CSCD 2018年第12期153-155,160,共4页
为了更加快速精准地识别和定位车辆,提出了一种基于卷积神经网络的改进算法。在建议网络(PN)以及特征提取上进行了优化,在提取基本特征之后嵌入一个轻量级的建议网络,产生候选区域,并在早期丢弃不可能的区域候选框减少背景数量;采用特... 为了更加快速精准地识别和定位车辆,提出了一种基于卷积神经网络的改进算法。在建议网络(PN)以及特征提取上进行了优化,在提取基本特征之后嵌入一个轻量级的建议网络,产生候选区域,并在早期丢弃不可能的区域候选框减少背景数量;采用特征融合技术提取H-yper特征,细化了车辆的识别和定位,并对不同层提取的特征进行串联,有效地提高了车辆检测的质量和精度。在车辆检测和跟踪的大规模数据集和自己采集的车辆数据集上进一步验证,并与目前一些先进的算法进行比较,其中相比于Faster RCNN平均检测质量提高了9. 91%,充分表明了提出的算法的有效性。 展开更多
关键词 车辆检测 卷积神经网路 Hyper特征 特征串联
下载PDF
混合单元选择语音合成系统的目标代价构建 被引量:1
18
作者 蔡文彬 魏云龙 +1 位作者 徐海华 潘林 《计算机工程与应用》 CSCD 北大核心 2018年第24期20-25,共6页
合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对... 合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对目标代价构建进行了探究。实验结果表明,经过相似语料训练后微调的深度声学网络模型,预测的瓶颈特征更能表征拼接基元特性,从而指导目标代价筛选理想候选单元,提高合成语音的质量。 展开更多
关键词 语音合成 目标代价 声学特征 声学模型 拼接基元
下载PDF
多层特征图堆叠网络及其目标检测方法 被引量:5
19
作者 杨爱萍 鲁立宇 冀中 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2020年第6期647-652,共6页
随着深度卷积神经网络的快速发展,基于深度学习的目标检测方法由于具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流.为了解决目标检测中小目标漏检问题,往往使用多尺度处理方法.现有的多尺度目标检测方法可以分为... 随着深度卷积神经网络的快速发展,基于深度学习的目标检测方法由于具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流.为了解决目标检测中小目标漏检问题,往往使用多尺度处理方法.现有的多尺度目标检测方法可以分为基于图像金字塔的方法和基于特征金字塔的方法.相比于基于图像金字塔的方法,基于特征金字塔的方法速度更快,更能充分利用不同卷积层的特征信息.现有的基于特征金字塔的方法采用对应元素相加的方式融合不同尺度的特征图,在特征融合过程中易丢失低层细节特征信息.针对该问题,本文基于特征金字塔网络(featurepyramidnetwork,FPN),提出一种多层特征图堆叠网络(multi-featureconcatenationnetwork,MFCN)及其目标检测方法.该网络以FPN为基础,设计多层特征图堆叠结构,通过不同特征层之间的特征图堆叠融合高层语义特征和低层细节特征,并且在每个层上进行目标检测,保证每层可包含该层及其之上所有层的特征信息,可有效克服低层细节信息丢失.同时,为了能够充分利用ResNet101中的高层特征,在其后添加新的卷积层,并联合其低层特征图,提取多尺度特征.在PASCALVOC2007数据集上的检测精度为80.1%m AP,同时在PASCALVOC2012和MSCOCO数据集上的表现都优于FPN算法.相比于FPN算法,MFCN的检测性能更加优秀. 展开更多
关键词 特征金字塔网络 目标检测 特征图堆叠 语义信息
下载PDF
改进Mask RCNN算法及其在行人实例分割中的应用 被引量:15
20
作者 音松 陈雪云 贝学宇 《计算机工程》 CAS CSCD 北大核心 2021年第6期271-276,283,共7页
Mask RCNN算法在特征提取过程中存在语义信息丢失的问题,而自然场景中的行人具有姿态不同、遮挡和背景复杂等特点,导致算法应用于行人实例分割时检测准确性较差。对此,提出一种改进的Mask RCNN算法。在Mask RCNN网络的Mask分支中增加串... Mask RCNN算法在特征提取过程中存在语义信息丢失的问题,而自然场景中的行人具有姿态不同、遮挡和背景复杂等特点,导致算法应用于行人实例分割时检测准确性较差。对此,提出一种改进的Mask RCNN算法。在Mask RCNN网络的Mask分支中增加串联特征金字塔网络(CFPN)模块,对网络生成的多层特征进行融合,充分利用不同特征层的语义信息。在此基础上,执行RoI Align操作生成行人掩膜。仿照COCO数据集,从生活场景中拍摄1000张图片,自建一个新的行人数据集。基于该数据集的实验结果表明,改进算法较原算法具有更高的检测精确率。 展开更多
关键词 行人实例分割 Mask RCNN算法 特征融合 目标检测 串联特征金字塔网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部