期刊文献+
共找到685篇文章
< 1 2 35 >
每页显示 20 50 100
An Improved Scene-based Nonuniformity Correction Algorithm for Infrared Focal Plane Arrays Using Neural Networks 被引量:2
1
作者 隋婧 金伟其 +2 位作者 董立泉 王霞 郭宏 《Defence Technology(防务技术)》 SCIE EI CAS 2006年第2期117-122,共6页
The improved scene-based adaptive nonuniformity correction (NUC) algorithms using a neural network (NNT) approach for infrared image sequences are presented and analyzed. The retina-like neural networks using steepest... The improved scene-based adaptive nonuniformity correction (NUC) algorithms using a neural network (NNT) approach for infrared image sequences are presented and analyzed. The retina-like neural networks using steepest descent model was the first proposed infrared focal plane arrays (IRFPA) nonuniformity compensation method,which can perform parameter estimation of the sensors over time on a frame by frame basis. To increase the strength and the robustness of the NNT algorithm and to avoid the presence of ghosting artifacts,some optimization techniques,including momentum term,regularization factor and adaptive learning rate,were executed in the parameter learning process. In this paper,the local median filtering result of AX^U_ ij (n) is proposed as an alternative value of desired network output of neuron X_ ij (n),denoted as T_ ij (n),which is the local spatial average of AX^U_ ij (n) in traditional NNT methods. Noticeably,the NUC algorithm is inter-frame adaptive in nature and does not rely on any statistical assumptions on the scene data in the image sequence. Applications of this algorithm to the simulated video sequences and real infrared data taken with PV320 show that the correction results of image sequence are better than that of using original NNT approach,especially for the short-time image sequences (several hundred frames) subjected to the dense impulse noises with a number of dead or saturated pixels. 展开更多
关键词 红外线 焦面位移排列 神经系统 图像系统 光化学
下载PDF
基于场景流的可变速率动态点云压缩
2
作者 江照意 邹文钦 +2 位作者 郑晟豪 宋超 杨柏林 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第2期279-287,333,共10页
针对现有的动态点云压缩神经网络需要训练多个网络模型的问题,提出基于场景流的可变速率动态点云压缩网络框架.网络以原始动态点云为输入,利用场景流网络进行运动向量估计,在压缩运动向量和残差的同时,引入通道增益模块对隐向量通道进... 针对现有的动态点云压缩神经网络需要训练多个网络模型的问题,提出基于场景流的可变速率动态点云压缩网络框架.网络以原始动态点云为输入,利用场景流网络进行运动向量估计,在压缩运动向量和残差的同时,引入通道增益模块对隐向量通道进行评估和缩放,实现可变速率控制.通过综合考虑运动向量损失和率失真损失,设计新的联合训练损失函数,用来端到端地训练整个网络框架.为了解决动态点云数据集缺少真实运动信息标签的问题,基于AMASS数据集制作带有运动向量标签的人体数据集,用于网络的训练.实验结果显示,与现有的基于深度学习动态点云压缩方法相比,该方法的压缩比特率下降了几个数量级,与静态压缩网络单独处理每帧的重构效果相比,该方法有5%~10%的提升. 展开更多
关键词 动态点云压缩 可变速率 联合损失函数 场景流网络
下载PDF
No-reference image quality assessment based on AdaBoost_BP neural network in wavelet domain 被引量:1
3
作者 YAN Junhua BAI Xuehan +4 位作者 ZHANG Wanyi XIAO Yongqi CHATWIN Chris YOUNG Rupert BIRCH Phil 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第2期223-237,共15页
Considering the relatively poor robustness of quality scores for different types of distortion and the lack of mechanism for determining distortion types, a no-reference image quality assessment(NR-IQA) method based o... Considering the relatively poor robustness of quality scores for different types of distortion and the lack of mechanism for determining distortion types, a no-reference image quality assessment(NR-IQA) method based on the Ada Boost BP neural network in the wavelet domain(WABNN) is proposed. A 36-dimensional image feature vector is constructed by extracting natural scene statistics(NSS) features and local information entropy features of the distorted image wavelet sub-band coefficients in three scales. The ABNN classifier is obtained by learning the relationship between image features and distortion types. The ABNN scorer is obtained by learning the relationship between image features and image quality scores. A series of contrast experiments are carried out in the laboratory of image and video engineering(LIVE) database and TID2013 database. Experimental results show the high accuracy of the distinguishing distortion type, the high consistency with subjective scores and the high robustness of the method for distorted images. Experiment results also show the independence of the database and the relatively high operation efficiency of this method. 展开更多
关键词 image quality assessment (IQA) AdaBoost_BP neural network (ABNN) WAVELET transform natural scene STATISTICS (NSS) local information ENTROPY
下载PDF
Deep Scalogram Representations for Acoustic Scene Classification 被引量:5
4
作者 Zhao Ren Kun Qian +3 位作者 Zixing Zhang Vedhas Pandit Alice Baird Bjorn Schuller 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2018年第3期662-669,共8页
Spectrogram representations of acoustic scenes have achieved competitive performance for acoustic scene classification. Yet, the spectrogram alone does not take into account a substantial amount of time-frequency info... Spectrogram representations of acoustic scenes have achieved competitive performance for acoustic scene classification. Yet, the spectrogram alone does not take into account a substantial amount of time-frequency information. In this study, we present an approach for exploring the benefits of deep scalogram representations, extracted in segments from an audio stream. The approach presented firstly transforms the segmented acoustic scenes into bump and morse scalograms, as well as spectrograms; secondly, the spectrograms or scalograms are sent into pre-trained convolutional neural networks; thirdly,the features extracted from a subsequent fully connected layer are fed into(bidirectional) gated recurrent neural networks, which are followed by a single highway layer and a softmax layer;finally, predictions from these three systems are fused by a margin sampling value strategy. We then evaluate the proposed approach using the acoustic scene classification data set of 2017 IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events(DCASE). On the evaluation set, an accuracy of 64.0 % from bidirectional gated recurrent neural networks is obtained when fusing the spectrogram and the bump scalogram, which is an improvement on the 61.0 % baseline result provided by the DCASE 2017 organisers. This result shows that extracted bump scalograms are capable of improving the classification accuracy,when fusing with a spectrogram-based system. 展开更多
关键词 Acoustic scene classification(ASC) (bidirectional) gated recurrent neural networks((B) GRNNs) convolutional neural networks(CNNs) deep scalogram representation spectrogram representation
下载PDF
复杂场景下一种改进的单目标跟踪算法研究
5
作者 侯艳丽 魏义仑 +1 位作者 王鑫涛 王娟 《计算机仿真》 2024年第2期300-305,共6页
针对部分复杂场景下目标跟踪存在跟踪框漂移问题,基于孪生候选区域生成网络(SiamRPN),融合通道注意力模块和选择核心模块(SK Module),提出一种单目标跟踪算法CAKSiamRPN。特征提取部分引入高效通道注意模块(ECAM)和基于标准化的通道注... 针对部分复杂场景下目标跟踪存在跟踪框漂移问题,基于孪生候选区域生成网络(SiamRPN),融合通道注意力模块和选择核心模块(SK Module),提出一种单目标跟踪算法CAKSiamRPN。特征提取部分引入高效通道注意模块(ECAM)和基于标准化的通道注意力模块(NCAM),在不降低通道维度的情况下,摒弃相似信息,突出显著特征,关注并提取特定信息;在候选区域生成网络(RPN)嵌入SK Module,增强全局信息嵌入,减少填充操作的影响。将改进算法与SiamRPN及其它经典单目标跟踪算法在OTB100和UAV123数据集上进行实验对比。实验结果表明:跟踪精度和成功率明显提高,能更好地适应复杂场景,具有更强的鲁棒性。 展开更多
关键词 目标跟踪 复杂场景 孪生网络 注意力模块 选择核心模块
下载PDF
基于金字塔池化网络的质子交换膜燃料电池气体扩散层组分推理方法
6
作者 王虎 尹泽泉 +6 位作者 王雯婕 黄笠舟 方宁宁 隋俊友 张加乐 张锐明 隋邦傑 《重庆大学学报》 CAS CSCD 北大核心 2024年第1期84-92,共9页
针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组... 针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组分识别与比例推理方法:首先将带标签的气体扩散层扫描电镜(scanning electron microscope,SEM)图片输入神经网络,得到特征图;得到的图像特征层进入金字塔池化模块后,获取SEM图像的深层和浅层特征;随后将深层和浅层特征图层融合输入全卷积网络(fully convolutional network,FCN)模块,得到预测图像;最后统计各个组分上的像素点比例,通过MLP完成组分比例推理。结果表明:所提方法组分识别像素准确率达81.24%;在5%偏差范围内,比例推理准确率为88.89%。该方法解决了气体扩散层多组分无法区分、比例无法获知的问题,可有效应用于气体扩散层的质检、数值重构以及制备工艺改进。 展开更多
关键词 质子交换膜燃料电池 气体扩散层制备 扫描电镜 人工智能 金字塔池化网络 多层感知器
下载PDF
Terrain Simplification Research in Augmented Scene Modeling
7
作者 Ming Delie You Kefei Tian Jinwen Liu Jian State Key Laboratory for Image Processing and Intelligent Control, Institute for Pattern Recognition and Artificial Intelligence , Huazhong University of Science and Technology , Wuhan 430074 Wang Guangju 《Journal of China University of Geosciences》 SCIE CSCD 2001年第4期351-355,共5页
Augmented reality is the merging of synthetic sensory information into a user's perception of a real environment. As one of the most important tasks in augmented scene modeling, terrain simplification research has... Augmented reality is the merging of synthetic sensory information into a user's perception of a real environment. As one of the most important tasks in augmented scene modeling, terrain simplification research has gained more and more attention. In this paper, we mainly focus on point selection problem in terrain simplification using triangulated irregular network. Based on the analysis and comparison of traditional importance measures for each input point, we put forward a new importance measure based on local entropy. The results demonstrate that the local entropy criterion has a better performance than any traditional methods. In addition, it can effectively conquer the 'short-sight' problem associated with the traditional methods. 展开更多
关键词 augmented reality scene modeling terrain simplification triangulated irregular network importance measures local entropy.
下载PDF
基于多尺度特征与注意力模块的室内场景识别方法
8
作者 岳有军 张远锟 +1 位作者 赵辉 王红君 《计算机与现代化》 2024年第8期37-42,共6页
场景识别在视觉信息检索、图像分割、图像/视频理解等任务中有着关键性的作用。随着深度学习理论的发展,尤其是卷积神经网络(CNN)能识别图像中具有辨别性的物体,这大大提高了场景识别的能力。为了实现智能轮椅床等家庭服务机器人的自主... 场景识别在视觉信息检索、图像分割、图像/视频理解等任务中有着关键性的作用。随着深度学习理论的发展,尤其是卷积神经网络(CNN)能识别图像中具有辨别性的物体,这大大提高了场景识别的能力。为了实现智能轮椅床等家庭服务机器人的自主场景识别,针对在移动端或嵌入式设备计算资源和内存需求有限的情况下,网络输出辨别性物体单一而造成场景识别率低的问题,提出一种基于多尺度特征提取和注意力模块的室内场景识别方法。该方法基于Mobile-NetV2轻量化网络,从网络中选择不同分支提取不同尺度的特征。为关注场景中更有辨别性的特征,在分支中加入了MRLA-Light注意力模块,仿真结果表明准确率有明显提高,在MIT Indoor 67数据集、Scene 15数据集上的准确率分别为86.3%和94.3%,相比于同类型网络有更高的准确率。 展开更多
关键词 室内场景识别 轻量化网络 注意力模块 特征提取
下载PDF
基于生态网络优化对比的国土空间生态修复策略研究
9
作者 周燕 刘梦瑶 +2 位作者 王丽娜 禹佳宁 罗巧灵 《中国园林》 CSCD 北大核心 2024年第9期43-49,共7页
生态网络构建有助于整合破碎绿地斑块,识别国土空间生态修复过程中的关键区域并制定针对性措施,为生态型国土空间整治提供方法与技术支撑。然而,目前基于自然资源与土地利用现状构建的单一时空情景生态网络,忽略了网络与城市发展的动态... 生态网络构建有助于整合破碎绿地斑块,识别国土空间生态修复过程中的关键区域并制定针对性措施,为生态型国土空间整治提供方法与技术支撑。然而,目前基于自然资源与土地利用现状构建的单一时空情景生态网络,忽略了网络与城市发展的动态变化,其稳定性与连通性缺乏验证反馈,契合城市发展的合理网络优化方案尚不明晰,生态保护措施难以适应未来城市空间的发展变化。在构建现有生态网络的基础上,对未来城市土地利用扩张情况进行预测,从生态源地、廊道、节点的动态修复视角设置增加生态踏脚石、清除生态障碍点和保护关键生态夹点3种网络优化情景,通过网络连通性分析对3种修复情景进行优化效应评估。结果显示,3种修复情景中,消除生态障碍点对生态网络的优化作用最明显,是未来生态网络构建与优化的主要关注方向。以通城县为例,判定了生态网络的最佳优化方案,提出适应现状地域特征、面向未来发展方向的生态安全格局,从生态资源要素与城市发展动态演替的视角为生态格局优化提供新思路,为生态型国土空间综合整治提供科学技术方法。 展开更多
关键词 风景园林 生态网络 MSPA 情景模拟 生态安全格局 国土空间生态修复
下载PDF
基于多尺度特征与互监督的拥挤行人检测
10
作者 肖振久 李思琦 曲海成 《计算机工程与科学》 CSCD 北大核心 2024年第7期1278-1285,共8页
针对拥挤场景中,行人漏检率高、准确率低的问题,提出一种基于多尺度特征与互监督的拥挤行人检测网络。为了有效提取复杂场景中的行人特征信息,用PANet金字塔网络与混合空洞卷积相结合的网络提取特征信息。然后,设计了一种行人头部-全身... 针对拥挤场景中,行人漏检率高、准确率低的问题,提出一种基于多尺度特征与互监督的拥挤行人检测网络。为了有效提取复杂场景中的行人特征信息,用PANet金字塔网络与混合空洞卷积相结合的网络提取特征信息。然后,设计了一种行人头部-全身互监督检测网络分别进行头部和全身检测,利用头部预测框和全身预测框的互监督获得更加准确的行人检测结果。所提出的网络在数据集CrowdHuman上取得了13.5%的MR^(-2)性能,相较于YOLOv5网络提升了3.6%,同时AP提升了3.5%;在CityPersons数据集上取得了48.2%的MR^(-2)性能,相较于YOLOv5网络提升了2.3%,同时AP提升了2.8%。实验结果表明,提出的网络在人群拥挤的密集场景中具有良好的检测效果。 展开更多
关键词 拥挤场景 行人检测 多尺度网络 互监督
下载PDF
面向自动驾驶测试场景生成的博弈神经网络算法
11
作者 李文礼 李超 +2 位作者 张祎楠 宋越 胡雄 《计算机工程与应用》 CSCD 北大核心 2024年第22期335-346,共12页
为提高自动驾驶车辆虚拟测试场景的可解释性和高风险场景覆盖度,提出了一种将博弈论与神经网络相结合的虚拟测试场景生成算法SIG-GAN(social interactive gaming-generative adversarial network)。以高速匝道合流场景为例,通过捕捉匝... 为提高自动驾驶车辆虚拟测试场景的可解释性和高风险场景覆盖度,提出了一种将博弈论与神经网络相结合的虚拟测试场景生成算法SIG-GAN(social interactive gaming-generative adversarial network)。以高速匝道合流场景为例,通过捕捉匝道汇入车辆与主车道行驶车辆的交互特征,构建汇入交互博弈模型。利用汇入数据获得车辆优先通行概率来计算博弈策略的纳什均衡求解,并融入S-GAN神经网络模型中进行轨迹生成。同时引入PICT(pairwise independent combinatorial testing)模型对观测区域交互车辆的真实轨迹进行组合测试,结合SIG-GAN算法生成大量具有现实博弈交互行为的高风险交互轨迹。通过与LSTM、S-LSTM、S-GAN等轨迹生成算法进行对比实验,结果显示:(1)模型较其他算法在3.2 s与4.8 s时域下,生成轨迹ADE平均下降25.30%、18.98%、7.02%,FDE平均下降17.33%、16.06%、7.65%,生成精度更为准确;(2)通过组合测试后生成轨迹数量为原始的150倍,覆盖度更高。生成轨迹与原轨迹的碰撞时间(time to collision,TTC)分别集中在1.0577 s、3.5135 s,场景风险程度更大,对自动驾驶汽车的虚拟场景强化测试具有实际意义。 展开更多
关键词 自动驾驶汽车 场景生成 博弈论 生成对抗网络
下载PDF
一种BIM家居场景模型纹理真实性还原方法
12
作者 杨亚龙 胡奇志 +1 位作者 苏亮亮 胡文瀚 《智能建筑电气技术》 2024年第1期1-5,共5页
针对现有的BIM建模软件与建模方法制作出的模型纹理材质过于单一且真实感不足,不能很好地满足不同用户的实际需求等问题,本文提出了一种BIM家居场景模型纹理真实性还原方法。首先,根据家居场景中常见家具种类建立图像数据集;其次,采用... 针对现有的BIM建模软件与建模方法制作出的模型纹理材质过于单一且真实感不足,不能很好地满足不同用户的实际需求等问题,本文提出了一种BIM家居场景模型纹理真实性还原方法。首先,根据家居场景中常见家具种类建立图像数据集;其次,采用神经网络算法获取到图像的纹理特征信息,得到相似的真实家具图像,并通过最小框图裁剪并合成对应的BIM家居场景中不同家具模型的材质贴图;最后反馈到建模软件实现BIM家居场景模型纹理真实性的还原。实验结果表明,经本文方法处理后的BIM家居场景模型能够较为真实的还原现实场景。 展开更多
关键词 BIM模型 纹理还原 神经网络 家居场景
下载PDF
基于动作条件交互的高效行人过街意图预测
13
作者 杨彪 韦智文 +3 位作者 倪蓉蓉 王海 蔡英凤 杨长春 《汽车工程》 EI CSCD 北大核心 2024年第1期29-38,共10页
城市化的进程不断加速,人车冲突问题已成为现代社会亟待解决的重大难题。复杂交通场景下,行人横穿马路行为导致交通事故频发,准确、实时地预测行人过街意图对避免人车冲突、提高驾驶安全系数和保障行人安全至关重要。本文提出基于动作... 城市化的进程不断加速,人车冲突问题已成为现代社会亟待解决的重大难题。复杂交通场景下,行人横穿马路行为导致交通事故频发,准确、实时地预测行人过街意图对避免人车冲突、提高驾驶安全系数和保障行人安全至关重要。本文提出基于动作条件交互的高效行人过街意图预测框架(efficient action-conditioned interaction pedestrian crossing intention anticipation framework,EAIPF)来预测行人过街意图。EAIPF引入行人动作编码模块增强多模态动作模式下的表征能力,挖掘深层骨架上下文信息。同时,引入场景对象交互模块挖掘与对象交互信息,理解交通场景中高级语义线索。最后,意图预测模块融合行人动作特征和对象交互特征,实现行人过街意图的鲁棒预测。所提出的方法在两个公共数据集JAAD和PIE上验证算法性能,准确率分别达到了89%和90%,表明本文方法可以在复杂交通场景下准确预测行人穿越意图。 展开更多
关键词 人车冲突 行人过街意图预测 图卷积网络 行人动作编码 场景理解
下载PDF
基于双层DCT-Mask特征融合算法的堆叠垃圾实例分割
14
作者 李利 梁晶 +1 位作者 陈旭东 潘红光 《科学技术与工程》 北大核心 2024年第26期11341-11348,共8页
复杂堆叠场景下的垃圾实例分割受到严重遮挡和高密集性特点的影响,具有更大的检测难度。针对该问题,提出了一种结合DCT-Mask和双层特征融合网络思想的实例分割方法,用于高度堆叠场景下的垃圾实例分割。在网络结构层面,首先在数据预处理... 复杂堆叠场景下的垃圾实例分割受到严重遮挡和高密集性特点的影响,具有更大的检测难度。针对该问题,提出了一种结合DCT-Mask和双层特征融合网络思想的实例分割方法,用于高度堆叠场景下的垃圾实例分割。在网络结构层面,首先在数据预处理环节对特征数据进行解耦,并通过双分支特征融合降低堆叠对遮挡物体特征的影响,从而解决复杂堆叠遮挡下的实例分割问题。针对该场景下的密集混淆问题,在候选框分类回归部分融入了级联分类器,并优化了分割网络分支的损失函数。实验采用堆叠垃圾分类实例分割数据集进行实验验证,实验结果表明,该方法的AP_(50)、平均准确率mAP等指标有较大提升,且具有较好的分割效果和一定的可解释性。 展开更多
关键词 复杂堆叠遮挡场景 垃圾分类 双层特征融合网络 多级联检测器 损失函数优化
下载PDF
基于改进DeepLabV3+的丘陵田间道路图像分割方法研究 被引量:1
15
作者 李法霖 石军锋 +3 位作者 梁新成 李云伍 刘鹏 陈欣 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第8期172-183,共12页
为解决丘陵地区智能农机装备因道路狭窄、路况复杂导致道路信息提取精度低和推理速度慢等问题,以丘陵田间道路作为研究对象制作数据集,提出一种基于改进DeepLabV3+的丘陵田间道路图像分割方法.首先在编码器模块中使用轻量化的主干网络G_... 为解决丘陵地区智能农机装备因道路狭窄、路况复杂导致道路信息提取精度低和推理速度慢等问题,以丘陵田间道路作为研究对象制作数据集,提出一种基于改进DeepLabV3+的丘陵田间道路图像分割方法.首先在编码器模块中使用轻量化的主干网络G_Ghost_RegNetX_4.0GF提取图像特征,保证精度并减小模型参数数量.再采用轻量级的空洞空间金字塔池化模块,将不同尺度特征融合.试验结果表明,改进模型的平均交并比和推理速度分别为87.6%及116.08 f/s,与当前主流图像分割网络FCN、DeepLabV3及PSPNet相比,MIoU分别提升了0.8%,2.2%,1%,推理速度分别为对比网络的1.33,1.83,1.76倍.所提模型的参数总量为14.41×10^(6),浮点计算量为49.34×10^(9),模型参数及计算量大幅减小.改进后的算法具有较高的检测精度和推理速度,有利于解决智能农机装备在丘陵田间道路上行驶的自主导航问题. 展开更多
关键词 丘陵道路 机器视觉 场景识别 语义分割 神经网络
下载PDF
基于深度迁移学习的复杂机场场景飞机目标检测方法 被引量:1
16
作者 钟聃 李铁虎 李诚 《光子学报》 EI CAS CSCD 北大核心 2024年第4期221-231,共11页
提出了一种改进的深度学习模型,旨在解决检测问题。首先基于迁移学习,微调预训练模型,提高了模型在有限的飞机数据集中的特征提取能力。其次,融入调整模块以增加深层特征图的感受野,提升模型的鲁棒性。引入特征金字塔网络,融合不同尺度... 提出了一种改进的深度学习模型,旨在解决检测问题。首先基于迁移学习,微调预训练模型,提高了模型在有限的飞机数据集中的特征提取能力。其次,融入调整模块以增加深层特征图的感受野,提升模型的鲁棒性。引入特征金字塔网络,融合不同尺度的特征信息,进一步增强多尺度特征提取能力。最后,优化了检测头,融合轻量化的分类和回归并行分支,平衡了目标检测的准确性和实时性。构建了易于拓展的Aeroplane数据集,并对所提方法进行了实验验证。结果表明,所提模型在单架飞机、相互遮挡的飞机和小飞机的检测中平均精度分别提高了4.9%、4.0%和4.4%。所提方法在不同环境下表现优于其他经典方法,包括各类遮挡和夜间、雾天等复杂场景,具有良好的场景鲁棒性。 展开更多
关键词 深度学习 飞机目标检测 迁移学习 机场场面 特征金字塔网络
下载PDF
基于区域间场景等值的配电网随机潮流加速算法
17
作者 李军徽 赵寒杰 +2 位作者 朱星旭 郭琦 李翠萍 《电工技术学报》 EI CSCD 北大核心 2024年第7期1957-1970,共14页
针对配电网随机潮流算法中需要对节点功率注入进行大量模拟所引起的计算效率低的问题,提出一种基于区域间场景等值的配电网随机潮流加速算法。首先,从配电网的拓扑连接规律出发,将各区域内节点功率注入对其他区域潮流的影响转换为对边... 针对配电网随机潮流算法中需要对节点功率注入进行大量模拟所引起的计算效率低的问题,提出一种基于区域间场景等值的配电网随机潮流加速算法。首先,从配电网的拓扑连接规律出发,将各区域内节点功率注入对其他区域潮流的影响转换为对边界量的影响,并由此建立了基于边界量的多区域潮流模型;其次,提出一种区域间场景等值方法,快速等值引起其他区域相同潮流变化的功率注入场景;再次,设计了一种随机潮流的分布式求解算法,在求解过程中各区域通过交换边界等值场景集并结合局部功率注入信息重新构造潮流方程,分布式地求解各区域内的随机潮流;最后,通过IEEE 118节点测试系统进行算例分析,验证了所提方法的准确性,且该方法能够显著提高计算效率。 展开更多
关键词 配电网 场景等值 分布式光伏 随机潮流
下载PDF
复杂场景下自适应注意力机制融合实时语义分割
18
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
下载PDF
融合动态场景感知和注意力机制的声学回声消除算法
19
作者 许春冬 黄乔月 +1 位作者 王磊 徐锦武 《信号处理》 CSCD 北大核心 2024年第2期396-405,共10页
在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统... 在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统回声消除系统存在去回声效果不明显、存在非线性回声残留以及无法实时处理回声等问题。因此,为解决上述存在问题,提出了一种动态场景感知模块(Dynamic scene perception module,DSPM)和全局注意力机制(Global attention mechanism,GAM)相结合的声学回声消除算法。该算法以卷积循环网络(Convolutional recurrent network,CRN)作为基线模型,提取语音信号的序列特征;首先,在其编码器中引入DSPM模块替换原因果卷积,根据场景动态分配卷积内核数量,加强模型的自适应性;其次,在编码器最后两层中分别引入GAM模块,放大空间通道间关系以及统筹全局交互,提升对语音信号特征的提取能力以及消除回声的性能;最后,通过将MSE损失函数和HuberLoss损失函数线性相加生成一种新的损失函数——MSE-HuberLoss,进一步提高模型的鲁棒性。实验结果表明,提出的GAM-DSPM-CRN模型的回声消除性能优秀,且获得较基线模型更加清晰的重构语音信号;在双端通话环境下,提出的GAM-DSPM-CRN模型声学回声消除算法较其他对比算法性能有较大提升;在Microsoft AEC Challenges数据集上,MOS、ERLE和STOI的得分分别达到了4.09、57.43和0.78。 展开更多
关键词 声学回声消除 动态场景感知模块 全局注意力机制 卷积循环网络 联合损失函数
下载PDF
基于生成对抗网络的维语场景文字修改网络
20
作者 付鸿林 张太红 +2 位作者 杨雅婷 艾孜麦提·艾瓦尼尔 马博 《计算机与现代化》 2024年第1期41-46,共6页
通过对维语的场景文字检测与识别研究发现,人工采集标注自然场景文字图像是耗时耗力的,因此人工合成的数据是作为训练数据的主要来源。为获得更加真实的数据,本文提出一种基于生成对抗网络的维语场景文字修改网络,利用高效的Transforme... 通过对维语的场景文字检测与识别研究发现,人工采集标注自然场景文字图像是耗时耗力的,因此人工合成的数据是作为训练数据的主要来源。为获得更加真实的数据,本文提出一种基于生成对抗网络的维语场景文字修改网络,利用高效的Transformer模块构建网络,充分提取图像全局与局部特征来完成维语场景文字图像修改,并添加微调模块,对最终结果进行微调。采用WGAN思想策略训练模型,可有效应对模型崩溃以及梯度爆炸等问题。通过在英文-英文,英文-维文的文字修改实验来验证模型的泛化能力和鲁棒性,无论在客观评价指标(SSIM、PSNR)还是视觉上均取得不错效果,并在真实场景数据集SVT以及ICDAR 2013上进行了验证。 展开更多
关键词 生成对抗网络 场景文字修改 维语场景文字图像 高效Transformer WGAN
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部