针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在...针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在网络结构中引入通道自适应感受野模块和RepVGG模块,采用FC模块(concatenate with convolutions)过滤冗余特征,强化模型的特征提取能力;采用Alpha-CIOU损失和知识蒸馏优化训练,提高算法的检测能力。在Pascal VOC和MS COCO数据集上的实验结果表明,该算法在尺度变化、精度和速度等方面取得了优秀的性能。展开更多
为解决全景视频传输中存在的视频卡顿多、用户体验质量(quality of experience,QoE)低等问题,研究当前主流的视点自适应传输方案,提出一种基于视点预测的码率自适应策略(VPBAS)。首先,构建了一种基于长短期记忆网络和全卷积网络的视点...为解决全景视频传输中存在的视频卡顿多、用户体验质量(quality of experience,QoE)低等问题,研究当前主流的视点自适应传输方案,提出一种基于视点预测的码率自适应策略(VPBAS)。首先,构建了一种基于长短期记忆网络和全卷积网络的视点预测模型,模型将视点数据和视频显著性信息进行特征融合,实现不同模态数据的相互补充和修正,提高视点预测的准确率;然后,客户端采用随机森林算法预测当前的可用带宽,并根据视点预测结果和可用带宽信息为视频分块选择码率;最后,客户端把选择的码率信息定期发送给服务器,服务器根据反馈的信息向客户端推送最佳码率的全景视频流,这种交互过程在视频播放期间不断地重复,直至客户端观看完毕。实验结果表明,与现有传输方案相比,VPBAS能有效提高带宽受限情况下的视频观看体验。展开更多
针对现有的码率自适应(adaptive bitrate,ABR)算法存在控制规则简单,不能有效提升用户体验质量(quality of experience,QoE),提出一种基于元学习的LABR(reinforcement learning based ABR)算法。采用策略梯度训练策略网络,利用元学习(me...针对现有的码率自适应(adaptive bitrate,ABR)算法存在控制规则简单,不能有效提升用户体验质量(quality of experience,QoE),提出一种基于元学习的LABR(reinforcement learning based ABR)算法。采用策略梯度训练策略网络,利用元学习(meta-learning)方法学习基线(baseline)函数来减少因网络吞吐量差异产生的方差,进一步提高模型的准确性和鲁棒性;通过在策略函数中加入熵损失方法提高累计期望奖励值。实验结果表明,LABR算法具有泛化性与鲁棒性,能有效提高用户的视频体验质量。展开更多
在对等网上利用多路径分发视频是一种重要的机制,虽然在一对节点之间找出符合条件的多条路径并不困难,但发送端如何从可用路径集中选出一个最优路径子集,并为其最优地分配发送速率和数据仍是一个难题。为此提出一种基于多路径的最优数...在对等网上利用多路径分发视频是一种重要的机制,虽然在一对节点之间找出符合条件的多条路径并不困难,但发送端如何从可用路径集中选出一个最优路径子集,并为其最优地分配发送速率和数据仍是一个难题。为此提出一种基于多路径的最优数据分配算法(Optimal data allocation algorithm based on multiple path,ODAABMP)。首先应用数学规划理论建立最优数据分配模型,然后基于模型给出ODAABMP,并对ODAABMP输出解的最优性给出证明,最后通过实验验证了算法的有效性。展开更多
文摘针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在网络结构中引入通道自适应感受野模块和RepVGG模块,采用FC模块(concatenate with convolutions)过滤冗余特征,强化模型的特征提取能力;采用Alpha-CIOU损失和知识蒸馏优化训练,提高算法的检测能力。在Pascal VOC和MS COCO数据集上的实验结果表明,该算法在尺度变化、精度和速度等方面取得了优秀的性能。
文摘为解决全景视频传输中存在的视频卡顿多、用户体验质量(quality of experience,QoE)低等问题,研究当前主流的视点自适应传输方案,提出一种基于视点预测的码率自适应策略(VPBAS)。首先,构建了一种基于长短期记忆网络和全卷积网络的视点预测模型,模型将视点数据和视频显著性信息进行特征融合,实现不同模态数据的相互补充和修正,提高视点预测的准确率;然后,客户端采用随机森林算法预测当前的可用带宽,并根据视点预测结果和可用带宽信息为视频分块选择码率;最后,客户端把选择的码率信息定期发送给服务器,服务器根据反馈的信息向客户端推送最佳码率的全景视频流,这种交互过程在视频播放期间不断地重复,直至客户端观看完毕。实验结果表明,与现有传输方案相比,VPBAS能有效提高带宽受限情况下的视频观看体验。
文摘针对现有的码率自适应(adaptive bitrate,ABR)算法存在控制规则简单,不能有效提升用户体验质量(quality of experience,QoE),提出一种基于元学习的LABR(reinforcement learning based ABR)算法。采用策略梯度训练策略网络,利用元学习(meta-learning)方法学习基线(baseline)函数来减少因网络吞吐量差异产生的方差,进一步提高模型的准确性和鲁棒性;通过在策略函数中加入熵损失方法提高累计期望奖励值。实验结果表明,LABR算法具有泛化性与鲁棒性,能有效提高用户的视频体验质量。
文摘在对等网上利用多路径分发视频是一种重要的机制,虽然在一对节点之间找出符合条件的多条路径并不困难,但发送端如何从可用路径集中选出一个最优路径子集,并为其最优地分配发送速率和数据仍是一个难题。为此提出一种基于多路径的最优数据分配算法(Optimal data allocation algorithm based on multiple path,ODAABMP)。首先应用数学规划理论建立最优数据分配模型,然后基于模型给出ODAABMP,并对ODAABMP输出解的最优性给出证明,最后通过实验验证了算法的有效性。