针对基于深度学习的苗族服饰图像语义分割模型存在提取过程中服饰掩码拟合质量不高的问题,文章提出一种基于渐进式注意力学习的多尺度深度学习金字塔模型(Multi-scale Deep learning pyramidal network of progressive attentional lear...针对基于深度学习的苗族服饰图像语义分割模型存在提取过程中服饰掩码拟合质量不高的问题,文章提出一种基于渐进式注意力学习的多尺度深度学习金字塔模型(Multi-scale Deep learning pyramidal network of progressive attentional learning,MultiDeepPPL)分割苗族服饰。首先,设计了一种密集跨级连接网络,充分利用多尺度方式提取特征的特性,融合不同尺度特征;然后,嵌入了一种渐进式注意力学习金字塔结构,从不同的特征图中迁移相似性与跨尺度相似性,并采用空域注意力和3D卷积对前述特征进行融合。实验结果表明,所提模型在苗族服饰数据集上平均交并比(Mean Intersection over Union,MIoU)达到0.873,类别平均像素准确率(Pixel Accuracy,MPA)达到0.943,Dice相似系数达到0.912,召回率(Recall)达到0.8951。上述评估指标结果表明,文章所提方法明显优于当前其他语义分割算法,为少数民族文化的研究提供了一种有效可行的方法。展开更多
为使题注生成模型生成流畅、连贯和信息丰富的特定信息题注,在Transformer架构的基础上提出了Transformer Chart to Text(TransChartText)模型。通过筛选各种科研论文和新闻文章网站,制作了基于图表的题注描述数据集,该数据集的英语题...为使题注生成模型生成流畅、连贯和信息丰富的特定信息题注,在Transformer架构的基础上提出了Transformer Chart to Text(TransChartText)模型。通过筛选各种科研论文和新闻文章网站,制作了基于图表的题注描述数据集,该数据集的英语题注描述涵盖了丰富的数据类别和逻辑推理。引入数据变量替换图表数据值,有效提高了模型生成题注的内容选择,促使模型生成了连贯的题注内容。为进一步增强模型学习词与词之间位置关系的能力并降低错误词序频率,模型分别对编码器和解码器引入空间位置嵌入编码和集束搜索算法。实验结果表明,TransChartText模型在内容选择(CS)、内容排序(CO)、ROUGE、BLEU指标上取得了更好的分数,生成了高质量的基于图表的英语题注。展开更多
文摘针对基于深度学习的苗族服饰图像语义分割模型存在提取过程中服饰掩码拟合质量不高的问题,文章提出一种基于渐进式注意力学习的多尺度深度学习金字塔模型(Multi-scale Deep learning pyramidal network of progressive attentional learning,MultiDeepPPL)分割苗族服饰。首先,设计了一种密集跨级连接网络,充分利用多尺度方式提取特征的特性,融合不同尺度特征;然后,嵌入了一种渐进式注意力学习金字塔结构,从不同的特征图中迁移相似性与跨尺度相似性,并采用空域注意力和3D卷积对前述特征进行融合。实验结果表明,所提模型在苗族服饰数据集上平均交并比(Mean Intersection over Union,MIoU)达到0.873,类别平均像素准确率(Pixel Accuracy,MPA)达到0.943,Dice相似系数达到0.912,召回率(Recall)达到0.8951。上述评估指标结果表明,文章所提方法明显优于当前其他语义分割算法,为少数民族文化的研究提供了一种有效可行的方法。
文摘为使题注生成模型生成流畅、连贯和信息丰富的特定信息题注,在Transformer架构的基础上提出了Transformer Chart to Text(TransChartText)模型。通过筛选各种科研论文和新闻文章网站,制作了基于图表的题注描述数据集,该数据集的英语题注描述涵盖了丰富的数据类别和逻辑推理。引入数据变量替换图表数据值,有效提高了模型生成题注的内容选择,促使模型生成了连贯的题注内容。为进一步增强模型学习词与词之间位置关系的能力并降低错误词序频率,模型分别对编码器和解码器引入空间位置嵌入编码和集束搜索算法。实验结果表明,TransChartText模型在内容选择(CS)、内容排序(CO)、ROUGE、BLEU指标上取得了更好的分数,生成了高质量的基于图表的英语题注。