-
题名反向梯度深度学习下重复网络数据标注仿真
- 1
-
-
作者
庞家乐
张彦
-
机构
北京交通大学
-
出处
《计算机仿真》
北大核心
2022年第10期467-470,485,共5页
-
文摘
不及时标注合处理网络数据中的重复数据,会影响用户使用与操作体验。现有的重复数据标注方法无法排列比较数据记录间的属性,导致重复数据标注不准确。为此提出新的重复数据标注方法。通过综合加权法计算数据库中所有数据的属性权重值,重新定义每个数据字符串间距离,得到数据间相似度值,并设定标记值。引入反向梯度学习算法,排列比较数据记录间的属性。给定每个数据唯一ID编号,构建专属的属性值记录表,通过与选定的数值比较,确定数据间是否存在重复情况。若存在重复数据,利用三区分快速算法直接标注对应的数据。对比实验结果表明所提方法耗时最短,实现重复数据高精准度的检测与标注。
-
关键词
反向梯度深度学习
重复数据标注
相似度值
属性值记录表
三区分快速算法
-
Keywords
Reverse gradient deep learning
Duplicate data annotation
Similarity value
Log sheet of attribute value
Fast three-discrimination algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-