-
题名基于属性权值多级分类的测试样本数据预处理
被引量:4
- 1
-
-
作者
张建春
李勃
董蓉
-
机构
南京大学通信实验室
南通大学电子信息学院
-
出处
《电视技术》
北大核心
2017年第3期76-80,共5页
-
基金
国家自然科学基金项目(61401239)
-
文摘
针对算法测试在工业生产实际操作应用中,经常面临样本数据迅速大量增加,测试执行时间过长、测试效率低下、算法改进周期过长的问题。文章提出一种精简测试样本的算法,快速实时处理新增样本,去除冗余数据。首先对新增的样本数据按照分类阈值分配到各子数据集中,然后在每一个子数据集中根据数据的重要程度属性计算相似度值,为减少计算量,先对子数据集进行排序处理,最后根据相似性的阈值判断去除冗余数据。实验利用所得样本库不断对算法进行回归测试,分析表明算法的测试效率及测试充分性都有明显提升,并提高了算法在工业生产实际应用过程中的稳定性和适应性,有力的保证了算法的质量。
-
关键词
数据分类
数据去重
样本增量处理
算法稳定性测试
-
Keywords
data classification
remove redundancy
incremental sample processing
algorithm stability test
-
分类号
TN391.1
[电子电信—物理电子学]
-
-
题名基于特征提取及聚类算法的增量图片筛选系统
被引量:1
- 2
-
-
作者
周子杰
李勃
董蓉
-
机构
南京大学电子科学与工程学院
南通大学电子信息学院
-
出处
《电视技术》
北大核心
2017年第9期189-193,共5页
-
基金
国家自然科学基金项目(61401239)
-
文摘
在工业生产过程中,由于需要频繁对产品进行拍照,所以会产生大量测试图片,而因为产品的外形等比较相近,因此样本图片比较相似,由此造成重复测试和测试时间过长等问题。提出一种对图片进行分类并精简数量的方法,来实现减少检测图片数量,缩短测试时间的目的。系统首先对样本图片进行特征提取,然后对特征进行降维,并对结果进行聚类来得到多个图片库,最后对图片库内的图片进行筛选,得到最终的样本库。实验对不同特征提取方法进行对比,最终从结果精度及处理时间上考虑,采取了FAST特征提取算法,有力保证了算法的质量。
-
关键词
图片特征提取
数据分类
数据筛选
增量样本分类
增量样本筛选
算法稳定性测试
-
Keywords
Image feature extraction
data classification
Data filtering
Incremental sample classification
Incremental sample fil-tering
Algorithm stability test
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-