期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
支持多维度数据去重的交互式可视分析方法
被引量:
10
1
作者
朱海洋
钱中昊
+4 位作者
严凡
毛科添
应昊键
王杰
陈为
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022年第6期841-851,共11页
多维度数据中的重复数据会严重影响数据的挖掘、分析与应用.针对传统的数据去重方法的成本、效率和便捷性无法满足大数据分析需求的问题,提出一种数据去重的交互式可视分析方法.该方法将多维度数据通过表示学习提取高维特征向量;使用降...
多维度数据中的重复数据会严重影响数据的挖掘、分析与应用.针对传统的数据去重方法的成本、效率和便捷性无法满足大数据分析需求的问题,提出一种数据去重的交互式可视分析方法.该方法将多维度数据通过表示学习提取高维特征向量;使用降维算法将其降至二维散点图;采用无监督聚类算法进行分析;支持用户交互式地调整算法模型及参数,逐步筛选确认重复数据并执行去重操作.对某大型供应链集成服务集团公司数据集进行分析、实验和用户调研,结果表明该方法能有效地处理主流数据清洗软件Trifacta Wrangler和OpenRefine难以发现的复杂数据重复问题,并且效率是它们的2倍以上,在学习难度和使用便捷性等方面也具有明显优势.
展开更多
关键词
数据治理
数据清洗
数据去重
多维度数据
可视化分析方法
下载PDF
职称材料
题名
支持多维度数据去重的交互式可视分析方法
被引量:
10
1
作者
朱海洋
钱中昊
严凡
毛科添
应昊键
王杰
陈为
机构
浙江大学CAD&CG国家重点实验室
物产中大集团股份有限公司
人工智能省部共建协同创新中心(浙江大学)
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022年第6期841-851,共11页
基金
国家自然科学基金(62132017,61972122)
浙江省“万人计划”特殊支持经费(ZJWR0208032).
文摘
多维度数据中的重复数据会严重影响数据的挖掘、分析与应用.针对传统的数据去重方法的成本、效率和便捷性无法满足大数据分析需求的问题,提出一种数据去重的交互式可视分析方法.该方法将多维度数据通过表示学习提取高维特征向量;使用降维算法将其降至二维散点图;采用无监督聚类算法进行分析;支持用户交互式地调整算法模型及参数,逐步筛选确认重复数据并执行去重操作.对某大型供应链集成服务集团公司数据集进行分析、实验和用户调研,结果表明该方法能有效地处理主流数据清洗软件Trifacta Wrangler和OpenRefine难以发现的复杂数据重复问题,并且效率是它们的2倍以上,在学习难度和使用便捷性等方面也具有明显优势.
关键词
数据治理
数据清洗
数据去重
多维度数据
可视化分析方法
Keywords
data governance
data cleaning
data deduplication
multi-dimensional data
visual analysis method
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
支持多维度数据去重的交互式可视分析方法
朱海洋
钱中昊
严凡
毛科添
应昊键
王杰
陈为
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022
10
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部