-
题名基于子空间聚类的高维数据可视分析方法综述
被引量:8
- 1
-
-
作者
田帅
陈谊
-
机构
北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第13期19-26,共8页
-
基金
"十二五"国家科技支撑计划(No.2012BAD29B01-2)
国家科技基础性工作专项(No.2015FY111200)
+2 种基金
北京市科技计划课题(No.Z151100001615041)
虚拟现实技术与系统国家重点实验室开放基金(No.BUAA-VR-17KF-07)
2018年研究生科研能力提升计划项目
-
文摘
随着信息技术的飞速发展和大数据时代的来临,数据呈现出高维性、非线性等复杂特征。对于高维数据来说,在全维空间上往往很难找到反映分布模式的特征区域,而大多数传统聚类算法仅对低维数据具有良好的扩展性。因此,传统聚类算法在处理高维数据的时候,产生的聚类结果可能无法满足现阶段的需求。而子空间聚类算法搜索存在于高维数据子空间中的簇,将数据的原始特征空间分为不同的特征子集,减少不相关特征的影响,保留原数据中的主要特征。通过子空间聚类方法可以发现高维数据中不易展现的信息,并通过可视化技术展现数据属性和维度的内在结构,为高维数据可视分析提供了有效手段。总结了近年来基于子空间聚类的高维数据可视分析方法研究进展,从基于特征选择、基于子空间探索、基于子空间聚类的3种不同方法进行阐述,并对其交互分析方法和应用进行分析,同时对高维数据可视分析方法的未来发展趋势进行了展望。
-
关键词
高维数据
可视分析
子空间探索
子空间聚类
-
Keywords
high dimensional data
visual analysis
subspace exploration
subspace clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向签到日志的用户行为模式交互探索
被引量:2
- 2
-
-
作者
李丛敏
李杰
张康
陶文源
-
机构
天津大学智能与计算学部
The University of Texas at Dallas Computer Science Department
-
出处
《软件学报》
EI
CSCD
北大核心
2019年第6期1819-1834,共16页
-
基金
国家自然科学基金(61602340,61572348)
国家重点研发计划(2018YFC0831700,2018YFC0809800)~~
-
文摘
签到日志记录了用户对于某类设施的使用情况,从中发现用户行为模式,在很多领域如精确广告投放、犯罪团伙发现等方面都具有非常广泛的应用价值.但是,发现过程却较为困难,主要因为:(1)日志数据体现为长时间序列且含有噪声,导致数据在高维空间分布较为稀疏,影响模式提取的准确性;(2)行为模式往往与不同的时间尺度相关;(3)多样的参数选择空间以及数据处理方式使得传统的机器学习方法很难获得可信且易于理解的行为分析结果.提出一种面向签到日志的用户行为模式交互探索的方法,该过程采用动态子空间策略,动态改变用于分析相似行为模式的时间片,从而减少人为设定参数对于分析结果的影响.方法集成了一个可视分析工具以支持该过程,利用该工具,分析人员可以实时了解方法每一步发现的模式,及时调整分析过程、直观理解和验证分析结论.包含了一个基于真实数据集的案例分析和一个来自不同领域专家的评审,其结果验证了方法的有效性.
-
关键词
签到数据
群体行为模式
子空间探索
可视分析
交互探索
-
Keywords
check-in data
group behavior pattern
subspace exploration
visual analytics
interactive exploration
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-