交互式数据探索综述被引量：3

Survey on Interactive Data Exploration

下载PDF

导出

摘要大规模数据集已经超过TB和PB级,现有的技术可以收集和存储大量的信息。虽然数据库管理系统一直在不断提高提供复杂的多种数据管理的能力,但是管理查询工具并不能满足大数据的需求,如何精准理解和探索这些大规模数据集仍然是一个巨大的挑战。交互式数据探索(interactive data exploration,IDE)的关注点是强调交互、探索和发现,能让用户从海量的数据中用最小的代价更精确地找到他们需要的信息。首先对交互式数据探索及其应用背景进行了介绍,总结了通用的探索模型和IDE的特点,分析了交互式数据探索中的查询推荐技术和查询结果优化技术的现状;随后分别对IDE原型系统进行了分析和比较;最后给出了关于交互式数据探索技术的总结和展望。 Large data sets have exceeded the scale of terabytes and petabytes,and existing techniques can collect andstore massive information.While database management systems have been constantly improved to offer a variety ofcomplex data management capabilities,but the query tools cannot satisfy the needs of large data,so how to preciselyunderstand and explore the massive data set remains a huge challenge.The focus of interactive data exploration(IDE)is to emphasize interaction,exploration and discovery.Users will accurately find the information they need with theminimum cost in the vast amounts of data.Firstly,this paper introduces the IDE and its application background,summarizesthe general model and features of IDE,and analyzes the present situation of the query technology and the optimizationtechniques for query results.Furthermore,this paper analyzes and compares IDE prototype systems respectively.Finally,this paper summarizes and forecasts the techniques of IDE.

作者王蒙湘李芳芳谷峪于戈 WANG Mengxiang;LI fangfang;GU Yu;YU Ge(Department of Computer Science, College of Computer Science and Engineering, Northeastern University, Shenyang 110819, China)

机构地区东北大学计算机科学与工程学院计算机科学系

出处《计算机科学与探索》 CSCD 北大核心 2017年第2期171-184,共14页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金No.61272180 中央高校基本科研业务费专项资金No.N161604005~~

关键词交互式数据探索查询推荐查询结果优化用户反馈机器学习 interactive data exploration query recommendation optimization for query results user feedback machine learning

分类号 TP315 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
2孟宪福,陈莉.基于贝叶斯理论的协同过滤推荐算法[J].计算机应用,2009,29(10):2733-2735. 被引量：12
3赵永梅,任大勇,张红梅,拓明福.用动态贝叶斯网络构建协同过滤推荐的新方法[J].科学技术与工程,2011,11(9):2012-2016. 被引量：2
4李慧,胡云,李存华,王霞.基于近邻关系的个性化推荐算法研究[J].计算机工程与应用,2012,48(36):205-209. 被引量：5
5许海玲,吴潇,李晓东,阎保平.互联网推荐系统比较研究[J].软件学报,2009,20(2):350-362. 被引量：542
6艾磊,赵辉.基于知识的推荐系统用户交互模型研究[J].软件导刊,2015,14(3):15-17. 被引量：10
7谭红叶,要一璐,梁颖红.基于知识脉络的科技论文推荐[J].山东大学学报（理学版）,2016,51(5):94-101. 被引量：13
8马建威,陈洪辉,STEPHAN Reiff-Marganiec.基于混合推荐和隐马尔科夫模型的服务推荐方法[J].中南大学学报（自然科学版）,2016,47(1):82-90. 被引量：6
9李程,曹菡,师军.基于MapReduce的混合推荐算法及应用[J].计算机技术与发展,2016,26(4):74-77. 被引量：1

二级参考文献167

1邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
2王霞,刘琴.协同过滤在推荐系统中的应用研究[J].计算机系统应用,2005,14(4):24-27. 被引量：18
3席运江,党延忠.基于知识网络的专家领域知识发现及表示方法[J].系统工程,2005,23(8):110-115. 被引量：59
4张巍,刘鲁,葛健.一种基于粗集的协同过滤算法[J].小型微型计算机系统,2005,26(11):1971-1974. 被引量：11
5张锋,常会友.使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J].计算机研究与发展,2006,43(4):667-672. 被引量：85
6游文,叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展,2006,16(9):70-72. 被引量：54
7张自立,刘惟一.基于动态贝叶斯网的状态预测[J].云南大学学报（自然科学版）,2007,29(1):35-39. 被引量：4
8徐秀华,王亚杰,乔敏东.基于有限状态机的界面流描述与设计[J].计算机工程与设计,2007,28(6):1255-1256. 被引量：4
9邢春晓,高凤荣,战思南,周立柱.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-301. 被引量：148
10刘平峰,聂规划,陈冬林.基于知识的电子商务智能推荐系统平台设计[J].计算机工程与应用,2007,43(19):199-201. 被引量：19

共引文献711

1陈晋鹏,李海洋,张帆,李环,魏凯敏.基于会话的推荐方法综述[J].中文信息学报,2023,37(3):1-17. 被引量：4
2黄梅银,易兰丽,王理达.政务服务中的智能推送:需求、应用模式和实现路径[J].电子政务,2020,0(2):11-20. 被引量：9
3冼卓铭.算法推荐下短视频平台版权注意义务司法认定争议与优化[J].东南大学学报（哲学社会科学版）,2024,26(S01):106-111.
4丁一楠.基于数据驱动的消费者决策预测研究[J].广东经济,2017,0(9X):62-62.
5高为民.蚁群算法在协同过滤推荐系统中的应用研究[J].微计算机信息,2008,24(9):268-270. 被引量：3
6杨博,赵鹏飞.推荐算法综述[J].山西大学学报（自然科学版）,2011,34(3):337-350. 被引量：87
7宋雅婷,徐天伟.基于用户兴趣的个性化推荐技术综述[J].云南大学学报（自然科学版）,2012,34(S1):20-23. 被引量：6
8高旻,吴中福.基于个性化情境和项目的协同推荐研究[J].东南大学学报（自然科学版）,2009,39(S1):27-31. 被引量：8
9王树西,李安渝.基于购物倾向的商品推荐方案研究[J].集成技术,2013,2(3):15-21.
10欧立奇,陈莉,马煜.协同过滤算法中新项目推荐方法的研究[J].微计算机信息,2005,21(11X):186-187. 被引量：10

同被引文献4

1蔡焰.Oracle 10g HWM原理及性能优化[J].微型机与应用,2013,32(8):1-3. 被引量：2
2程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(9):1889-1908. 被引量：740
3谢娟英,谢维信.基于特征子集区分度与支持向量机的特征选择算法[J].计算机学报,2014,37(8):1704-1718. 被引量：64
4黄岚,孙珂,陈晓竹,周敏奇.内存集群计算:交互式数据分析[J].华东师范大学学报（自然科学版）,2014(5):216-227. 被引量：4

引证文献3

1田彬.Oracle中查询优化技术的应用[J].电子技术与软件工程,2018(6):210-211.
2王蒙湘,李芳芳,于戈.交互式数据探索框架的特征自适应技术[J].东北大学学报（自然科学版）,2018,39(12):1685-1690. 被引量：2
3袁喆,文继荣,魏哲巍,刘家俊,姚斌,郑凯.大数据实时交互式分析[J].软件学报,2020,31(1):162-182. 被引量：16

二级引证文献18

1谢菁,陆冰芳.基于全链路的交互式数据探索技术研究[J].中国管理信息化,2020,23(2):150-151. 被引量：3
2赵思思,王碧华,水冰洁.大数据实时交互式分析研究[J].数码设计,2020,9(11):51-51.
3李森彪.基于演化博弈的企业信用大数据共享研究[J].新经济,2020(10):33-39. 被引量：1
4刘振宇,宋晓莹.一种可用于分类型属性数据的多变量决策树算法[J].东北大学学报（自然科学版）,2020,41(11):1521-1527. 被引量：17
5宋文强.基于大数据分析的数据分区和采样方法研究[J].数码设计,2020,9(16):45-45.
6白健,董贵山,安红章,廖思捷.基于区块链的数据共享解决方案[J].信息安全与通信保密,2021(1):21-31. 被引量：10
7彭浩宇,周军海,张峻宇,张舜宇,徐静茹.基于大数据的水资源管理系统设计与研究[J].软件工程,2022,25(3):59-62. 被引量：3
8王逸兮,廖荣涛,叶宇轩.基于中台架构的内生性数据安全交互系统设计[J].电子设计工程,2022,30(12):153-157. 被引量：4
9曾小松,张路.基于特定场景的大数据实时分析平台的设计与实现[J].信息技术与标准化,2022(7):22-27. 被引量：1
10赵颖,秀昱宏,唐涛,文陈飞宇,陈晓慧,尤旸,周芳芳.一种非完全的散点图去重叠算法[J].软件学报,2023,34(2):945-963.

1多媒体·终端[J].电视技术,2016,40(2):150-150.
2潘尚仕.当数据可视化遇上轻应用[J].美术教育研究,2016,0(17):84-85.
3杜小勇,陈峻,陈跃国.大数据探索式搜索研究[J].通信学报,2015,36(12):77-88. 被引量：9
4杜小勇,陈跃国.大数据的价值发现方法[J].大数据,2017,3(2):19-25. 被引量：3
5陈策.DBMS的交互式数据编辑方法[J].计算机工程,1990,5(3):72-72.
6洪跃.用Flash MX和ASP实现图书馆多媒体资源的交互式数据检索[J].现代图书情报技术,2004(3):38-39. 被引量：3
7黄长军,胡丽敏,周新地,宋福林.IDL与Matlab的比较分析[J].重庆科技学院学报（自然科学版）,2008,10(3):140-143. 被引量：1
8傅啸天.IDL介绍及PCA变换算法的实现[J].新校园（中旬刊）,2012(5):12-12.
9黄才生,贺杰.浅析数据挖掘及其应用[J].数字石油和化工,2006(10):2-6. 被引量：1
10马秀莉,胡海峰,李双峰,肖红梅,罗琼,杨冬青,唐世渭.DHC:Distributed,Hierarchical Clustering in Sensor Networks[J].Journal of Computer Science & Technology,2011,26(4):643-662.

计算机科学与探索

2017年第2期

浏览历史

内容加载中请稍等...

交互式数据探索综述被引量：3

参考文献9

二级参考文献167

共引文献711

同被引文献4

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

交互式数据探索综述 被引量：3

参考文献9

二级参考文献167

共引文献711

同被引文献4

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

交互式数据探索综述被引量：3