基于相似度的多数据库分类

下载PDF

导出

摘要许多大型组织拥有大量的子公司,进行事务处理时会产生大量的多源数据库,然而现有的数据挖掘只致力于对单个数据库的挖掘,由此,提出了多数据库挖掘技术。为了减少寻找相关数据的检索代价,在对多数据库进行挖掘和分析之前,首先要对多数据库进行分类。由于多数据库中包含大量数据,现有的分类算法Greedy Class的时间复杂度可达到O(m4),所需代价非常大。由此提出了Identify Completeclass算法用于对多数据库分类,其时间复杂度降为O(m3),并提出了相应的寻找最优完全分类算法Identify Best Classification,实验证明改进后的算法有较高的运行效率。

作者李园园张绿云

机构地区南华大学附属第一医院信息科河池学院计算机与信息工程学院

出处《计算机光盘软件与应用》 2014年第23期95-96,共2页 Computer CD Software and Application

基金河池学院青年课题(项目编号:2014QN-N009)的阶段性成果

关键词多数据挖掘多数据库分类 IDENTIFY Completeclass算法 IDENTIFY Best Classification算法

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

1Jia Shijie,Kong Xiangwei,Jin Guang.AUTOMATIC FAST CLASSIFICATION OF PRODUCT-IMAGES WITH CLASS-SPECIFIC DESCRIPTOR[J].Journal of Electronics(China),2010,27(6):808-814. 被引量：1
2王巍奇,付永生,李文明.一种基于快速独立分量分析的图像水印算法[J].信息技术与信息化,2005(1):10-12. 被引量：3
3王翔,范启富.基于FICA的盲语音信号分离方法研究[J].微计算机信息,2009(28):176-177. 被引量：1
4李金基,焦李成,张向荣,杨咚咚.基于两时相图像联合分类的SAR图像变化检测[J].红外与毫米波学报,2009,28(6):466-471. 被引量：4
5Fan Zhiqing,Wang Xueqing,Li Baolong.Research on the credit classification of practicing qualification personnel in construction market based on self-organizing neural network[J].Engineering Sciences,2011,9(4):93-96.
6刘映杰,马义德,罗雪萍.一种基于FICA的小波域数字水印算法[J].信息安全与通信保密,2006,28(5):98-100.
7胡文军,王士同.隐私保护的SVM快速分类方法[J].电子学报,2012,40(2):280-286. 被引量：13
8Li Liu,Aolei Yang,Wenju Zhou,Xiaofeng Zhang,Minrui Fei,Xiaowei Tu.Robust Dataset Classification Approach Based on Neighbor Searching and Kernel Fuzzy C-Means[J].IEEE/CAA Journal of Automatica Sinica,2015,2(3):235-247. 被引量：7
9Oleksandr Oguy.Theory and Linguistic Practice in the 21st Century --Epistemologically Regarded as the Post-Classical Linguistic Investigations[J].US-China Foreign Language,2014,12(7):559-563.
10周靖,刘晋胜.一种面向混合属性对象的初始簇中心定位的新算法[J].计算机应用研究,2016,33(9):2634-2636.

计算机光盘软件与应用

2014年第23期

浏览历史

内容加载中请稍等...

基于相似度的多数据库分类

相关作者

相关机构

相关主题

浏览历史