期刊文献+
共找到221篇文章
< 1 2 12 >
每页显示 20 50 100
Learning Association Rules and Tracking the Changing Concepts on Webpages:An Effective Pornographic Websites Filtering Approach
1
作者 Jyh-Jian Sheu 《Journal of Electronic Science and Technology》 CAS CSCD 2018年第1期24-36,共13页
We applied the decision tree algorithm to learn association rules between webpage’s category(pornographic or normal) and the critical features.Based on these rules, we proposed an efficient method of filtering pornog... We applied the decision tree algorithm to learn association rules between webpage’s category(pornographic or normal) and the critical features.Based on these rules, we proposed an efficient method of filtering pornographic webpages with the following major advantages: 1) a weighted window-based technique was proposed to estimate for the condition of concept drift for the keywords found recently in pornographic webpages; 2) checking only contexts of webpages without scanning pictures; 3) an incremental learning mechanism was designed to incrementally update the pornographic keyword database. 展开更多
关键词 concept drift data mining decision tree pornographic websites filtering
下载PDF
基于GIS辅助的多源地理空间矢量数据挖掘方法
2
作者 李涛 徐江 《计算机仿真》 2024年第9期465-469,共5页
噪声数据干扰下,数据挖掘精确度和效率偏低,为了提高数据挖掘结果的准确性,提出一种GIS辅助下多源地理空间矢量数据挖掘算法。通过非下采样小波变换方法对原始多源地理空间矢量数据多尺度分解,确保噪声和数据得到有效分离,通过变分偏微... 噪声数据干扰下,数据挖掘精确度和效率偏低,为了提高数据挖掘结果的准确性,提出一种GIS辅助下多源地理空间矢量数据挖掘算法。通过非下采样小波变换方法对原始多源地理空间矢量数据多尺度分解,确保噪声和数据得到有效分离,通过变分偏微方程平滑数据内残余的噪声,避免数据内大量细节信息丢失。将GIS应用到多源地理空间矢量数据挖掘中,建立数据挖掘模型,并根据图层之间的关系变换数据,实现多源地理空间矢量数据的离散化处理。利用形式背景构建概念格和Hasse图,根据概念格中的内涵缩减集形成非冗余关联规则,结合数据挖掘模型完成数据挖掘。实验结果表明,所提方法可以有效滤除多源地理空间矢量数据中的噪声,获取满意的数据挖掘效果。 展开更多
关键词 非下采样小波变换方法 数据挖掘 概念格
下载PDF
Study and Implementation of Web Mining Classification Algorithm Based on Building Tree of Detection Class Threshold
3
作者 陈俊杰 宋瀚涛 陆玉昌 《Journal of Beijing Institute of Technology》 EI CAS 2005年第2期126-129,共4页
A new classification algorithm for web mining is proposed on the basis of general classification algorithm for data mining in order to implement personalized information services. The building tree method of detecting... A new classification algorithm for web mining is proposed on the basis of general classification algorithm for data mining in order to implement personalized information services. The building tree method of detecting class threshold is used for construction of decision tree according to the concept of user expectation so as to find classification rules in different layers. Compared with the traditional C4.5 algorithm, the disadvantage of excessive adaptation in C4.5 has been improved so that classification results not only have much higher accuracy but also statistic meaning. 展开更多
关键词 data mining classification algorithm class threshold induced concept
下载PDF
基于改进模糊聚类算法的大数据随机挖掘仿真 被引量:1
4
作者 李萍 刘金金 《计算机仿真》 2024年第2期496-499,521,共5页
大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法... 大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法。利用建立的语义概念树模型获取大数据的特征分布关系,并根据模糊语义分析法得出大数据的语义相似性、关联性条件,提取大数据特征。优先确定最佳聚类数,采用改进模糊聚类算法对其聚类,实现基于改进模糊算法的大数据随机挖掘。实验结果表明,上述方法的大数据模糊聚类效果较好,随机挖掘准确率可达到95%以上,实验所得结果验证了上述方法较强的应用有效性。 展开更多
关键词 改进模糊聚类算法 大数据随机挖掘 语义概念树 特征提取 特征聚类
下载PDF
基于数据挖掘和整体观探究活血化瘀法治疗经皮冠状动脉介入术后再狭窄的用药规律
5
作者 张纯 张书萌 +4 位作者 于子璇 周江敏 朱晓颖 陈伶利 李杰 《湖南中医药大学学报》 CAS 2024年第2期295-301,共7页
目的探究活血化瘀法治疗经皮冠状动脉介入(percutaneous coronary intervention,PCI)术后再狭窄的用药规律。方法检索中英文数据库中相关文献,筛选符合标准的中药处方,构建原始数据库,运用Excel 2021、IBM SPSS 18.0、Cytoscape 3.9.1、... 目的探究活血化瘀法治疗经皮冠状动脉介入(percutaneous coronary intervention,PCI)术后再狭窄的用药规律。方法检索中英文数据库中相关文献,筛选符合标准的中药处方,构建原始数据库,运用Excel 2021、IBM SPSS 18.0、Cytoscape 3.9.1、SPSS Statistics 26.0等软件进行高频药物、功效主治、性味归经、关联规则、系统聚类分析以总结其用药规律。结果最终纳入73篇文献、73首中药处方,共涉及125味中药。高频药物有丹参、黄芪、川芎、当归、赤芍、红花等。功效主治以活血化瘀药物最多,其次为补虚药。四气中以温、寒为主,五味以苦、甘、辛为主,归经多入肝、脾经。关联规则分析得到3条对药,红花-桃仁支持度最高,26条角药,以川芎、赤芍、红花、当归、黄芪、桃仁等相互组合为主。系统聚类分析得到5组药物组合。结论PCI术后再狭窄的基本病机为心气亏虚、心阳不振,瘀血是贯穿疾病全程的关键病理因素,病位累及心、肝、脾等。五脏之气,相互灌溉,以整体观为指导,治疗以活血化瘀为主,兼以调气、化痰、温阳,组方用药多由补阳还五汤、血府逐瘀汤、当归补血汤、瓜蒌薤白半夏汤、二陈汤等经典名方化裁而来。 展开更多
关键词 活血化瘀 经皮冠状动脉介入术 数据挖掘 用药规律 整体观
下载PDF
TP-Miner:基于生物启发计算的警用流动人口分析系统 被引量:1
6
作者 彭京 唐常杰 +3 位作者 程温泉 叶尚玉 方全心 石葆梅 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2006年第5期128-135,共8页
目前对流动人口的管理仅停留在数据查询比对和简单统计上,缺少对数据的深层次分析,难以对决策指挥提供支持。针对流动人口的分析问题,提出了构建一个基于生物启发计算的智能分析系统,用于发现流动人口中各类人员的流动模式以及流动人口... 目前对流动人口的管理仅停留在数据查询比对和简单统计上,缺少对数据的深层次分析,难以对决策指挥提供支持。针对流动人口的分析问题,提出了构建一个基于生物启发计算的智能分析系统,用于发现流动人口中各类人员的流动模式以及流动人口的趋势性问题,找出异常的流动信息和模式。该系统综合运用了前沿的生物启发计算技术———基于多层染色体基因表达式编程算法、重叠基因表达进化算法、基于概念相似度神经网络分类模型和层次距离计算的聚类算法搭建了一个警用流动人口的分析平台。同时根据实际需求,提出了一种新的基于智能分析结果的分级报警模型。实验表明系统具有较高的性能和实用性。 展开更多
关键词 生物启发计算 流动人口 概念相似度 人工神经网络 数据挖掘
下载PDF
基于形式概念分析的优质教学模式挖掘
7
作者 郝飞 锁婷 +1 位作者 马胜清 李鹏 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期106-117,共12页
形式概念分析通过建立对象集与属性集间的二元关系来挖掘数据中隐含的概念,以及概念之间的层次关系,是一种分析数据和提取规则的有力工具。文章将其引入到学生和教师数据的分析中,通过创建学生和教师数据集的形式背景和概念格,详细分析... 形式概念分析通过建立对象集与属性集间的二元关系来挖掘数据中隐含的概念,以及概念之间的层次关系,是一种分析数据和提取规则的有力工具。文章将其引入到学生和教师数据的分析中,通过创建学生和教师数据集的形式背景和概念格,详细分析学生答题情况和知识技能掌握情况,以及优秀教师教学行为与教学效果之间的关系,并结合建构主义理论、支架式教学理论、最近发展区理论挖掘优质教学模式。其次,应用统计方法分析了学生在测试中的答题分布情况和教师教学行为分布情况。最后,结合已有基准数据集开展了教学模式挖掘相关案例分析研究,其案例实施结果表明文章所提方法可以深层次有效地挖掘优质教学模式,可为进一步提升学生自主学习能力和改进教师教学行为提供参考。 展开更多
关键词 自主学习能力 数据挖掘 形式概念分析 支架式教学
下载PDF
基于机器学习的信用卡交易欺诈检测研究综述 被引量:4
8
作者 蒋洪迅 江俊毅 梁循 《计算机工程与应用》 CSCD 北大核心 2023年第21期1-25,共25页
机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用... 机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用卡欺诈检测研究历程,辨析了该领域的研究范畴、应用场景、技术流派等相关概念及其联系;解构了机器学习欺诈识别的一般性研究架构,从特征工程、模型算法、评价指标三个环节归纳总结了领域内研究的最新进展;从数据集是否具备标签角度,着重列举了面向欺诈识别的有监督的、无监督和半监督三类主流机器学习模型,讨论了这些模型的出发点、核心思想、求解方法以及优缺点;还分析了强化学习模型模拟欺诈者与机构之间的动态博弈过程;探讨了机器学习面临的海量数据、样本偏斜和概念漂移三大难点问题,并汇集整理了缓解这些问题的最新进展;总结了面向欺诈检测的机器学习研究目前存在的局限、争议和挑战,并为未来的研究方向提供趋势分析与建议。 展开更多
关键词 信用卡欺诈识别 机器学习 数据挖掘 样本偏斜 概念漂移
下载PDF
数据分析与挖掘课程多维教学改革探讨 被引量:3
9
作者 秦华妮 《高教学刊》 2023年第32期111-115,共5页
大数据时代下,数据分析与挖掘的课程教学面临着内容更新快、涉及面广、难度大等挑战。针对这些挑战,该文阐述如何从教学理念、教学内容、教学方式、教学评价以及课程思政等角度进行多维度的教学改革探索。在教学理念上,融合OBE的以学生... 大数据时代下,数据分析与挖掘的课程教学面临着内容更新快、涉及面广、难度大等挑战。针对这些挑战,该文阐述如何从教学理念、教学内容、教学方式、教学评价以及课程思政等角度进行多维度的教学改革探索。在教学理念上,融合OBE的以学生为主体,以产出为导向;在教学内容上,根据知识模块和培养的能力目标进行整合优化,以及融入课程思政;根据知识的难易程度,选择合适的教学方式;根据考察能力的不同改进教学评价方式等。这些改革都对改进该课程的教学效果起到很好的作用。 展开更多
关键词 数据分析与挖掘 教学改革 混合教学 OBE理念 课程思政
下载PDF
广义后缀树的概念生成算法
10
作者 林志鸿 王李进 吴清寿 《武夷学院学报》 2023年第6期6-10,共5页
提出一种基于广义后缀树的概念生成算法(generalized suffix tree based concept generation algorithm,GSTCG),将背景中所有对象的属性序列及其后缀建立为一棵广义后缀树,并根据广义后缀树产生候选概念;其次,合并具有相同对象集合的候... 提出一种基于广义后缀树的概念生成算法(generalized suffix tree based concept generation algorithm,GSTCG),将背景中所有对象的属性序列及其后缀建立为一棵广义后缀树,并根据广义后缀树产生候选概念;其次,合并具有相同对象集合的候选概念,再根据规则对候选概念进行扩展;最后,删除冗余的候选概念后得到全部形式概念。在两类不同参数人工数据集上的实验结果表明,GSTCG算法与NextClosure算法在所有背景上得到的概念数量一致,且前者具有更优的时间性能。 展开更多
关键词 形式概念分析 概念格 广义后缀树 数据挖掘
下载PDF
基于数据增强与流数据处理的Tor流量分析模型 被引量:1
11
作者 席荣康 蔡满春 芦天亮 《计算机工程》 CAS CSCD 北大核心 2023年第3期177-184,共8页
Tor流量分析技术为打击利用Tor匿名通信工具从事的暗网犯罪活动提供了技术支撑,但目前存在数据难于收集、数据集不平衡、模型抗概念漂移能力差等问题。提出一种结合堆叠去噪自编码器和在线序列极限学习机的Tor流量分析模型。对原始Tor P... Tor流量分析技术为打击利用Tor匿名通信工具从事的暗网犯罪活动提供了技术支撑,但目前存在数据难于收集、数据集不平衡、模型抗概念漂移能力差等问题。提出一种结合堆叠去噪自编码器和在线序列极限学习机的Tor流量分析模型。对原始Tor PACP包进行分割、去噪处理并提取特征序列。在此基础上,将一维序列转化为可视化灰度图并输入改进多尺寸深度卷积生成对抗网络,生成Tor流量样本以平衡数据集,利用堆叠降噪自动编码器进行序列降维并将特征输入在线序列极限学习机实现Tor匿名流量的在线流识别。实验结果表明,改进多尺寸深度卷积生成对抗网络可用于提升数据集质量并提高模型识别率约2.8个百分点,结合在线序列极限学习机和堆叠去噪自编码器的流量分析模型准确率可达95.7%,识别效率较传统卷积神经网络和长短期记忆网络模型有较大提升。 展开更多
关键词 洋葱路由 概念漂移 流数据挖掘 数据增强 深度卷积生成对抗网络 堆叠去噪自动编码器 在线序列极限学习机
下载PDF
基于数据挖掘技术分析针灸治疗慢性肾小球肾炎的取穴规律 被引量:1
12
作者 刘雪杨 廖翔宇 +4 位作者 陈琼君 陈露 黄金 刘悦 陆彦青 《广州中医药大学学报》 CAS 2023年第4期1036-1042,共7页
【目的】利用数据挖掘和网络可视化,分析针灸治疗慢性肾小球肾炎的取穴规律。【方法】检索中国知网(CNKI)、维普数据库(VIP)和万方数据库(WanFang)、PubMed 4个数据库,筛选建库至2022年6月针灸治疗慢性肾小球肾炎的临床观察文献,对腧穴... 【目的】利用数据挖掘和网络可视化,分析针灸治疗慢性肾小球肾炎的取穴规律。【方法】检索中国知网(CNKI)、维普数据库(VIP)和万方数据库(WanFang)、PubMed 4个数据库,筛选建库至2022年6月针灸治疗慢性肾小球肾炎的临床观察文献,对腧穴频次、腧穴关联规则等方面进行统计分析。【结果】共纳入86篇文献,涉及腧穴55个,取穴频次最高的腧穴为肾俞,选经以足太阳膀胱经、任脉、足太阴脾经为主,特定穴以背俞穴为主,核心腧穴为肾俞、三阴交。【结论】针灸治疗慢性肾小球肾炎的取穴规律符合中医脏腑辨证思路,以培土制水为中心治法。 展开更多
关键词 针灸 慢性肾小球肾炎 数据挖掘 取穴规律 培土制水 肾俞穴 背俞穴 任脉 膀胱经 腧穴
下载PDF
历史演进、空间演化、主体变迁:马克思恩格斯城市观的三重维度 被引量:1
13
作者 张恩 《湖北民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2023年第5期66-78,共13页
《马克思恩格斯全集》是系统把握马克思恩格斯城市观的基础文本。机器分词与聚类统计的文献学视阈下展露了马克思恩格斯城市观清晰的分析维度和明确的分析论域。在理论维度上,马克思恩格斯构建了城市分析的历史、空间、主体性三位一体面... 《马克思恩格斯全集》是系统把握马克思恩格斯城市观的基础文本。机器分词与聚类统计的文献学视阈下展露了马克思恩格斯城市观清晰的分析维度和明确的分析论域。在理论维度上,马克思恩格斯构建了城市分析的历史、空间、主体性三位一体面向;在问题论域上,其揭示了城市历史演进的社会分工动力、工业时代城市空间演化的资本动能、城市主体性变迁及其解放政治前景。马克思恩格斯的城市观具有一般性分析范式价值,有助于从城市变迁的时空过程和“谁的城市”这个元命题中真正把握城市的本质。 展开更多
关键词 马克思主义城市观 城市理论 马克思主义文献学 数据挖掘 现代化
下载PDF
四逆散方证关系与运用规律的数据挖掘
14
作者 黄礼勤 谢华珍 +3 位作者 谢芷芯 唐湘楚 卢伟名 罗广波 《广州中医药大学学报》 CAS 2023年第8期2092-2100,共9页
【目的】利用数据挖掘方法探讨四逆散临床运用的方证规律。【方法】通过检索中国期刊全文数据库(CNKI)、中国生物医学文献数据库(CBM)、万方医学数据库(Wanfang)、维普中文科技期刊数据库(VIP)和古今医案云平台中运用四逆散加减治疗有... 【目的】利用数据挖掘方法探讨四逆散临床运用的方证规律。【方法】通过检索中国期刊全文数据库(CNKI)、中国生物医学文献数据库(CBM)、万方医学数据库(Wanfang)、维普中文科技期刊数据库(VIP)和古今医案云平台中运用四逆散加减治疗有效的临床医案,录入医案患者的中医症状(包括舌象和脉象)、加减药物等信息,并建立四逆散数据库。对四逆散数据库中的中医症状(包括舌象和脉象)和加味药物进行频数统计分析、关联规则分析、形式概念分析。【结果】共纳入390则四逆散加减治疗医案,筛选出22个主要症状和27味主要加味药物;加味药物以理气药、补气药、活血止痛药、利水消肿药为主,药物偏温,药味以苦、辛、甘居多,归经以归脾、肺、肝经为主。关联规则分析结果得到17个药物关联规则;在形式概念分析中,症状集合以{脉弦}最具普遍性,药物属性以{茯苓}最具普遍性,具有较多分支的药物集合为{茯苓,白术}{郁金,香附}{茯苓,半夏}。【结论】四逆散证以脉弦为特征性表现,基本病机为气虚气滞,常见变证有气郁化火、气滞血瘀、气滞津停等。在四逆散的加减运用中,茯苓、半夏、白术、香附、郁金为核心配伍药物,并根据不同变证可分别配伍左金丸、金铃子散、小半夏汤、四君子汤、二陈汤、半夏泻心汤等。 展开更多
关键词 四逆散 医案 形式概念分析 脉弦 气虚气滞 气郁化火 茯苓 白术 数据挖掘
下载PDF
两种概念生成算法的比较分析与实验仿真
15
作者 吴清寿 何清恒 刘书阳 《长春师范大学学报》 2023年第6期31-38,共8页
形式概念是形式概念分析理论中的基础数据结构,准确并快速地生成形式背景中的所有概念一直是研究热点。基于基本定义的概念生成算法和NextClosure算法是两种经典的概念生成算法,本文对这两种算法的基本原理进行分析,结合具体的形式背景... 形式概念是形式概念分析理论中的基础数据结构,准确并快速地生成形式背景中的所有概念一直是研究热点。基于基本定义的概念生成算法和NextClosure算法是两种经典的概念生成算法,本文对这两种算法的基本原理进行分析,结合具体的形式背景进行概念生成过程的实例分析,在两类人工数据集上进行实验仿真。仿真结果表明,本文对两个算法比较分析和仿真实验的结果能够为后续相关研究提供有益的参考。 展开更多
关键词 概念格 形式概念分析 NextClosure算法 概念生成算法 数据挖掘
下载PDF
环形网络大数据关联特征无规则挖掘算法仿真
16
作者 鄂晶晶 杨丽华 冯锋 《计算机仿真》 北大核心 2023年第10期381-384,421,共5页
环形网络的大数据特征相似度较高,挖掘任务量大,数据关联规则挖掘的阈值以及近邻个数具有随机性,加大了大数据特征挖掘的难度。为此提出环形网络大数据关联特征无规则挖掘算法。构建语义概念树,利用该模型分析环形网络分布结构特征。采... 环形网络的大数据特征相似度较高,挖掘任务量大,数据关联规则挖掘的阈值以及近邻个数具有随机性,加大了大数据特征挖掘的难度。为此提出环形网络大数据关联特征无规则挖掘算法。构建语义概念树,利用该模型分析环形网络分布结构特征。采用信息融合方法匹配环形网络大数据的分块结构。基于匹配结果对重构后的环形网络完成关联规则特征提取,以提取的关联特征用作特征信息素,实现环形网络大数据关联特征的无规则挖掘。仿真中测试上述方法的挖掘准确率测试、挖掘用时指标,实验结果表明了上述方法的大数据关联特征无规则挖掘效率高,可靠性强。 展开更多
关键词 环形网络 大数据 关联特征 无规则挖掘 语义概念树
下载PDF
兴趣度——关联规则的又一个阈值 被引量:91
17
作者 周欣 沙朝锋 +1 位作者 朱扬勇 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2000年第5期627-633,共7页
关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持... 关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持度都很高 ,仍没有实际意义 ,甚至是误导性的 .因此对关联规则的形式定义作了修改 ,将运用差异思想引入的兴趣度阈值运用到关联规则中来 ,并给出其形式定义 .在分析了兴趣度的实际意义以后 ,讨论了兴趣度与概念层次的结合 . 展开更多
关键词 数据采掘 关联规则 兴趣度 概念层次 阈值 数据
下载PDF
一种基于概念的数据聚类模型 被引量:15
18
作者 张明卫 刘莹 +1 位作者 张斌 朱志良 《软件学报》 EI CSCD 北大核心 2009年第9期2387-2396,共10页
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行... 在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效. 展开更多
关键词 数据挖掘 聚类 概念 概念元组 模型
下载PDF
基于多分类器的数据流中的概念漂移挖掘 被引量:28
19
作者 孙岳 毛国君 +1 位作者 刘旭 刘椿年 《自动化学报》 EI CSCD 北大核心 2008年第1期93-97,共5页
数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID... 数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID4实现了数据流中概念漂移的增量式检测和挖掘.实验结果表明,MID4算法在处理数据流的概念漂移上表现出比已有同类算法更高的精确度和适应性. 展开更多
关键词 数据挖掘 数据流 概念漂移
下载PDF
数据流挖掘分类技术综述 被引量:41
20
作者 王涛 李舟军 +1 位作者 颜跃进 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1809-1815,共7页
数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类... 数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类技术更是当前的研究热点.综述了当前国际上关于数据流挖掘分类算法的研究现状,并从数据平稳分布和带概念漂移两个方面对这些方法进行了系统的介绍与分析,最后对数据流挖掘分类技术当前所面临的问题和发展趋势进行了总结和展望. 展开更多
关键词 数据流 挖掘 分类 稳态分布 概念漂移
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部