期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于页面内容和站点结构的页面聚类挖掘算法 被引量:20
1
作者 杨怡玲 管旭东 尤晋元 《软件学报》 EI CSCD 北大核心 2002年第3期467-469,共3页
提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,... 提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高. 展开更多
关键词 日志分析 页面内容 站点结构 数据库 数据挖掘 页面聚类挖掘算法
下载PDF
面向大数据的聚类挖掘算法研究 被引量:2
2
作者 龚静 《中国新技术新产品》 2022年第14期51-54,共4页
目前在对数十种乃至数百种物品进行分析时,由于运算能力的增长,采用手工方法进行统计不但耗费大量的计算时间,而且还会发生计算错误的。因此需要用某种方法对各种东西进行归类,进而产生了几种对数据进行处理的聚类的方法。该文对大数据... 目前在对数十种乃至数百种物品进行分析时,由于运算能力的增长,采用手工方法进行统计不但耗费大量的计算时间,而且还会发生计算错误的。因此需要用某种方法对各种东西进行归类,进而产生了几种对数据进行处理的聚类的方法。该文对大数据进行了分析,研究了数据挖掘算法,建立了个性化的推荐系统,不会对公共资源造成浪费。 展开更多
关键词 大数据 聚类挖掘算法 计算
下载PDF
基于云计算的大数据聚类挖掘算法研究
3
作者 何庆 钟维坚 +2 位作者 覃志智 林锋 唐苏东 《中国新通信》 2023年第24期19-21,共3页
基于云计算的大数据聚类挖掘,需要结合改进粒子群算法、k-means算法的优势,提出基于改进粒子群优化(Particle Swarm Optimization,PSO)的k-means聚类算法,设置自调节惯性权重、云变异算子,根据数据集种群的进化程度,调整粒子群算法的全... 基于云计算的大数据聚类挖掘,需要结合改进粒子群算法、k-means算法的优势,提出基于改进粒子群优化(Particle Swarm Optimization,PSO)的k-means聚类算法,设置自调节惯性权重、云变异算子,根据数据集种群的进化程度,调整粒子群算法的全局搜索、局部搜索能力,追踪数据粒子的个体极值、全局极值,更新每个数据个体在解空间中的点位置、更新速度,并在数据种群进化到一定程度时进行变异操作,选择全局极值作为期望Ex来控制种群迭代次数,避免数据挖掘陷入早熟收敛、局部最优解的情况。 展开更多
关键词 云计算 大数据 k-means聚类挖掘算法 粒子群优化
下载PDF
基于web日志挖掘聚类算法的电子商务商业智能研究 被引量:2
4
作者 孟亚辉 《赤峰学院学报(自然科学版)》 2013年第12期25-27,共3页
随着互联网的日益普及和电子商务的迅速发展,基于Web日志挖掘聚类算法的电子商务在市场中竞争越来越激烈.本文首先概述Web使用挖掘,简单介绍日志挖掘技术中两个关键技术,聚类分析和序列模式挖掘,进而讨论Web日志挖掘的数据预处理过程,... 随着互联网的日益普及和电子商务的迅速发展,基于Web日志挖掘聚类算法的电子商务在市场中竞争越来越激烈.本文首先概述Web使用挖掘,简单介绍日志挖掘技术中两个关键技术,聚类分析和序列模式挖掘,进而讨论Web日志挖掘的数据预处理过程,包括用户,数据净化,路径补充等.对于传统的矩阵聚算法进行优化,应用该算法可以对客户和页面进行聚类分析,达到发现相似的客户群体,挖掘潜在客户群.通过实验表明改进的算法具有较高的扩展性和准确性,证明将挖掘结果应用于个性化推荐系统的思想是可行有效的. 展开更多
关键词 挖掘算法 电子商务 个性化推荐系统
下载PDF
基于遗传算法的高效聚类挖掘新算法
5
作者 黄明 王武龙 梁旭 《大连铁道学院学报》 2002年第4期64-66,82,共4页
提出了一种基于遗传算法的聚类数据挖掘新算法,并在某钢铁集团CIMS工程的销售管理系统中成功进行了应用,新算法与已有算法进行了对比研究.新方法对其他类似的实际应用也有参考价值.
关键词 简单遗传算法 数据挖掘算法 数据库
下载PDF
一种基于Hadoop云计算平台大数据聚类算法设计 被引量:6
6
作者 司福明 卜天然 《楚雄师范学院学报》 2016年第3期49-55,共7页
传统的数据挖掘技术由于受到编程模型等的约束,产生了不同瓶颈,聚类算法的研究面临着海量的大数据处理与分析的挑战,新兴计算模型Hadoop作为一种可并行处理的云计算平台得到了广泛应用。文章对传统聚类挖掘算法进行改进和优化,在Hadoop... 传统的数据挖掘技术由于受到编程模型等的约束,产生了不同瓶颈,聚类算法的研究面临着海量的大数据处理与分析的挑战,新兴计算模型Hadoop作为一种可并行处理的云计算平台得到了广泛应用。文章对传统聚类挖掘算法进行改进和优化,在Hadoop云计算平台上进行K-means算法的并行化实现,降低算法的时间复杂度,提高了计算效率。实践证明,改进的K-means算法适合大规模数据集的聚类挖掘,具有高效、准确、稳定、安全等特性,适合于海量数据的分析和处理。 展开更多
关键词 HADOOP 云计算平台 大数据 聚类挖掘算法 并行化
下载PDF
一种基于Hadoop云计算平台大数据聚类算法设计 被引量:3
7
作者 司福明 卜天然 《通化师范学院学报》 2016年第4期9-12,65,共5页
为了提高聚类的准确度,对传统聚类挖掘算法进行分析、改进和优化,在云计算Hadoop平台上进行DBIK-means算法的并行化,降低了算法的时间复杂度,提高了计算效率.通过实验验证,结果表明DBIK-means算法具有高效、准确、稳定、安全等特性,适... 为了提高聚类的准确度,对传统聚类挖掘算法进行分析、改进和优化,在云计算Hadoop平台上进行DBIK-means算法的并行化,降低了算法的时间复杂度,提高了计算效率.通过实验验证,结果表明DBIK-means算法具有高效、准确、稳定、安全等特性,适合大规模数据集的聚类挖掘. 展开更多
关键词 HADOOP 云计算平台 大数据 聚类挖掘算法 并行化
下载PDF
基于数据流模糊聚类挖掘的入侵检测系统研究
8
作者 李俊鹏 王勇 +1 位作者 白焱 李云杰 《现代防御技术》 北大核心 2013年第2期207-211,共5页
传统的基于数据挖掘入侵检测技术往往是基于静态数据的检测,随着网络速度的提高和网络流量的剧增,网络数据通常以数据流的形式出现。提出了一种作用于数据流的模糊聚类挖掘算法(SFCM),并且针对该算法提出了一种基于数据流模糊聚类的入... 传统的基于数据挖掘入侵检测技术往往是基于静态数据的检测,随着网络速度的提高和网络流量的剧增,网络数据通常以数据流的形式出现。提出了一种作用于数据流的模糊聚类挖掘算法(SFCM),并且针对该算法提出了一种基于数据流模糊聚类的入侵检测系统,实验结果显示,该方法有较高的检测率和较低的漏报率和误报率。 展开更多
关键词 数据流挖掘 算法 基于数据流的模糊聚类挖掘算法(SFCM) 入侵检测
下载PDF
Empirical Study on B/C Apparel Consumption Behavior Based on Data Mining Technology 被引量:1
9
作者 梁建芳 梁建明 王剑萍 《Journal of Donghua University(English Edition)》 EI CAS 2013年第6期530-536,共7页
In order to accurately identify the characters associated with consumption behavior of apparel online shopping, a typical B/ C clothing enterprise in China was chosen. The target experimental database containing 2000 ... In order to accurately identify the characters associated with consumption behavior of apparel online shopping, a typical B/ C clothing enterprise in China was chosen. The target experimental database containing 2000 data records was obtained based on web service logs of sample enterprise. By means of clustering algorithm of Clementine Data Mining Software, K-means model was set up and 8 clusters of consumer were concluded. Meanwhile, the implicit information existed in consumer's characters and preferences for clothing was found. At last, 31 valuable association rules among casual wear, formal wear, and tie-in products were explored by using web analysis and Aprior algorithm. This finding will help to better understand the nature of online apparel consumption behavior and make a good progress in personalization and intelligent recommendation strategies. 展开更多
关键词 consumption behavior online shopping apparel industry data mining
下载PDF
Automatically Mining Application Signatures for Lightweight Deep Packet Inspection
10
作者 鲁刚 张宏莉 +3 位作者 张宇 Mahmoud T. Qassrawi 余翔湛 彭立志 《China Communications》 SCIE CSCD 2013年第6期86-99,共14页
Automatic signature generation approaches have been widely applied in recent traffic classification.However,they are not suitable for LightWeight Deep Packet Inspection(LW_DPI) since their generated signatures are mat... Automatic signature generation approaches have been widely applied in recent traffic classification.However,they are not suitable for LightWeight Deep Packet Inspection(LW_DPI) since their generated signatures are matched through a search of the entire application data.On the basis of LW_DPI schemes,we present two Hierarchical Clustering(HC) algorithms:HC_TCP and HC_UDP,which can generate byte signatures from TCP and UDP packet payloads respectively.In particular,HC_TCP and HC_ UDP can extract the positions of byte signatures in packet payloads.Further,in order to deal with the case in which byte signatures cannot be derived,we develop an algorithm for generating bit signatures.Compared with the LASER algorithm and Suffix Tree(ST)-based algorithm,the proposed algorithms are better in terms of both classification accuracy and speed.Moreover,the experimental results indicate that,as long as the application-protocol header exists,it is possible to automatically derive reliable and accurate signatures combined with their positions in packet payloads. 展开更多
关键词 traffic classification automatic signature generation association mining hierarchical clustering LW_ DPI
下载PDF
Integrating OWA and Data Mining for Analyzing Customers Churn in E-Commerce 被引量:1
11
作者 CAO Jie YU Xiaobing ZHANG Zhifei 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2015年第2期381-392,共12页
Customers are of great importance to E-commerce in intense competition.It is known that twenty percent customers produce eighty percent profiles.Thus,how to find these customers is very critical.Customer lifetime valu... Customers are of great importance to E-commerce in intense competition.It is known that twenty percent customers produce eighty percent profiles.Thus,how to find these customers is very critical.Customer lifetime value(CLV) is presented to evaluate customers in terms of recency,frequency and monetary(RFM) variables.A novel model is proposed to analyze customers purchase data and RFM variables based on ordered weighting averaging(OWA) and K-Means cluster algorithm.OWA is employed to determine the weights of RFM variables in evaluating customer lifetime value or loyalty.K-Means algorithm is used to cluster customers according to RFM values.Churn customers could be found out by comparing RFM values of every cluster group with average RFM.Questionnaire is conducted to investigate which reasons cause customers dissatisfaction.Rank these reasons to help E-commerce improve services.The experimental results have demonstrated that the model is effective and reasonable. 展开更多
关键词 Customer life value E-COMMERCE K-MEANS OWA.
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部