期刊文献+
共找到85篇文章
< 1 2 5 >
每页显示 20 50 100
K-means算法在高速公路ETC数据分析中的应用 被引量:1
1
作者 张添翼 杨涵 +1 位作者 田俊山 王歆远 《公路交通科技》 CAS CSCD 北大核心 2024年第6期199-206,共8页
为了更高效地利用高速公路ETC数据集并提升数据处理速度,深入分析ETC用户的主要特征和高速公路存在的潜在问题。以我国某省份某高速公路出入口2023年6月的ETC通行数据为例,通过Python编程语言对数据进行清洗,采用环形特征编码处理时间数... 为了更高效地利用高速公路ETC数据集并提升数据处理速度,深入分析ETC用户的主要特征和高速公路存在的潜在问题。以我国某省份某高速公路出入口2023年6月的ETC通行数据为例,通过Python编程语言对数据进行清洗,采用环形特征编码处理时间数据,并运用K-means聚类算法对数据进行处理。重点关注入口时间、出口时间、本省通行里程等指标,对用户的收费里程、速度以及行驶时间3个核心特征进行分析,借助聚类中心点和雷达图进行可视化展示。分析结果显示,傍晚时段的通行效率较低,晚间疲劳驾驶和午夜超速问题较为突出。根据通行里程分析,白天主要以短程和中程用户为主,长程用户倾向于在上午进入高速公路,同时,该高速公路存在大量的通勤车辆。在速度分析方面,低速组多为短途车辆。K-means聚类算法的应用使得数据处理过程快速且可靠,结合更多的ETC数据,可以进一步深入了解高速公路通行的主要群体和状况。研究成果可为制定差异化收费政策提供有力依据。例如,通过聚类分析进入高速公路的时间,确定高峰时段和低谷时段,适时提高高峰时段的费用,降低低谷时段的费用,从而提高通行效率、平衡路网流量。这具有重要的现实意义。 展开更多
关键词 智能交通 用户聚类 k-means算法 高速公路ETC数据 海量数据
下载PDF
融合SOM神经网络与K-means聚类算法的用户信用画像研究
2
作者 罗博炜 罗万红 谭家驹 《铁路计算机应用》 2024年第7期14-19,共6页
为提高现阶段基于K-Means聚类算法的用户信用画像模型的准确性和实时性,提出一种融合自组织映射(SOM,Self-Organizing Map)神经网络与K-Means聚类算法的改进方法。通过SOM对用户数据进行降维和特征提取,直接获得最优聚类数目后再用K-Me... 为提高现阶段基于K-Means聚类算法的用户信用画像模型的准确性和实时性,提出一种融合自组织映射(SOM,Self-Organizing Map)神经网络与K-Means聚类算法的改进方法。通过SOM对用户数据进行降维和特征提取,直接获得最优聚类数目后再用K-Means算法进行聚类分析。通过真实在线借贷平台数据对所提方法进行验证,结果表明,该方法可提升用户信用画像分析的质量,更好地满足金融数据分析中对实时管理和风险控制的要求,为金融机构提供精准的决策支持。 展开更多
关键词 用户信用画像 SOM神经网络 k-means聚类算法 时间复杂度 风险控制
下载PDF
基于K-means和naive Bayes的数据库用户行为异常检测研究 被引量:8
3
作者 王旭仁 冯安然 +2 位作者 何发镁 马慧珍 杨杰 《计算机应用研究》 CSCD 北大核心 2020年第4期1128-1131,共4页
针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分... 针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时其精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F 1值提高了3.33%。实验证明,所提方法大幅降低了训练时间,取得了良好的检测效果。 展开更多
关键词 数据库 用户行为 异常检测 k-means聚类 NAIVE Bayes分类算法
下载PDF
基于k-means算法的微博用户推荐功能研究 被引量:16
4
作者 杨尊琦 张倩楠 《情报杂志》 CSSCI 北大核心 2013年第8期142-144,131,共4页
将微博中的兴趣关注根据现有的类别进行再次分类。以新浪微博达人为研究对象,提取他们关注的名人以及机构,并将这些名人、机构根据主页描述和标签进行归类。基于共链关系统计同时关注每两个类别之间的用户人数。最后将统计结果制成相关... 将微博中的兴趣关注根据现有的类别进行再次分类。以新浪微博达人为研究对象,提取他们关注的名人以及机构,并将这些名人、机构根据主页描述和标签进行归类。基于共链关系统计同时关注每两个类别之间的用户人数。最后将统计结果制成相关性矩阵,导入SPSS软件中进行k-means聚类,结果为具有相似性的兴趣可以聚为一组。最后根据聚类结果结合现实情况分析各类别之间的相似性与区别。挖掘用户关注兴趣的隐性信息,并对微博用户推荐兴趣提出建议。 展开更多
关键词 微博关注兴趣共同关注矩阵k-means聚类新浪微博微博用户 用户推荐
下载PDF
改进K-means模型在电力系统用户行为分析中的应用 被引量:2
5
作者 张蕾 崔志坤 +1 位作者 李井泉 白涛 《无线电工程》 2017年第3期12-14,38,共4页
针对电力信息系统用户行为分析的问题,提出了一种基于改进K-means聚类模型的电力信息系统用户行为分析方法。该方法把基于单词向量特征的改进K-means聚类模型应用于电力信息系统用户行为分析,解决了传统K-means算法通过随机选出聚类中... 针对电力信息系统用户行为分析的问题,提出了一种基于改进K-means聚类模型的电力信息系统用户行为分析方法。该方法把基于单词向量特征的改进K-means聚类模型应用于电力信息系统用户行为分析,解决了传统K-means算法通过随机选出聚类中心质点的方式得到的聚类结果范围波动较大、迭代次数较多、耗费时间较长以及稳定性较差的问题,优化后的算法聚类内距整体缩小,迭代次数也大幅度减少,提升了主动服务信息推送的精准性。 展开更多
关键词 电力信息系统 用户行为 单词向量 改进k-means聚类模型
下载PDF
基于K-MEANS聚类的电商网站用户行为分析 被引量:3
6
作者 王召义 薛晨杰 《温州大学学报(自然科学版)》 2017年第3期49-54,共6页
调整网站访问日志数据,从中提取用户访问各类页面次数,考虑类别化的变量组合方式,采用K-MEANS聚类对类别化的变量进行聚类分析,理解各类别特征,描述用户行为,分析各类别与输出结果的关联性,并为制定网站经营策略提供支持和参考依据.实... 调整网站访问日志数据,从中提取用户访问各类页面次数,考虑类别化的变量组合方式,采用K-MEANS聚类对类别化的变量进行聚类分析,理解各类别特征,描述用户行为,分析各类别与输出结果的关联性,并为制定网站经营策略提供支持和参考依据.实证研究表明,对页面访问次数占比进行K-MEANS聚类分析,可以明确各类型页面与输出结果之间的关联性. 展开更多
关键词 k-means聚类 用户行为 多元回归 输出结果
下载PDF
基于K-Means算法的Web日志用户聚类研究 被引量:5
7
作者 陈洲 陆南 《计算机与数字工程》 2020年第3期643-647,共5页
Web日志作为服务器的记录文件,记录了网站最重要的信息,随着大数据时代数据量的骤然增加,提出一种应对大数据量的数据挖掘算法,更有效地分析日志文件迫在眉睫。用户聚类是在对日志文件进行数据预处理的基础上,建立用户会话序列矩阵,进... Web日志作为服务器的记录文件,记录了网站最重要的信息,随着大数据时代数据量的骤然增加,提出一种应对大数据量的数据挖掘算法,更有效地分析日志文件迫在眉睫。用户聚类是在对日志文件进行数据预处理的基础上,建立用户会话序列矩阵,进而对其进行聚类分析,论文针对K-Means算法在选取初始中心点上存在的问题,以及在构建用户会话矩阵后存在的孤立点的问题,提出了一种密度参数和KCR算法的优化算法-ICKM算法,该算法利用密度参数最大的对象作为第一中心点,随后从数据集中将此对象删除,利用KCR算法寻找下一个中心点,算法借助MapReduce计算框架,提高大数据环境下的数据处理速度,通过实验表明,ICKM算法在寻找初始中心点以及用户聚类上具有较高的准确度,在处理大数据量的数据集时,有较好的的运算速度。 展开更多
关键词 用户聚类 k-means算法 kCR算法 MAPREDUCE
下载PDF
基于k-means聚类的电动汽车用户行为特征可视化分析 被引量:3
8
作者 李永攀 黄兵 解大 《电气自动化》 2019年第1期12-15,81,共5页
随着电动汽车关键技术的日趋成熟以及配套基础设施的不断完善,电动汽车产业进入了飞速发展的阶段。提出了对电动汽车用户行为特征分析的意义,以深圳电动汽车智能充电管理平台系统数据为基础,采用k-means聚类分析方法,通过对电动汽车用... 随着电动汽车关键技术的日趋成熟以及配套基础设施的不断完善,电动汽车产业进入了飞速发展的阶段。提出了对电动汽车用户行为特征分析的意义,以深圳电动汽车智能充电管理平台系统数据为基础,采用k-means聚类分析方法,通过对电动汽车用户行为热力图分析和用户充电时间分布分析,总结了电动汽车用户的行为特征。 展开更多
关键词 电动汽车 可视分析系统 k-means聚类分析 热力图 用户特征
下载PDF
基于K-means聚类算法的百货商场用户价值分析 被引量:2
9
作者 李晓丽 苏钦 +2 位作者 吴博 李赢洲 李庆谦 《山西师范大学学报(自然科学版)》 2023年第1期7-13,共7页
使用真实百货商场用户会员信息数据对传统百货商场的用户进行价值分析,对商场会员用户结合销售流水表进行识别,分析并建立模型,将传统的RFM模型进行改进,结合入会时长生成更贴合模型的LRFM模型.运用K-means聚类算法对用户价值进行分类... 使用真实百货商场用户会员信息数据对传统百货商场的用户进行价值分析,对商场会员用户结合销售流水表进行识别,分析并建立模型,将传统的RFM模型进行改进,结合入会时长生成更贴合模型的LRFM模型.运用K-means聚类算法对用户价值进行分类并细分,生成雷达图,使用户价值可视化,识别出不同价值的会员.该研究能够帮助传统线下商场更好地管理用户,进行价值分析,从而提高会员服务,具有一定的实用价值. 展开更多
关键词 机器学习 用户价值分析 LRFM模型 k-means聚类算法
下载PDF
基于k-means聚类算法的用户复杂用电特征挖掘方法研究 被引量:7
10
作者 蒋勇斌 赵炜 +1 位作者 曹晶晶 周丹 《电子设计工程》 2020年第18期11-15,共5页
用户用电情况随着电网技术发展变得更加复杂,同时产生大量用电特征。以往采用基于神经网络挖掘方法和基于CURE算法的挖掘方法受到噪声数据影响,导致挖掘精准度较低,针对该问题,提出基于k-means聚类算法的用户复杂用电特征挖掘方法。在k-... 用户用电情况随着电网技术发展变得更加复杂,同时产生大量用电特征。以往采用基于神经网络挖掘方法和基于CURE算法的挖掘方法受到噪声数据影响,导致挖掘精准度较低,针对该问题,提出基于k-means聚类算法的用户复杂用电特征挖掘方法。在k-means聚类算法中,研究用户复杂用电特征挖掘原理,并对数据进行清洗、集成、规约变换预处理,避免噪声干扰。利用信息熵原则聚类矩阵规整特征点,根据复杂用电特征,通过簇类决策用电特征点,计算聚类簇之间距离,获取用电特征信息增益,完成用户复杂用电特征挖掘。通过实验对比结果可知,该方法挖掘精准度最高为99%,为用户提供更好优质服务。 展开更多
关键词 k-means聚类 用户复杂用电 特征 挖掘
下载PDF
基于用户需求意象的多重K-means-ELM侗锦配色模型研究 被引量:3
11
作者 张超 闫茹玉 朱晓君 《丝绸》 CAS CSCD 北大核心 2022年第12期108-118,共11页
社会的快速发展为少数民族文化的发展创造了崭新的环境。当前对研究对象的配色方案中,大多是对色彩本身进行研究而鲜有结合人的主观意象,为挖掘意象词与服饰配色之间的隐含关系,建立用户需求意象与服饰色彩构成及占比之间的映射模型,提... 社会的快速发展为少数民族文化的发展创造了崭新的环境。当前对研究对象的配色方案中,大多是对色彩本身进行研究而鲜有结合人的主观意象,为挖掘意象词与服饰配色之间的隐含关系,建立用户需求意象与服饰色彩构成及占比之间的映射模型,提出了一种基于用户需求意象的多重K-means-ELM侗锦配色方案。首先,通过对侗族织锦色彩样本的提取,运用语意差异法(SD法)获得用户的认知数据源。结合聚类分析对侗族织锦图像进行分类和色彩提取。其次,基于色彩提取结果采用K-means对相似色彩构成的图像进行多重聚类划分得到具有相似色彩构成及占比的图像集合。最后,以侗族织锦色彩样本、色彩比例关系和HSV空间数值等信息与用户意象建立映射关系,采用极限学习机(Extreme learning machine,ELM)对多重划分得到的聚类图像样本单独建模,构建用户需求意象的多重K-means-ELM侗锦配色模型进行侗族服饰的配色研究。经过算例分析,将配色模型运用到以“星河”为主题的现代插画设计实际创作中进行验证,得出了该模型的可行性与科学性,所提出的配色方法提高了建模精度、降低了配色难度,从而细化意象—色彩之间的映射关系。 展开更多
关键词 侗族织锦 用户需求意象 色彩量化 主色k-means多重聚类 极限学习机 k-means-ELM配色建模 现代插画设计
下载PDF
基于优化K-means聚类算法的用户画像 被引量:3
12
作者 王晨光 《科技创新与应用》 2022年第18期18-21,共4页
近年来,用户画像作为一种有效的大数据工具,在电子商务、社交网络等互联网行业得到广泛应用。然而,对于传统企业,数据维度往往较少,同时分散在多个信息系统,难以通过一般的方法得到较准确的结果。针对此问题,文章提出基于优化K-means聚... 近年来,用户画像作为一种有效的大数据工具,在电子商务、社交网络等互联网行业得到广泛应用。然而,对于传统企业,数据维度往往较少,同时分散在多个信息系统,难以通过一般的方法得到较准确的结果。针对此问题,文章提出基于优化K-means聚类算法的用户画像方法,即同时利用K-means++初始聚类中心优化算法提高聚类精度、Mini Batch K-means小批量优化算法提高收敛速度,以充分结合二者的强互补性,提高算法的分析处理能力。基于企业数据和公开数据集的实验结果显示,相比经典K-means算法,该方法的速度和精度分别提高150倍、20%左右。 展开更多
关键词 优化k-means均值算法 用户画像 聚类分析 有限维度 高分散度
下载PDF
基于K-means聚类的物流园区用户画像分析 被引量:6
13
作者 刘凯 《物流工程与管理》 2020年第3期52-54,共3页
现如今物流园区的信息化水平已经受到了越来越多的关注和重视,数据的利用能力直接体现了物流园区的信息化管理能力。用户画像分析是在一定规模的数据基础上对物流园区中的入驻用户进行行为数据分析,从而更好地管理客户,更加健康持续地... 现如今物流园区的信息化水平已经受到了越来越多的关注和重视,数据的利用能力直接体现了物流园区的信息化管理能力。用户画像分析是在一定规模的数据基础上对物流园区中的入驻用户进行行为数据分析,从而更好地管理客户,更加健康持续地取得经济效益。文中提出了一种应用在物流园区的用户画像分析方法,通过物流园区的用户业务数据和行为数据的分析,建立合理的用户画像标签体系,在K-means聚类算法的基础上挖掘出具有不同业务类型的用户群体,有助于物流园区降低运营成本,提高业务效率,辅助业务决策,采取更加有效地精准营销策略等等。 展开更多
关键词 物流园区 用户画像 k-means聚类
下载PDF
基于数据特征提取与自适应K-means聚类算法的用户用电画像 被引量:1
14
作者 王红斌 王勇 +3 位作者 罗林欢 肖天为 徐硕 罗思敏 《电工技术》 2021年第17期31-33,共3页
随着大数据研究的不断深入与配电自动化建设的逐步完善,电网的态势感知功能正在发挥越来越大的作用,也越来越受到电力公司的重视,其中实现用户用电特征的画像是最重要与基础的一部分。首先对现有用电数据进行特征提取,通过这种方式实现... 随着大数据研究的不断深入与配电自动化建设的逐步完善,电网的态势感知功能正在发挥越来越大的作用,也越来越受到电力公司的重视,其中实现用户用电特征的画像是最重要与基础的一部分。首先对现有用电数据进行特征提取,通过这种方式实现了初步的用电特征提取,同时大大降低了后续算法运行所需的计算资源,随后通过自适应K-means聚类算法对用电特征进行自适应聚类。最后,将得到的结果与常规方法进行准确率比对,验证了该方法的有效性。 展开更多
关键词 用户画像 数据特征提取 自适应k-means聚类算法 大数据技术
下载PDF
基于改进K-means算法的商业用户聚类分析
15
作者 孙晔 孙洁 《河北联合大学学报(自然科学版)》 CAS 2016年第1期67-71,共5页
在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析。本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限性,提出了一种改进的K-means聚类算法。结合当前主流的开源云... 在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析。本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限性,提出了一种改进的K-means聚类算法。结合当前主流的开源云计算平台Hadoop,把改进的算法并行化,克服了传统串行聚类算法在海量数据处理时的不足,以某大型网络存储服务企业每日商业用户网络存储资源使用量为实验数据,验证了算法的高效性和可行性。 展开更多
关键词 k-means聚类算法 云计算 商业用户 网络存储资源
下载PDF
“用户气泡”:社交网络使用中用户的异质性生产——基于k-means聚类的实证分析
16
作者 徐翔 张铃媛 《媒介批评》 2021年第1期106-132,共27页
社交网络的快速发展正深刻形塑人类社会的“数字化生存”,关于它使人们变得同质化、标准化还是多元化、异质化的问题存在着不少争议。以新浪微博用户及其内容生产为样本对象,通过K-means聚类的方法得到样本用户及其帖子在不同主题类别... 社交网络的快速发展正深刻形塑人类社会的“数字化生存”,关于它使人们变得同质化、标准化还是多元化、异质化的问题存在着不少争议。以新浪微博用户及其内容生产为样本对象,通过K-means聚类的方法得到样本用户及其帖子在不同主题类别上的分布,并根据使用程度对样本用户进行“分箱化”处理。研究结果发现,微博使用层级越高,用户相对于整体平均状态、本层级平均状态、最大众化层级、使用度最低层分别都会越发异质化;相对于最异质化层级、使用度最高层则越相似;同时用户不仅越来越多元,也越来越“窄化”,陷入一种“用户气泡”中。部分条件下,用户异质化的趋势表现为近乎直线性的增长。研究结果具备较突出的显著性。 展开更多
关键词 用户气泡 信息茧房 异质性 社交网络 k-means聚类
下载PDF
基于K-means聚类算法的电力用户用电能耗预测方法
17
作者 董睿 侯学坤 +2 位作者 张宏涛 杨康 李顺业 《电力系统装备》 2022年第12期113-115,共3页
为了实现电力用户用电精准预测,基于K-means聚类算法设计新的电力用户用电能耗预测方法。采集处理电力用户用电能耗数据,基于K-means聚类算法构建用电能耗预测模型,设计电力用户用电能耗预测平台,实现电力用户用电能耗预测。通过实例分... 为了实现电力用户用电精准预测,基于K-means聚类算法设计新的电力用户用电能耗预测方法。采集处理电力用户用电能耗数据,基于K-means聚类算法构建用电能耗预测模型,设计电力用户用电能耗预测平台,实现电力用户用电能耗预测。通过实例分析结果表明,设计预测方法得到的预测结果与实际用户用电能耗差距较小,证明预测精度较高,预测效果较好,具有一定的应用价值。 展开更多
关键词 k-means聚类算法 电力用户 用电能耗预测 能耗数据 预测模型
下载PDF
基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法
18
作者 宗一 郑罡 南钰 《科技资讯》 2024年第12期34-36,共3页
为了充分发挥用户负荷的可调节潜力,提出了一种基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法。首先,比较K均值聚类和近邻传播聚类-K均值聚类的优缺点。在工业用户的选取上,选择最佳聚类数均为3的工业用户负荷数据作为被分析... 为了充分发挥用户负荷的可调节潜力,提出了一种基于近邻传播聚类-K均值聚类的工业用户用电模式挖掘方法。首先,比较K均值聚类和近邻传播聚类-K均值聚类的优缺点。在工业用户的选取上,选择最佳聚类数均为3的工业用户负荷数据作为被分析对象以便聚类,借助MATLAB工具对用户负荷数据进行聚类,得到了3组所需的聚类中心,再绘制成曲线以便观察和后续提取特征指标。 展开更多
关键词 近邻传播聚类-k均值聚类 工业用户 可调节潜力评估 评估指标体系 多准则决策法
下载PDF
一种基于K-均值的用户行为聚类算法 被引量:1
19
作者 曾蔚 《绵阳师范学院学报》 2015年第8期94-98,共5页
针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD ... 针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD CUP2000数据集中的用户点击流数据中的用户浏览记录对算法进行实验,实验结果表明算法有较好的聚类结果 . 展开更多
关键词 用户行为聚类 k﹣均值 CANOPY
下载PDF
基于K-means和改进布谷鸟搜索算法的电影推荐
20
作者 杨进 杨孟 陈步前 《智能计算机与应用》 2024年第12期185-189,共5页
针对电影推荐系统根据用户的喜好和大数据中的电影属性进行筛选时,因原始数据信息呈现海量化和稀疏化的特性,造成推荐准确率和用户满意度较低的问题,本文将K-means聚类和改进的布谷鸟搜索算法结合应用在数据集上对电影推荐系统做出改进... 针对电影推荐系统根据用户的喜好和大数据中的电影属性进行筛选时,因原始数据信息呈现海量化和稀疏化的特性,造成推荐准确率和用户满意度较低的问题,本文将K-means聚类和改进的布谷鸟搜索算法结合应用在数据集上对电影推荐系统做出改进。先对数据过滤后的数据集使用K-means算法进行聚类,再使用以锦标赛选择代替随机选择的布谷鸟搜索算法将一些项移动到更好的聚类中优化聚类结果,最后在构建的电影推荐系统上预测评分实现Top-N推荐。本文在Movielens数据集上进行实验,以平均绝对误差、均方根误差、准确率、召回率和F-Score为评价指标,与现有的算法相比,验证了所提方法的有效性。 展开更多
关键词 推荐系统 布谷鸟搜索 k-means聚类 数据过滤 用户喜好
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部