期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于多标签分类算法的网络通信端口流量异常值快速捕获
1
作者 庞建成 樊蒙蒙 《长江信息通信》 2024年第5期162-164,共3页
由于网络通信端口流量状态具有实时更新的特征,导致异常值捕获的难度较大,为此,提出基于多标签分类算法的网络通信端口流量异常值快速捕获方法研究。通过对网络通信端口流量的统计特征(流量的大小、流量的方向、流量的协议类型)进行分... 由于网络通信端口流量状态具有实时更新的特征,导致异常值捕获的难度较大,为此,提出基于多标签分类算法的网络通信端口流量异常值快速捕获方法研究。通过对网络通信端口流量的统计特征(流量的大小、流量的方向、流量的协议类型)进行分析和计算,为每个网络通信端口生成一组具有代表性的标签,利用GCN学习一组相互依赖的网络通信端口流量数据标签分类器,设计对应的分类器的输入由节点以及标签相关矩阵构成,具体的节点表示形式为网络通信端口流量数据标签的特征向量,网络通信端口流量数据标签对的出现次数作为建立相关矩阵的执行基础,分类器输出使用网络通信端口流量数据标签共现矩阵对应的条件概率矩阵为空时,确定此时的网络通信端口流量数据为异常值。在测试结果中,对端口流量异常值捕获结果的ACC始终稳定在0.85以上,对端口流量异常值捕获结果的F1-score始终稳定在0.83以上,与对照组的测试结果相比,具有明显优势。 展开更多
关键词 多标签分类算法 网络通信端口流量异常值快速捕获 GCN学习 标签分类
下载PDF
基于Twitter签到数据的城市居民群体分类算法研究
2
作者 管千娇 王长硕 《现代计算机》 2024年第16期18-24,29,共8页
为实现基于社交媒体大数据的居民群体分类,引入自然语言处理(NLP)领域的标签潜在狄利克雷分布(Labeled LDA)模型。基于2014年芝加哥市的Twitter签到数据,使用LDA探索性分析提取先验信息。构建Labeled LDA,将城市居民分为五类:上班族、... 为实现基于社交媒体大数据的居民群体分类,引入自然语言处理(NLP)领域的标签潜在狄利克雷分布(Labeled LDA)模型。基于2014年芝加哥市的Twitter签到数据,使用LDA探索性分析提取先验信息。构建Labeled LDA,将城市居民分为五类:上班族、大学生及高校教职工、中小学生及教职工、市政工作人员和其他。实验结果表明,Labeled LDA的分类精度达到0.92,超过了支持向量机(SVM)0.87的分类精度。该算法有效地实现了居民群体分类,从而促进有针对性的服务制定。 展开更多
关键词 标签潜在狄利克雷分布(Labeled LDA) Twitter签到数据 居民群体分类 NLP算法
下载PDF
不确定数据分类的模糊随机森林算法 被引量:3
3
作者 丁恒兵 叶飞跃 《计算机工程与设计》 北大核心 2023年第11期3373-3379,共7页
实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树... 实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树构造模糊随机森林的模糊分类算法,既继承了模糊决策树对不确定数据分类的灵活性,又继承了随机森林的集成性、鲁棒性和随机性的优点。实验结果表明,对于不确定性数据分类问题,该算法性能优于现有的一些算法。 展开更多
关键词 不确定数据分类 模糊决策树 模糊随机森林 不确定离散化算法 区间数据 标签 概率分布函数
下载PDF
利用最近邻信息快速分类多标签数据 被引量:3
4
作者 乔健 田庆 《计算机工程与应用》 CSCD 北大核心 2011年第32期138-140,190,共4页
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签... 为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。 展开更多
关键词 最近邻 快速分类 多标签数据 快速多标签数据分类算法(fkmc)
下载PDF
基于多标签分类的传感器网络数据故障检测算法 被引量:1
5
作者 张振海 李士宁 +1 位作者 李志刚 左雪雯 《计算机应用研究》 CSCD 北大核心 2014年第12期3788-3791,3817,共5页
传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模。为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签Relief F和遗传算法的特征选择算法。... 传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模。为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签Relief F和遗传算法的特征选择算法。该方法将Relief F扩展成可以对特征子集进行评估的多标签Relief F,特征选择过程首先使用遗传算法搜索特征子集,然后使用多标签Relief F对特征子集进行评估。在三个多标签分类器上的实验结果表明,提出的特征选择算法可以显著地提升多标签分类器对传感器网络数据故障的检测性能。 展开更多
关键词 传感器网络 数据故障 多标签分类 RELIEFF 遗传算法
下载PDF
一种基于大脑情感学习的快速分类改进算法 被引量:2
6
作者 梅英 谭冠政 刘振焘 《电子学报》 EI CAS CSCD 北大核心 2017年第11期2663-2670,共8页
为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的... 为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的神经生物学原理建立,模拟了情感刺激在大脑短反射通路中被快速处理的过程.因此,基于BEL模型的网络运算速度快.进一步采用遗传算法优化BEL网络权值,提高其分类正确率.在UCI数据集上的对比实验结果表明,无论对于小样本还是大样本数据集,较其他分类算法,GA-BEL算法均有较高的分类正确率和计算效率. 展开更多
关键词 快速分类 大脑情感学习 遗传算法 数据
下载PDF
基于C4.5决策树算法构建学生画像模型的研究与实现
7
作者 代洪伟 梁文栊 +1 位作者 苏森 陈剑炜 《长江信息通信》 2024年第9期68-70,98,共4页
近年来,随着大数据分析技术的发展,用户画像技术日趋成熟,挖掘数据中的隐藏信息已经成了研究热门。文章参考用户画像技术,提出了一种基于C4.5决策树算法的学生画像建模方法。文章以广西大学计算机与电子信息学院的本科生为研究样本,搜... 近年来,随着大数据分析技术的发展,用户画像技术日趋成熟,挖掘数据中的隐藏信息已经成了研究热门。文章参考用户画像技术,提出了一种基于C4.5决策树算法的学生画像建模方法。文章以广西大学计算机与电子信息学院的本科生为研究样本,搜集学生们的行为数据制作数据集。该模型采用平均值填充法进行数据预处理,并将清洗完毕的数据投入训练模型进行调参,从而获得最后的测试模型。该模型能够按照三级标签体系将学生分类,准确率达到62.3%。最后该文对研究结果进行了分析总结,确定了未来的发展方向。 展开更多
关键词 数据分析 用户画像 学生画像 C4.5决策树算法 标签体系 学生分类
下载PDF
改进词向量和kNN的中文文本分类算法 被引量:9
8
作者 丁正生 马春洁 《现代电子技术》 2022年第1期100-103,共4页
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBO... 为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。 展开更多
关键词 中文文本分类 文本向量化 快速kNN算法 词向量 双通道CBOW模型 特征向量 数据分类
下载PDF
基于公安大数据的人员背景标签应用分析与研究 被引量:1
9
作者 朱振华 于晓昀 李超 《电脑知识与技术》 2018年第7X期28-30,共3页
通过对公安大数据的标签体系分类方法及技术路线的研究,利用基础属性标注、统计、模型算法及大数据分析等技术,将公安业务对象实体形成属性标签、统计分析标签和模型算法标签,实现了在大数据业务场景下,对公安工作对象的背景标签从分类... 通过对公安大数据的标签体系分类方法及技术路线的研究,利用基础属性标注、统计、模型算法及大数据分析等技术,将公安业务对象实体形成属性标签、统计分析标签和模型算法标签,实现了在大数据业务场景下,对公安工作对象的背景标签从分类方法、标签生成、标签管理、标签应用等一整套解决方案,并提供了Rest风格的查询接口供其他系统进行展示,有效地推动公安数据跨地区、跨部门、跨警种的共享共用,促进了公安业务模型向智能化、自动化方向发展,发现和预测工作对象内在的特征,进行人员预警管控和风险评估. 展开更多
关键词 公安大数据 背景标签 标签分类 模型算法
下载PDF
改进的结合密度聚类的SVM快速分类方法 被引量:5
10
作者 张珍珍 董才林 +1 位作者 陈增照 何秀玲 《计算机工程与应用》 CSCD 北大核心 2011年第2期136-138,共3页
针对SVM在对大规模数据分类时求解规模过大的问题,提出了一种缩减数据集以提高训练速度的方法。该算法的第一步利用基于密度的方法大致定位能代表某个局域的质点,然后用SVM训练缩减后的数据得到一组支持向量,第二步的训练数据由支持向... 针对SVM在对大规模数据分类时求解规模过大的问题,提出了一种缩减数据集以提高训练速度的方法。该算法的第一步利用基于密度的方法大致定位能代表某个局域的质点,然后用SVM训练缩减后的数据得到一组支持向量,第二步的训练数据由支持向量以及其所代表的样本点构成。仿真实验证明该算法在保证分类准确率的情况下能有效地提高分类速度。 展开更多
关键词 密度聚类 SVM算法 快速分类 数据
下载PDF
ML-kNN算法在大数据集上的高效应用 被引量:5
11
作者 陆凯 徐华 《计算机工程与应用》 CSCD 北大核心 2019年第1期84-88,共5页
k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-kNN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分为几个不同的部分,然后在每一个部分中使用ML-k NN算法,并在四... k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-kNN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分为几个不同的部分,然后在每一个部分中使用ML-k NN算法,并在四个规模不同的数据集上进行了一系列实验。实验结果表明,基于此思想的ML-kNN算法不论在精度、性能还是效率上都略胜一筹。 展开更多
关键词 多标签分类 ML-kNN算法 聚类 数据
下载PDF
基于节点映射与标签数据构建的链接预测方法 被引量:6
12
作者 周娅 杨邦 《计算机工程与设计》 北大核心 2020年第2期373-380,共8页
为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机... 为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机制的随机游走方法获得节点环境序列,将源网络信息转换成向量表示,在此基础上生成标签数据集,使用带sigmoid核映射方法的SVM模型进行二分类预测。实验结果表明,算法在Facebook数据集上较Node2Vec方法AUC值提高了2.47%,在其它数据集上也有可观测的优势。同时,结合二分类思想的方法,其能明确度量不存在链接关系的数据。 展开更多
关键词 链接预测 节点映射 网络表示学习 标签数据构建 分类算法
下载PDF
基于分类规则挖掘的数据多标记特征分层识别 被引量:3
13
作者 朱方娥 郭建方 曹丽娜 《计算机仿真》 北大核心 2021年第4期310-314,共5页
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,... 面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别。结果表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴。 展开更多
关键词 分类规则挖掘 多标签数据 数据降维处理 多标记特征选择 分层识别方法 免疫算法
下载PDF
改进RAkEL分类算法的多功能酶分类预测
14
作者 皮赛奇 刘干 《软件导刊》 2021年第7期34-37,共4页
利用多标签机器学习对多功能蛋白质进行分类预测是目前比较好的方法。随机k标签分类算法(RAkEL)采用将所有标签按k长度随机划分进行分类预测。虽然该方法考虑到了标签之间的相关性,但是随机k标签划分时会产生大量冗余标签,增加了分类器... 利用多标签机器学习对多功能蛋白质进行分类预测是目前比较好的方法。随机k标签分类算法(RAkEL)采用将所有标签按k长度随机划分进行分类预测。虽然该方法考虑到了标签之间的相关性,但是随机k标签划分时会产生大量冗余标签,增加了分类器计算量。对传统的随机k标签分类学习算法进行改进,加入Apriori算法对标签进行关联规则挖掘,将得到的关联规则进行标签划分,然后运用集成LP算法进行模型训练,从而得到最终模型,最后以最终模型进行标签分类预测。运用改进的多标签分类学习算法对多功能酶(一种多功能蛋白质)进行分类预测,并与传统的多标签分类学习算法进行效果比较,改进后的多标签分类器在相关指标上能取得较好优势,其中平均精度(AP)可达92.03%。 展开更多
关键词 多标签分类 APRIORI算法 数据挖掘 多功能酶
下载PDF
多维数据复合下QUEST决策树遥感影像分类——以九江市为例 被引量:3
15
作者 蔡兴飞 林爱文 赵珍珍 《测绘地理信息》 2018年第2期38-42,共5页
遥感影像分类是信息提取的关键技术,融合多种类型的数据可以提高影像的解译能力。以九江市Landsat 5TM影像为实验对象,采用多维数据复合下快速、无偏、高效统计树(quick unbiased efficient statistical tree,QUEST)算法的决策树分类... 遥感影像分类是信息提取的关键技术,融合多种类型的数据可以提高影像的解译能力。以九江市Landsat 5TM影像为实验对象,采用多维数据复合下快速、无偏、高效统计树(quick unbiased efficient statistical tree,QUEST)算法的决策树分类方法,综合影像的光谱特征、地理信息数据和影像分类结果,根据样本数据自动挖掘分类规则,实现影像解译,并将分类结果和普通的QUEST决策树分类进行定量比较分析。结果表明:(1)采用多维数据复合下QUEST决策树分类的总精度和Kappa系数分别为89.83%和0.872,较普通的QUEST决策树分类方法有较大提高;(2)在地物类型丰富的区域,多维数据复合下QUEST决策树分类方法适应性更好;(3)选用SVM(support vector machine)分类结果作为辅助数据,滩地和水库坑塘的用户精度提高最为明显,分别提高了29.96%和17.08%。 展开更多
关键词 多维数据 快速、无偏、高效统计树算法的决策树 分类精度 影像分类
原文传递
《微计算机应用》2007年总目录
16
《微计算机应用》 2007年第12期1339-1344,共6页
关键词 分布式渲染 三维表面重建 高速数据采集系统 检索算法 企业应用集成 边缘检测 算法研究 挖掘方法 矢量量化 侯朝焕 图像分类 快速算法 微计算机应用 挖掘算法 软件设计 软件工程 关联规则挖掘 目录 检索工具
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部