期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于特征图像生成的Android恶意软件检测方法 被引量:1
1
作者 陈非 曹晓梅 王少辉 《计算机技术与发展》 2023年第6期125-132,共8页
目前的传统机器学习方法在Android恶意软件检测上存在特征分布不平衡、检测准确率偏低的问题。针对于此,该文提出一种基于特征图像生成的Android恶意软件检测方法。该方法首先采用特征匹配的方法提取APK文件的权限、API、操作码作为特征... 目前的传统机器学习方法在Android恶意软件检测上存在特征分布不平衡、检测准确率偏低的问题。针对于此,该文提出一种基于特征图像生成的Android恶意软件检测方法。该方法首先采用特征匹配的方法提取APK文件的权限、API、操作码作为特征,并使用改进的FPGrowth算法挖掘各特征的频繁特征项集,以获取有效特征;再利用降噪自编码器(DAE)抽取特征信息和转换特征向量维度,将各特征对应的特征向量转换成单通道图像并在通道维度进行拼接,生成RGB特征图像用于训练和分类;最后构建BaggingCNN分类算法,其集成了多个不同的卷积神经网络(CNN)算法,这些算法均在采用Bootstrap抽样构造的多个子训练集上进行训练,得到若干个子分类器,这些子分类器将用来对表示APK文件的特征图像进行检测,并采取多数投票机制得到最终的检测结果。实验结果表明,该方法生成的特征图像具有较好的表征能力,有利于分类算法的收敛和准确度的提升;其检测准确率达到98.21%,可以有效地检测Android恶意软件。 展开更多
关键词 Android恶意软件 fpgrowth 降噪自编码器 特征图像 BaggingCNN
下载PDF
弱监督军事实体关系识别 被引量:3
2
作者 李煜甫 黄蔚 胡国超 《电子设计工程》 2018年第1期74-78,83,共6页
目前的实体关系识别方法,无法充分利用海量未标注军事文本中的潜在信息,并且在实体关系特征词提取方面并不完善。于是本文对实体关系描述词的特点进行了分析,提出了一种语义层面的弱监督军事实体关系识别技术。本方法采取Word2vec模型和... 目前的实体关系识别方法,无法充分利用海量未标注军事文本中的潜在信息,并且在实体关系特征词提取方面并不完善。于是本文对实体关系描述词的特点进行了分析,提出了一种语义层面的弱监督军事实体关系识别技术。本方法采取Word2vec模型和FPGrowth算法对海量未标注军事文本进行分析,从关联分析角度进行实体关系描述词提取,从语义相似角度进行关系词扩充,并提出一种浅层关系分类矩阵对实体关系进行分类。该方法在对1000篇军事文本测试中,取得了加权平均值F-Score为89.2%的效果。 展开更多
关键词 实体关系识别 弱监督 BOOTSTRAPPING Word2vec fpgrowth 浅层关系分类矩阵
下载PDF
改进的FP-growth算法及其在TE过程故障诊断中的应用 被引量:6
3
作者 李宏光 夏丽君 《北京工业大学学报》 CAS CSCD 北大核心 2016年第5期697-706,共10页
为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与... 为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与其支持度的映射,使算法的运行效率得到提高;其次,利用关键字筛选技术,把频繁项分成关键项表、非关键项表两部分,保证了最终获取的每条关联规则都是人们关注的有效信息;最后,根据频繁1-项集划分数据库子集并直接构造每一项的条件模式树,节省了内存空间.将UFP算法应用于Tenessee Eastman(TE)过程的故障诊断,通过与主成分分析(principal component analysis,PCA)、核主成分分析(kernel principal component analysis,KPCA)算法在多种故障下的诊断结果对比实验验证了算法的优越性. 展开更多
关键词 频繁模式增长(FP-growth)算法 关联规则 Tenessee Eastman(TE)过程 故障诊断
下载PDF
基于大数据技术的考勤数据分析 被引量:2
4
作者 冯晓龙 高静 《内蒙古农业大学学报(自然科学版)》 CAS 北大核心 2018年第4期80-85,共6页
校园大数据分析是目前大数据研究的重要领域,针对快速积累的高校学生考勤数据,传统的数据库技术以及数据分析手段已经不再适用,串行的计算方法很难在短时间内对大量的考勤数据给出分析结果,本文提出了一种基于Spark平台及相关技术进行... 校园大数据分析是目前大数据研究的重要领域,针对快速积累的高校学生考勤数据,传统的数据库技术以及数据分析手段已经不再适用,串行的计算方法很难在短时间内对大量的考勤数据给出分析结果,本文提出了一种基于Spark平台及相关技术进行考勤数据分析的方法。文中详细描述了数据并行处理的流程以及采用FPGrowth算法进行关联规则分析的方法,分析得到了学生课堂出勤率与课程安排的关联规则。并且比较了传统数据库技术与并行数据处理方式进行学生考勤数据分析的效率,该方法取得了较好的效果。 展开更多
关键词 大数据 关联规则 考勤分析 fpgrowth
原文传递
Parallel Incremental Frequent Itemset Mining for Large Data 被引量:5
5
作者 Yu-Geng Song Hui-Min Cui Xiao-Bing Feng 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第2期368-385,共18页
Frequent itemset mining (FIM) is a popular data mining issue adopted in many fields, such as commodity recommendation in the retail industry, log analysis in web searching, and query recommendation (or related sea... Frequent itemset mining (FIM) is a popular data mining issue adopted in many fields, such as commodity recommendation in the retail industry, log analysis in web searching, and query recommendation (or related search). A large number of FIM algorithms have been proposed to obtain better performance, including parallelized algorithms for processing large data volumes. Besides, incremental FIM algorithms are also proposed to deal with incremental database updates. However, most of these incremental algorithms have low parallelism, causing low efficiency on huge databases. This paper presents two parallel incremental FIM algorithms called IncMiningPFP and IncBuildingPFP, implemented on the MapReduce framework. IncMiningPFP preserves the FP-tree mining results of the original pass, and utilizes them for incremental calculations. In particular, we propose a method to generate a partial FP-tree in the incremental pass, in order to avoid unnecessary mining work. Further, some of the incremental parallel tasks can be omitted when the inserted transactions include fewer items. IncbuildingPFP preserves the CanTrees built in the original pass, and then adds new transactions to them during the incremental passes. Our experimental results show that IncMiningPFP can achieve significant speedup over PFP (Parallel FPGrowth) and a sequential incremental algorithm (CanTree) in most cases of incremental input database, and in other cases IncBuildingPFP can achieve it. 展开更多
关键词 incremental parallel fpgrowth data mining frequent itemset mining MAPREDUCE
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部