期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
结合权重因子和特征向量改进的混合聚类方法 被引量:2
1
作者 董跃华 郭士串 《计算机应用与软件》 CSCD 2015年第11期264-268,共5页
针对特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性,首先通过特征词权重因子(WF)和特征向量结合位置权重信息的方法进行文本预处理,在此基础上通过遗传控制因子(GCF)改进遗传K-均值文本聚类算法。在个体进行交叉和变异... 针对特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性,首先通过特征词权重因子(WF)和特征向量结合位置权重信息的方法进行文本预处理,在此基础上通过遗传控制因子(GCF)改进遗传K-均值文本聚类算法。在个体进行交叉和变异时,使用GCF对其进行控制,并对交叉和变异概率采用自适应控制,确保了优质个体顺利进入到下一代种群。实验表明,该研究不仅对特征词分类及其权重的有效计算作出改进,还使文本聚类精度得到提高。 展开更多
关键词 文本聚类 权重因子 特征向量 遗传控制因子 遗传K-均值
下载PDF
结合权重因子与特征向量改进的文本聚类算法 被引量:1
2
作者 董跃华 郭士串 《计算机工程与设计》 北大核心 2015年第4期1051-1057,共7页
为解决特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性问题,提出一种包含文本预处理和改进算法的文本聚类方法。根据权重因子和特征向量进行文本预处理,更好体现文本间的差异性,通过遗传控制因子控制个体的交叉和变异,... 为解决特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性问题,提出一种包含文本预处理和改进算法的文本聚类方法。根据权重因子和特征向量进行文本预处理,更好体现文本间的差异性,通过遗传控制因子控制个体的交叉和变异,对交叉和变异概率采用自适应控制,确保优质个体顺利进入到下一代种群,体现遗传算法的全局优化能力和K-均值算法的高效局部搜索能力。实验结果表明,该方法使特征词分类精度得到提高,改善了文本聚类效果。 展开更多
关键词 文本聚类 权重因子 特征向量 遗传K-均值 遗传控制因子
下载PDF
基于离散载荷特征的即时通讯软件流量分类方法
3
作者 崔弘 蒋言 +1 位作者 郭士串 汪洋 《网络空间安全》 2020年第8期28-33,共6页
随着大数据时代到来,海量即时通讯软件流量分类成为解决网络拥塞、安全监管、网络异常检测等研究的基础。针对传统流量识别与分类技术准确率低、速率慢等问题,文章提出一种基于离散载荷特征的即时通讯软件流量分类技术。该技术通过对通... 随着大数据时代到来,海量即时通讯软件流量分类成为解决网络拥塞、安全监管、网络异常检测等研究的基础。针对传统流量识别与分类技术准确率低、速率慢等问题,文章提出一种基于离散载荷特征的即时通讯软件流量分类技术。该技术通过对通讯软件报文数据进行五元组数据提纯,利用信息熵对载荷特征进行离散化,结合XGBoost构建通讯软件数据报文的二分类模型,同时将其效果与随机森林、SVM和朴素贝叶斯的方法做对比试验。结果表明,这种方法较传统流量分类方法准确率提高4.3%,与采用连续特征分类相比分类准确率提高2.3%,同时具有处理速度快、适用性广泛的特点。 展开更多
关键词 信息熵 XGBoost 流量识别 五元组 离散载荷
下载PDF
基于Apriori-BP算法的团购推荐方法研究
4
作者 王峥 郭士串 《无线互联科技》 2018年第23期82-84,92,共4页
"网络团购"是一种越来越流行的电子商务模式,吸引了大量的商家和消费者,团购网站的商品展示方式和团购产品的推荐是很多团购网站迫切要解决的问题,传统的推荐算法多是使用与传统电子商务类似的协同过滤实现。文章提出了一种基... "网络团购"是一种越来越流行的电子商务模式,吸引了大量的商家和消费者,团购网站的商品展示方式和团购产品的推荐是很多团购网站迫切要解决的问题,传统的推荐算法多是使用与传统电子商务类似的协同过滤实现。文章提出了一种基于Apriori-BP算法的团购推荐模型,通过自定义数据清洗方法,使用Apriori算法和BP神经网络对商品进行评分和推荐,最后使用线上CTR和ROI对推荐结果进行评价和验证,显著提高了团购推荐商品的准确性。 展开更多
关键词 团购 神经网络 关联规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部