-
题名结合权重因子和特征向量改进的混合聚类方法
被引量:2
- 1
-
-
作者
董跃华
郭士串
-
机构
江西理工大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
2015年第11期264-268,共5页
-
基金
江西省研究生创新专项资金项目(YC2013-S198)
-
文摘
针对特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性,首先通过特征词权重因子(WF)和特征向量结合位置权重信息的方法进行文本预处理,在此基础上通过遗传控制因子(GCF)改进遗传K-均值文本聚类算法。在个体进行交叉和变异时,使用GCF对其进行控制,并对交叉和变异概率采用自适应控制,确保了优质个体顺利进入到下一代种群。实验表明,该研究不仅对特征词分类及其权重的有效计算作出改进,还使文本聚类精度得到提高。
-
关键词
文本聚类
权重因子
特征向量
遗传控制因子
遗传K-均值
-
Keywords
Text clustering
Weighting factor
Feature vector
Genetic control factor
Genetic k-means
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合权重因子与特征向量改进的文本聚类算法
被引量:1
- 2
-
-
作者
董跃华
郭士串
-
机构
江西理工大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2015年第4期1051-1057,共7页
-
基金
江西省研究生创新专项基金项目(YC2013-S198)
-
文摘
为解决特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性问题,提出一种包含文本预处理和改进算法的文本聚类方法。根据权重因子和特征向量进行文本预处理,更好体现文本间的差异性,通过遗传控制因子控制个体的交叉和变异,对交叉和变异概率采用自适应控制,确保优质个体顺利进入到下一代种群,体现遗传算法的全局优化能力和K-均值算法的高效局部搜索能力。实验结果表明,该方法使特征词分类精度得到提高,改善了文本聚类效果。
-
关键词
文本聚类
权重因子
特征向量
遗传K-均值
遗传控制因子
-
Keywords
text clustering weighting factor feature vector genetic K-means genetic control factor
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于离散载荷特征的即时通讯软件流量分类方法
- 3
-
-
作者
崔弘
蒋言
郭士串
汪洋
-
机构
烽火通信科技股份有限公司
-
出处
《网络空间安全》
2020年第8期28-33,共6页
-
基金
下一代网络处理器体系结构及关键技术研究(项目编号:2018YFB1800602)。
-
文摘
随着大数据时代到来,海量即时通讯软件流量分类成为解决网络拥塞、安全监管、网络异常检测等研究的基础。针对传统流量识别与分类技术准确率低、速率慢等问题,文章提出一种基于离散载荷特征的即时通讯软件流量分类技术。该技术通过对通讯软件报文数据进行五元组数据提纯,利用信息熵对载荷特征进行离散化,结合XGBoost构建通讯软件数据报文的二分类模型,同时将其效果与随机森林、SVM和朴素贝叶斯的方法做对比试验。结果表明,这种方法较传统流量分类方法准确率提高4.3%,与采用连续特征分类相比分类准确率提高2.3%,同时具有处理速度快、适用性广泛的特点。
-
关键词
信息熵
XGBoost
流量识别
五元组
离散载荷
-
Keywords
information entropy
XGBoost
flow identification
quintuple
discrete load
-
分类号
D90-052
[政治法律—法学理论]
-
-
题名基于Apriori-BP算法的团购推荐方法研究
- 4
-
-
作者
王峥
郭士串
-
机构
南京烽火星空通信发展有限公司
-
出处
《无线互联科技》
2018年第23期82-84,92,共4页
-
文摘
"网络团购"是一种越来越流行的电子商务模式,吸引了大量的商家和消费者,团购网站的商品展示方式和团购产品的推荐是很多团购网站迫切要解决的问题,传统的推荐算法多是使用与传统电子商务类似的协同过滤实现。文章提出了一种基于Apriori-BP算法的团购推荐模型,通过自定义数据清洗方法,使用Apriori算法和BP神经网络对商品进行评分和推荐,最后使用线上CTR和ROI对推荐结果进行评价和验证,显著提高了团购推荐商品的准确性。
-
关键词
团购
神经网络
关联规则
-
Keywords
group purchase
neural network
association rules
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP183
[自动化与计算机技术—控制理论与控制工程]
-