-
题名一种改进的贝叶斯逻辑回归核心集构建算法
被引量:2
- 1
-
-
作者
张士翔
李汪根
李童
朱楠楠
-
机构
安徽师范大学计算机与信息学院
-
出处
《计算机科学》
CSCD
北大核心
2019年第S11期98-102,共5页
-
基金
国家自然科学基金(111023)
高校领军人才引进与培育计划项目(051619)资助
-
文摘
随着互联网的高速发展,新型信息发布方式不断涌现,由此所产生的数据正以前所未有的速度“爆炸式”增长。如何处理和分析庞大的原始数据,并将之变成可用知识加以学习和利用,已成为国内外科学家和技术专家共同关注的重要课题。贝叶斯方法提供了丰富的分层模型、不确定的量化及预先的规范,因此其在大规模数据背景下的使用十分具有吸引力。限制迭代的二分K-means算法保留了近似标准二分K-means算法的聚类质量且拥有更高的计算效率,更适用于需要处理速度更快的大型数据集。针对原有核心集构建算法执行效率低的问题,对限制迭代的二分k-means算法进行改进,使其在保证聚类效果的情况下更快速地得到聚类结果并计算相关数据点权值,从而构建出核心集。实验证明,与原算法相比,改进后算法的计算效率更高,近似性能相近且在部分情况下近似效果更优。
-
关键词
核心集
限制迭代二分k-means
贝叶斯逻辑回归
大规模数据集
-
Keywords
Coresets
Limited-iteration bisecting k-means
Bayesian logistic regression
Large-scale dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-