摘要
基于Spark分布式计算框架,采用Gibbs抽样方法研究分布式LDA主题模型挖掘方法。在Spark平台进行大规模数据集处理实验。
Based on spark distributed computing framework,we apply Gibbs sampling to study the distributed latent topic information(LDA)mining method.In Spark platform,experiment based on large data sets is carried.
出处
《长春工业大学学报》
CAS
2017年第3期265-269,共5页
Journal of Changchun University of Technology
基金
吉林省教育厅"十二五"科学技术研究基金资助项目(2014125
2014131)
吉林省自然科学基金资助项目(20130101060JC)