期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
大规模文本数据的分类系统的设计与实现
1
作者 杨爱芹 《现代计算机》 2012年第17期7-11,共5页
云计算模式解决了大规模数据存储和计算能力上存在的瓶颈,为大规模数据挖掘技术提供了理想的计算模式和技术手段。分析Hadoop云计算平台的数据存储和计算模型,在云计算模式的基础上,实现云计算平台上Web文本数据的贝叶斯分类模型。对于... 云计算模式解决了大规模数据存储和计算能力上存在的瓶颈,为大规模数据挖掘技术提供了理想的计算模式和技术手段。分析Hadoop云计算平台的数据存储和计算模型,在云计算模式的基础上,实现云计算平台上Web文本数据的贝叶斯分类模型。对于大规模数据挖掘中的数据存储和计算的问题和难点,提出一种高效、低成本的解决方案。 展开更多
关键词 云计算 朴素贝叶斯 文本数据分类
下载PDF
基于语义的文本数据流概念漂移检测算法 被引量:5
2
作者 储光 胡学钢 张玉红 《计算机工程》 CAS CSCD 北大核心 2018年第2期24-30,共7页
文本数据流中概念的频繁漂移导致有效信息不足,从而使得漂移检测和数据流分类准确率下降。针对该问题,引入潜在狄利克雷分布模型并考虑文本数据流隐含的语义信息,提出一种新的概念漂移检测算法。计算相邻模块中词和主题特征空间的语义... 文本数据流中概念的频繁漂移导致有效信息不足,从而使得漂移检测和数据流分类准确率下降。针对该问题,引入潜在狄利克雷分布模型并考虑文本数据流隐含的语义信息,提出一种新的概念漂移检测算法。计算相邻模块中词和主题特征空间的语义相似度,其中主题的相似度根据主题-单词概率分布进行评估,当2个特征空间相似度都较低时判断为发生概念漂移。实验结果表明,与DDM、CDRDT、DWCDS、HDDM-W-Test和REDLLA算法相比,该算法对文本数据流中概念漂移的检测性能均有所提升,尤其在概念频繁漂移时可以显著减少漏检数量。 展开更多
关键词 概念漂移 语义 漂移检测 潜在狄利克雷分布模型 文本数据分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部