期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于Boosting机制的Naive Bayesian文本分类器 被引量:3
1
作者 崔林 付克明 +1 位作者 石生树 宋瀚涛 《计算机工程与应用》 CSCD 北大核心 2005年第8期31-33,67,共4页
Naive Bayesian分类器是一种有效的文本分类方法,但由于具有较强的稳定性,很难通过Boosting机制提高其性能。因此用Naive Bayesian分类器作为Boosting的基分类器需要解决的最大问题,就是如何破坏Naive Bayesian分类器的稳定性。提出了3... Naive Bayesian分类器是一种有效的文本分类方法,但由于具有较强的稳定性,很难通过Boosting机制提高其性能。因此用Naive Bayesian分类器作为Boosting的基分类器需要解决的最大问题,就是如何破坏Naive Bayesian分类器的稳定性。提出了3种破坏Naive Bayesian学习器稳定性的方法。第一种方法改变训练集样本,第二种方法采用随机属性选择社团,第三种方法是在Boosting的每次迭代中利用不同的文本特征提取方法建立不同的特征词集。实验表明,这几种方法各有其优缺点,但都比原有方法准确、高效。 展开更多
关键词 BOOSTING naive bayesian CLASSIFIER 文本分类 文本挖掘 数据挖掘
下载PDF
朴素贝叶斯分类器的独立性假设研究 被引量:10
2
作者 范金金 刘鹏 《计算机工程与应用》 CSCD 北大核心 2008年第34期139-141,共3页
朴素贝叶斯分类器(NBC)是一种简洁而有效的分类模型。介绍了NBC模型的基本原理,并着重分析了该模型的独立性假设条件。在总结现有独立性假设研究的基础上,通过例子和实验分析得出结论:NBC模型的表现和独立性假设是否满足没有必然联系。
关键词 数据挖掘 朴素贝叶斯分类器 独立性假设
下载PDF
基于原型的EM朴素贝叶斯模型在直接营销中的应用 被引量:1
3
作者 吴陈 王万川 《计算机应用与软件》 CSCD 北大核心 2012年第9期178-181,194,共5页
针对连锁型零售企业直接营销中的问题,基于原型理论的挖掘模型选择方法,提出基于EM聚类朴素贝叶斯模型,通过实验证明了该模型在客户购买行为的预测性能上明显优于基于K-means聚类朴素贝叶斯模型和无聚类的朴素贝叶斯模型。最后,利用该... 针对连锁型零售企业直接营销中的问题,基于原型理论的挖掘模型选择方法,提出基于EM聚类朴素贝叶斯模型,通过实验证明了该模型在客户购买行为的预测性能上明显优于基于K-means聚类朴素贝叶斯模型和无聚类的朴素贝叶斯模型。最后,利用该模型检验了直接营销中的对新客户进行分类预测的有效性。 展开更多
关键词 数据挖掘 原型模型 EM聚类 朴素贝叶斯 直接营销
下载PDF
面向政务文本数据的事件级时空模型研究 被引量:1
4
作者 李小龙 尹涵 《江西科学》 2019年第6期958-963,988,共7页
随着互联网的广泛应用,聚集了海量的文本数据,内含丰富的时空信息。面向文本的时空信息挖掘成为当前地理信息科学(Geographical Information Science, GIS)的研究热点,不断涌现出各种以自然语言处理(Natural Language Processing, NLP)... 随着互联网的广泛应用,聚集了海量的文本数据,内含丰富的时空信息。面向文本的时空信息挖掘成为当前地理信息科学(Geographical Information Science, GIS)的研究热点,不断涌现出各种以自然语言处理(Natural Language Processing, NLP)技术为基础的挖掘方法。面向政务文本数据,对其进行事件级的时空模型建模,目的实现政务文本数据在事件级的简单分类、构建文本数据的结构化表达模型、探究事件级中时间空间的关系。实验证明,该模型对比之前的事件模型能更好地概括政务文本中的关键信息,针对于政务文本的结构化表达效果理想。 展开更多
关键词 时空信息模型 政务文本挖掘 非结构化数据 事件信息抽取
下载PDF
基于文本挖掘技术的客服投诉工单自动分类探讨 被引量:12
5
作者 李颢 张吉皓 《移动通信》 2017年第23期66-72,共7页
为了能更好地挖掘非结构化数据背后所蕴含的信息,发挥数据的价值,对文本挖掘技术进行了探讨。首先明确了文本挖掘及分类应用的总体实施路径,然后,以运营商的客服投诉工单作为基础数据,通过设计标签、构建文本挖掘模型等,初步实现了基于... 为了能更好地挖掘非结构化数据背后所蕴含的信息,发挥数据的价值,对文本挖掘技术进行了探讨。首先明确了文本挖掘及分类应用的总体实施路径,然后,以运营商的客服投诉工单作为基础数据,通过设计标签、构建文本挖掘模型等,初步实现了基于非结构化文本数据的投诉工单分类,并开展了应用实践,最后对文本挖掘技术的应用进行展望。 展开更多
关键词 文本挖掘 非结构化数据 朴素贝叶斯算法
下载PDF
基于贝叶斯分类算法的用户评论数据挖掘系统设计 被引量:4
6
作者 孙含笑 《现代计算机》 2021年第4期56-59,共4页
随着人工智能和大数据的蓬勃发展,传统的现场购物的方式已经被颠覆,电子购物逐渐成为人们生活不可或缺的一部分。电子购物不仅方便了消费者,而且电商平台也可以获得海量的非结构化文本数据,如商品描述、用户评论、用户咨询等,进而实现... 随着人工智能和大数据的蓬勃发展,传统的现场购物的方式已经被颠覆,电子购物逐渐成为人们生活不可或缺的一部分。电子购物不仅方便了消费者,而且电商平台也可以获得海量的非结构化文本数据,如商品描述、用户评论、用户咨询等,进而实现商品优化。但是电商平台所获得的信息繁冗复杂,数据量大且夹杂大量无效信息,如何从其中高效提取有效信息成为电商平台发展的掣肘所在。基于这一关键问题,一种全新的数据挖掘系统被提出。以某知化妆品为案例,通过Python爬取其购物评论,利用WordCloud制作词云,从词云图捕捉客户对商品的满意度以及客户对商品的主要关注点。随后基于朴素贝叶斯分类算法对评论进行类别训练,并提取好差评评论中的敏感词汇,进而找到商品改进的突破点。 展开更多
关键词 非结构化文本数据 WordCloud 数据挖掘 朴素贝叶斯分类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部