期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于余弦相似度和实例加权改进的贝叶斯算法 被引量:9
1
作者 王行甫 付欢欢 王琳 《计算机系统应用》 2016年第8期166-170,共5页
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标.针对以上问题,提出了一种基于余弦相似度进行实例加权改进的... 面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标.针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法.算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类.基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率. 展开更多
关键词 实例加权 朴素贝叶斯 余弦相似度 逆文本频率 文本分类
下载PDF
MatchLink:一种主题爬行方法
2
作者 蒋宗礼 鲁国相 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第11期1227-1232,共6页
为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先... 为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先下载主题相关的页面,实验表明其结果好于BestFirst和BreadthFirst。 展开更多
关键词 主题爬行器 文档向量模型 朴素贝叶斯
下载PDF
一种面向自动化标检的文本分类方法
3
作者 郭泽 焦倩倩 《现代防御技术》 2020年第5期97-104,共8页
针对自动化标检中的段落文本分类问题,提出一种基于机器学习的改进朴素贝叶斯分类算法。该方法对朴素贝叶斯分类算法进行改进并作为分类器,采用遗传算法作为训练模型对分类器中的所有特征权重进行训练,并采用一种基于图表位置的修正算... 针对自动化标检中的段落文本分类问题,提出一种基于机器学习的改进朴素贝叶斯分类算法。该方法对朴素贝叶斯分类算法进行改进并作为分类器,采用遗传算法作为训练模型对分类器中的所有特征权重进行训练,并采用一种基于图表位置的修正算法优化分类结果。在实际的数据集中进行了实验,结果表明,该方法与传统KNN(K-nearest neighbor)算法和朴素贝叶斯算法相比具有更好的分类结果,能够有效的处理错误样本较多的情况,可大幅提升自动化标检的准确性。 展开更多
关键词 机器学习 文本分类 朴素贝叶斯 遗传算法 自动化标检
下载PDF
基于主观Bayes方法的渐进式中文文档分类 被引量:4
4
作者 汪保友 周益群 +1 位作者 周水庚 胡运发 《模式识别与人工智能》 EI CSCD 北大核心 2001年第4期470-475,共6页
本文介绍基于主观Bayes方法的渐进式中文文档分类。包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量,二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子... 本文介绍基于主观Bayes方法的渐进式中文文档分类。包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量,二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子集进行细分类,映射到次级类别中去,直到划分到最后的基类,三是选择文档属性时,采用相邻字对提取方法,某种程度可摆脱对复杂切词处理程序和庞大词库的依赖。 展开更多
关键词 渐进式中文文档分类 主观bayes方法 中文信息处理 人工神经网络
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部