期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于IMI-WNB算法的垃圾邮件过滤技术研究 被引量:3
1
作者 刘洁 王铮 王辉 《计算机工程》 CAS CSCD 北大核心 2020年第12期299-304,312,共7页
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,... 互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维。针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响。实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性。 展开更多
关键词 互信息 垃圾邮件过滤 加权朴素贝叶斯算法 特征选择 词频
下载PDF
改进朴素贝叶斯模型在电力变压器故障定位中的应用 被引量:8
2
作者 范慧芳 咸日常 +3 位作者 王涛 高鸿鹏 陈蕾 张冰倩 《高压电器》 CAS CSCD 北大核心 2023年第2期190-197,共8页
电力变压器故障能否精准定位一直是制约其状态检修有效开展的技术瓶颈。文中针对目前已有故障定位模型存在的不足,借助变压器故障类型与特征状态量之间的内在关系,将朴素贝叶斯网络模型进行特征属性加权改进,并将其扩展为改进的双层朴... 电力变压器故障能否精准定位一直是制约其状态检修有效开展的技术瓶颈。文中针对目前已有故障定位模型存在的不足,借助变压器故障类型与特征状态量之间的内在关系,将朴素贝叶斯网络模型进行特征属性加权改进,并将其扩展为改进的双层朴素贝叶斯网络模型应用至电力变压器故障定位中。在这一过程中,考虑到特征属性与类别之间和各特征属性之间的依赖关系,采用ReliefF算法和相关系数法分别对特征属性进行加权处理,构造出改进的朴素贝叶斯网络模型,并在MATLAB软件中进行了诊断对比预测,得到了较好的预测结果,文中最后利用实际案例进一步验证了所提模型与分析方法的有效性,可为电力变压器故障诊断提供技术指导。 展开更多
关键词 电力变压器 朴素贝叶斯 属性加权 故障定位 RELIEFF算法
下载PDF
基于加权贝叶斯分类器的LTE接入网中间人攻击检测研究 被引量:1
3
作者 彭诚 范伟 +1 位作者 朱大立 杨芬 《信息网络安全》 CSCD 北大核心 2023年第2期1-10,共10页
由于LTE接入网的开放特性,任何人都可以访问其空中接口,因此很容易受到攻击者的控制并遭受网络攻击。其中,中间人攻击是典型的攻击方式之一。文章以检测LTE接入网的中间人攻击为研究目的,以较容易受到中间人攻击的接入过程为研究对象,... 由于LTE接入网的开放特性,任何人都可以访问其空中接口,因此很容易受到攻击者的控制并遭受网络攻击。其中,中间人攻击是典型的攻击方式之一。文章以检测LTE接入网的中间人攻击为研究目的,以较容易受到中间人攻击的接入过程为研究对象,分析信令和参数变化,并提取8个具有可识别性的特征。由于每个特征对分类结果的影响不同,因此文章利用遗传算法在组合优化问题上的优势,求解加权贝叶斯分类器的权值最优组合,改进加权参数的计算方法,从信令和日志角度提出了一种中间人攻击检测算法。文章将所提基于加权贝叶斯分类器的检测算法与常用中间人检测方法进行对比验证,结果表明,该算法在准确率和漏报率指标上明显优于其他算法。 展开更多
关键词 LTE接入网 中间人检测 加权的朴素贝叶斯 遗传算法
下载PDF
基于改进贝叶斯算法的黏滑振动等级评估研究
4
作者 邓杨林 李玉梅 +3 位作者 张涛 郭鹤 石广远 陈学勇 《石油机械》 北大核心 2023年第11期27-33,共7页
黏滑振动会导致钻井效率降低,是影响钻头和井下工具寿命的重要因素。为了评估黏滑振动严重程度,通过对井下近钻头测量参数与地面录井参数的综合分析,得到了衡量黏滑振动等级指标。通过对近钻头测量参数进行时频域分析,采用主成分分析法(... 黏滑振动会导致钻井效率降低,是影响钻头和井下工具寿命的重要因素。为了评估黏滑振动严重程度,通过对井下近钻头测量参数与地面录井参数的综合分析,得到了衡量黏滑振动等级指标。通过对近钻头测量参数进行时频域分析,采用主成分分析法(PCA),建立了一种基于差分演化算法的属性加权朴素贝叶斯(DE-AWNB)改进模型,在朴素贝叶斯分类算法中加入属性权重,通过属性加权法估计后验概率,利用差分演化算法寻找最优权重属性。试验结果表明,DE-AWNB算法的分类精度可达92.38%,收敛时间可达4.95 s。改进贝叶斯算法在黏滑振动等级评估工程应用上明显优于传统贝叶斯算法、随机森林法和遗传算法属性加权朴素贝叶斯(GA-AWNB)算法。将该模型应用于实际钻井工程,能够有效提高黏滑振动识别水平,提高钻井效率。 展开更多
关键词 黏滑振动 等级评估 差分演化算法 属性加权朴素贝叶斯 时频域分析 近钻头
下载PDF
基于朴素贝叶斯算法的信息过滤研究 被引量:2
5
作者 杜拓 方红 《信息与电脑》 2023年第9期90-92,共3页
随着信息量的快速增长,获取和筛选相关信息变得越来越重要。文章研究了基于朴素贝叶斯算法的信息过滤方法。首先,介绍了朴素贝叶斯算法的基本原理,包括贝叶斯定理、朴素贝叶斯分类器及该算法的优缺点。其次,探讨了朴素贝叶斯算法在信息... 随着信息量的快速增长,获取和筛选相关信息变得越来越重要。文章研究了基于朴素贝叶斯算法的信息过滤方法。首先,介绍了朴素贝叶斯算法的基本原理,包括贝叶斯定理、朴素贝叶斯分类器及该算法的优缺点。其次,探讨了朴素贝叶斯算法在信息过滤领域的应用,包括信息过滤的分类、文本表示方法、基于朴素贝叶斯的信息过滤模型构建。最后,通过实验评估了该方法在文本分类任务上的性能,包括不同特征表示方法的对比以及与其他分类算法的性能对比。实验结果表明,基于朴素贝叶斯算法的信息过滤具有较好的性能,可以有效分类不同主题的文本。 展开更多
关键词 朴素贝叶斯算法 信息过滤 文本分类 词袋模型 词频-逆文档频率(TF-IDF)权重计算
下载PDF
基于相关系数的加权朴素贝叶斯分类算法 被引量:32
6
作者 张明卫 王波 +1 位作者 张斌 朱志良 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第7期952-955,共4页
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有... 朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性. 展开更多
关键词 数据挖掘 分类算法 朴素贝叶斯 加权朴素贝叶斯 相关系数
下载PDF
基于粒子群的加权朴素贝叶斯入侵检测模型 被引量:7
7
作者 任晓奎 缴文斌 周丹 《计算机工程与应用》 CSCD 北大核心 2016年第7期122-126,共5页
针对传统朴素贝叶斯算法对高维复杂的入侵行为检测效率低下的状况,提出一种基于粒子群的加权朴素贝叶斯入侵检测模型。模型首先用粗糙集理论对样本属性特征集进行约简,再利用改进的粒子群算法优化加权朴素贝叶斯算法的属性权值,获得属... 针对传统朴素贝叶斯算法对高维复杂的入侵行为检测效率低下的状况,提出一种基于粒子群的加权朴素贝叶斯入侵检测模型。模型首先用粗糙集理论对样本属性特征集进行约简,再利用改进的粒子群算法优化加权朴素贝叶斯算法的属性权值,获得属性权值的最优解,用获得的最优解构造贝叶斯分类器完成检测。其中,改进的粒子群是采用权衡因子方法更新其速度和位置公式,避免产生局部最优。两种算法的结合,既能解决传统朴素贝叶斯算法的特征项冗余问题,同时也可以优化特征项间的强独立性问题。通过实验证实了该模型的实效性,提高了检测率。 展开更多
关键词 入侵检测 粗糙集理论 加权朴素贝叶斯 粒子群优化算法
下载PDF
改进NB算法在垃圾邮件过滤技术中的研究 被引量:6
8
作者 刘月峰 苑江浩 张晓琳 《微电子学与计算机》 CSCD 北大核心 2017年第4期115-120,共6页
朴素贝叶斯(NB)是一种简单高效的分类算法,且在垃圾邮件过滤中得到广泛应用,但是其属性间独立性的假设在一定程度上影响了分类效果.针对这一问题,提出一种改进的NB算法——FOA-NB算法.该算法将NB算法与果蝇优化算法(FOA)相结合,根据不... 朴素贝叶斯(NB)是一种简单高效的分类算法,且在垃圾邮件过滤中得到广泛应用,但是其属性间独立性的假设在一定程度上影响了分类效果.针对这一问题,提出一种改进的NB算法——FOA-NB算法.该算法将NB算法与果蝇优化算法(FOA)相结合,根据不同特征属性对分类的影响程度赋予不同的权值,通过FOA对权值进行优化,得到全局最优特征权向量,该算法在保留NB算法的简洁高效的优点的同时,通过权值优化获取更加具有决策性的特征属性,从而提高垃圾邮件过滤的正确率和召回率.通过仿真实验与NB算法、加权贝叶斯(WB)进行对比,结果表明FOA-NB算法使得垃圾邮件过滤效果得到明显改善,正确率和召回率均有所提高,且提高幅度约为5%. 展开更多
关键词 垃圾邮件 朴素贝叶斯 特征权重优化 果蝇优化算法
下载PDF
基于EM-PLS的加权朴素贝叶斯分类算法 被引量:1
9
作者 李雪莲 《重庆工商大学学报(自然科学版)》 2011年第1期22-25,共4页
朴素贝叶斯算法是一种简单而高效的分类算法,但是它的条件独立性假设和数据完备性要求,影响了其分类性能;在此提出了一种基于EM算法和偏最小二乘的加权朴素贝叶斯分类算法,实验结果验证了该算法的有效性。
关键词 加权朴素贝叶斯 EM算法 偏最小二乘
下载PDF
基于泊松分布的加权朴素贝叶斯文本分类算法 被引量:12
10
作者 赵博文 王灵矫 郭华 《计算机工程》 CAS CSCD 北大核心 2020年第4期91-96,共6页
朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对该问题,提出一种基于泊松分布的特征加权NB文本分类算法.结合泊松分布模型和NB算法,将泊松随机变量引入特... 朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对该问题,提出一种基于泊松分布的特征加权NB文本分类算法.结合泊松分布模型和NB算法,将泊松随机变量引入特征词权重,在此基础上定义信息增益率对文本特征词加权,削弱传统算法属性独立性假设造成的影响.在20-newsgroups数据集上的实验结果表明,与传统NB算法及其改进算法RwC-MNB和CFSNB相比,该算法可使文本分类的准确率、召回率和F1值得到提升,并且执行效率高于K-最近邻算法和支持向量机算法. 展开更多
关键词 文本分类 朴素贝叶斯算法 泊松分布 信息增益率 特征词权重
下载PDF
量子遗传算法优化加权朴素贝叶斯复合语言文本分类 被引量:4
11
作者 隆峻 神显豪 +1 位作者 丁小军 郭先春 《济南大学学报(自然科学版)》 CAS 北大核心 2022年第2期136-141,共6页
为了提高朴素贝叶斯算法的复合语言文本分类准确度和效率,将加权朴素贝叶斯算法用于复合语言文本分类,采用量子遗传算法对权重参数进行优化;根据贝叶斯定理建立语言文本分类模型,考查样本属性之间的差异对分类结果的影响;然后引入属性权... 为了提高朴素贝叶斯算法的复合语言文本分类准确度和效率,将加权朴素贝叶斯算法用于复合语言文本分类,采用量子遗传算法对权重参数进行优化;根据贝叶斯定理建立语言文本分类模型,考查样本属性之间的差异对分类结果的影响;然后引入属性权重,形成加权朴素贝叶斯文本分类模型;利用遗传算法对权重参数进行优化,借助量子比特运算提高遗传优化效率,最终得到稳定的复合语言文本分类模型。结果表明,通过合理设置权重个数,量子遗传算法改善了加权朴素贝叶斯算法的文本分类性能,与常用语言文本分类算法对比,该算法具有较高的分类精度和分类效率,在复合语言文本分类中的适用性好。 展开更多
关键词 量子遗传算法 加权朴素贝叶斯算法 复合语言文本 分类 量子比特
下载PDF
基于加权朴素贝叶斯的船舶轨迹分类算法 被引量:8
12
作者 王维刚 初秀民 +1 位作者 蒋仲廉 刘磊 《中国航海》 CSCD 北大核心 2020年第4期20-26,共7页
为实现船舶自动识别系统(Automatic Identification System,AIS)轨迹数据快速分类,提出一种基于加权朴素贝叶斯的船舶轨迹分类算法。通过船舶AIS数据预处理和轨迹特征分析,设计加权的朴素贝叶斯分类器,利用AIS数据进行训练;采用有监督... 为实现船舶自动识别系统(Automatic Identification System,AIS)轨迹数据快速分类,提出一种基于加权朴素贝叶斯的船舶轨迹分类算法。通过船舶AIS数据预处理和轨迹特征分析,设计加权的朴素贝叶斯分类器,利用AIS数据进行训练;采用有监督的分类方法提高分类效率,提出基于特征连续值的加权方法,构建船舶AIS分类加权最优特征集合,提高轨迹分类的准确率和速度。以长江中游武汉河段为例,进行试验验证。结果表明:AIS动态信息是重要的轨迹特征,提出的朴素贝叶斯船舶轨迹分类算法准确率达99.05%,相比未加权和其他常用分类算法表现更优;研究成果可应用于船舶异常轨迹识别和船舶航行风险分析等领域中。 展开更多
关键词 交通工程 船舶轨迹分类 朴素贝叶斯 AIS 特征加权
下载PDF
一种基于遗传算法的加权朴素贝叶斯分类算法 被引量:6
13
作者 保玉俊 周莉莉 段鹏 《云南民族大学学报(自然科学版)》 CAS 2018年第6期525-529,共5页
朴素贝叶斯算法因其分类精度高、模型简单等优点而被得到普遍应用,但因为它需要具备很强的属性之间的条件独立性假设,使得其在实际分类学习中很难实现.针对这个缺点,提出了一种基于遗传算法的加权朴素贝叶斯分类算法(G_WNB).该算法将遗... 朴素贝叶斯算法因其分类精度高、模型简单等优点而被得到普遍应用,但因为它需要具备很强的属性之间的条件独立性假设,使得其在实际分类学习中很难实现.针对这个缺点,提出了一种基于遗传算法的加权朴素贝叶斯分类算法(G_WNB).该算法将遗传算法(GA)与加权朴素贝叶斯分类算法(WNB)相结合,首先使用基于Rough Set的加权朴素贝叶斯分类算法,综合信息论与代数论给出的属性权值求解方法,计算出每个属性的权值,以初始权值作为初始种群,加权朴素贝叶斯的分类正确率为适应度函数,采用遗传算法优选,以使适应度函数最高的权值为数据集的最终权值,最后使用G_WNB进行分类.实验表明,该算法提高了分类准确率,同时提高了朴素贝叶斯分类器的性能. 展开更多
关键词 加权朴素贝叶斯 ROUGH集 属性重要度 遗传算法 适应度函数 分类
下载PDF
一种朴素贝叶斯分类增量学习算法 被引量:8
14
作者 罗福星 刘卫国 《微计算机应用》 2008年第6期107-112,共6页
朴素贝叶斯(Nave Bayes,NB)分类方法是一种简单而有效的概率分类方法,但是贝叶斯算法存在训练集数据不完备这个缺陷。传统的贝叶斯分类方法在有新的训练样本加入时,需要重新学习已经学习过的样本,耗费大量时间。为此引入增量学习算法,... 朴素贝叶斯(Nave Bayes,NB)分类方法是一种简单而有效的概率分类方法,但是贝叶斯算法存在训练集数据不完备这个缺陷。传统的贝叶斯分类方法在有新的训练样本加入时,需要重新学习已经学习过的样本,耗费大量时间。为此引入增量学习算法,算法在已有的分类器的基础上,自主选择学习新的文本来修正分类器。本文给出词频加权朴素贝叶斯分类增量学习算法思想及其具体算法,并对算法给予证明。通过算法分析可知,相比无增量学习的贝叶斯分类,本算法额外的空间复杂度与时间复杂度都在可接受范围。 展开更多
关键词 加权朴素贝叶斯 增量学习 分类算法 类置信度
下载PDF
Naive Bayes for value difference metric 被引量:3
15
作者 Chaoqun LI Liangxiao JIANG Hongwei LI 《Frontiers of Computer Science》 SCIE EI CSCD 2014年第2期255-264,共10页
The value difference metric (VDM) is one of the best-known and widely used distance functions for nominal attributes. This work applies the instance weighting technique to improve VDM. An instance weighted value dif... The value difference metric (VDM) is one of the best-known and widely used distance functions for nominal attributes. This work applies the instance weighting technique to improve VDM. An instance weighted value difference met- ric (IWVDM) is proposed here. Different from prior work, IWVDM uses naive Bayes (NB) to find weights for train- ing instances. Because early work has shown that there is a close relationship between VDM and NB, some work on NB can be applied to VDM. The weight of a training instance x, that belongs to the class c, is assigned according to the dif- ference between the estimated conditional probability P(c/x) by NB and the true conditional probability P(c/x), and the weight is adjusted iteratively. Compared with previous work, IWVDM has the advantage of reducing the time complex- ity of the process of finding weights, and simultaneously im- proving the performance of VDM. Experimental results on 36 UCI datasets validate the effectiveness of IWVDM. 展开更多
关键词 value difference metric instance weighting naive bayes distance-based learning algorithms
原文传递
一种基于TF-IDF的朴素贝叶斯算法改进 被引量:17
16
作者 许甜华 吴明礼 《计算机技术与发展》 2020年第2期75-79,共5页
目前对以朴素贝叶斯算法为代表的文本分类算法,普遍存在特征权重一致,考虑指标单一等问题。为了解决这个问题,提出了一种基于TF-IDF的朴素贝叶斯改进算法TF-IDF-DL朴素贝叶斯算法。该算法以TF-IDF为基础,引入去中心化词频因子和特征词... 目前对以朴素贝叶斯算法为代表的文本分类算法,普遍存在特征权重一致,考虑指标单一等问题。为了解决这个问题,提出了一种基于TF-IDF的朴素贝叶斯改进算法TF-IDF-DL朴素贝叶斯算法。该算法以TF-IDF为基础,引入去中心化词频因子和特征词位置因子以加强特征权重的准确性。为了验证该算法的效果,采用了搜狗实验室的搜狗新闻数据集进行实验,实验结果表明,在朴素贝叶斯分类算法中引入TF-IDF-DL算法,能够使该算法在进行文本分类中的准确率、召回率和F 1值都有较好的表现,相比国内同类研究TF-IDF-dist贝叶斯方案,分类准确率提高8.6%,召回率提高11.7%,F 1值提高7.4%。因此该算法能较好地提高分类性能,并且对不易区分的类别也能在一定程度上达到良好的分类效果。 展开更多
关键词 朴素贝叶斯 TF-IDF算法 去中心化 位置信息 特征权重
下载PDF
一种面向不平衡数据集的组合分类算法 被引量:1
17
作者 李韬 李平 《电脑与信息技术》 2017年第4期22-25,48,共5页
为了提高不平衡数据集中少数类的分类准确率,文章对组合分类算法进行了研究,提出了一种新的组合分类算法WDB。该算法采用决策树C4.5和朴素贝叶斯两种不同的分类器作为基分类器,选择精确度(precision)作为权值,根据不同的训练集,通过&qu... 为了提高不平衡数据集中少数类的分类准确率,文章对组合分类算法进行了研究,提出了一种新的组合分类算法WDB。该算法采用决策树C4.5和朴素贝叶斯两种不同的分类器作为基分类器,选择精确度(precision)作为权值,根据不同的训练集,通过"权值学习"的方式自动调整各基分类器的权值大小,然后,结合各基分类器的预测结果,利用加权平均法进行代数组合,构造出一种新的分类算法WDB。最后,以开放的不平衡数据集作为数据源,利用常见的性能评价指标进行实验验证。实验结果证明,在组合分类算法中引入"权值学习"能够发挥基分类器对于特定数据类型的分类优势,提高预测结果的准确率。WDB算法对不平衡数据集分类的性能优于决策树C4.5算法、朴素贝叶斯算法及随机森林算法,能够有效提升不平衡数据集中少数类的分类准确率。 展开更多
关键词 不平衡数据集 组合分类算法 加权平均法 决策树C4.5 朴素贝叶斯
下载PDF
加权朴素贝叶斯算法在消防检测中的应用 被引量:4
18
作者 童威 黄启萍 《西安工程大学学报》 CAS 2019年第1期111-115,共5页
针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Wek... 针对当前建筑物消防检测受干扰影响较大,导致火灾预测精度较低的问题,给出一种用于消防检测的改进朴素贝叶斯算法。基于消防检测数据分析,通过信息增益计算加权值,将特征属性附加权重系数对朴素贝叶斯算法进行改进,并在此基础上通过Weka平台,设计并实现了改进朴素贝叶斯算法框架,将其用于消防检测。实验验证,比较朴素贝叶斯算法和其他分类预测方法,改进的朴素贝叶斯算法能有效解决每个特征属性对类别变量影响的关联度量化问题,降低了分类干扰,提高了消防隐患检测准确率。 展开更多
关键词 消防检测 属性加权 朴素贝叶斯算法 信息增益 权重
下载PDF
基于二维信息增益加权的朴素贝叶斯分类算法 被引量:3
19
作者 任世超 黄子良 《计算机系统应用》 2019年第6期135-140,共6页
由于朴素贝叶斯算法的特征独立性假设以及传统TFIDF加权算法仅仅考虑了特征在整个训练集的分布情况,忽略了特征与类别和文档之间关系,造成传统方法赋予特征的权重并不能代表其准确性.针对以上问题,提出了二维信息增益加权的朴素贝叶斯... 由于朴素贝叶斯算法的特征独立性假设以及传统TFIDF加权算法仅仅考虑了特征在整个训练集的分布情况,忽略了特征与类别和文档之间关系,造成传统方法赋予特征的权重并不能代表其准确性.针对以上问题,提出了二维信息增益加权的朴素贝叶斯分类算法,进一步考虑到了特征的二维信息增益即特征类别信息增益和特征文档信息增益对分类效果的影响,并设计实验与传统的加权朴素贝叶斯算法相比,该算法在查准率、召回率、F1值指标性能上能提升6%左右. 展开更多
关键词 朴素贝叶斯 文本分类 特征加权 二维信息增益 加权算法
下载PDF
中文微博的立场判别研究 被引量:3
20
作者 刘勘 田宁梦 +2 位作者 王宏宇 林荣蓉 王德民 《知识管理论坛》 2017年第3期175-185,共11页
[目的/意义]提出一种以情感加权算法和朴素贝叶斯算法为基础的组合分类模型(SWNB模型),旨在对中文微博话题的立场进行判别。[方法/过程]该模型首先通过给定的复杂句模型对微博进行简化,然后依据情感规则得到情感权值,提取微博中与话题... [目的/意义]提出一种以情感加权算法和朴素贝叶斯算法为基础的组合分类模型(SWNB模型),旨在对中文微博话题的立场进行判别。[方法/过程]该模型首先通过给定的复杂句模型对微博进行简化,然后依据情感规则得到情感权值,提取微博中与话题相关的实体并进行优化,进而将微博分为包含立场和未表明立场(NONE)两类;再对包含立场的微博提取特征词,利用朴素贝叶斯算法将其立场判别为支持(FAVOR)或反对(AGAINST)。[结果/结论 ]实验结果表明,本模型有较好的立场判别精度,并能同时有效地处理中文复杂句式、话题相关评价对象以及上下文语境等复杂情形。 展开更多
关键词 中文微博 立场判别 情感加权算法 朴素贝叶斯
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部