-
题名朴素贝叶斯算法的改进与应用
被引量:24
- 1
-
-
作者
赵文涛
孟令军
赵好好
王春春
-
机构
河南理工大学计算机科学与技术学院
河南省普通高等学校矿山信息化研究重点实验室
-
出处
《测控技术》
CSCD
2016年第2期143-147,共5页
-
基金
河南省科技攻关项目(142402210435)
河南省高等学校矿山信息化重点学科开放实验室开放基金项目(ky2012-02)
-
文摘
朴素贝叶斯算法是分类算法中最经典、最有影响的算法之一,但仍然存在一些不足之处。针对该算法中下溢问题,对算法基本公式进行了优化改进。针对NB算法中准确率问题,结合类别核心词思想和改进后的TFIDF算法,提出了一种基于类别核心词和改进型TFIDF的朴素贝叶斯CIT-NB算法。将改进后的算法应用于新闻数据集文本分类,实验结果表明,CIT-NB算法的分类性能明显优于原始朴素贝叶斯算法和基于TFIDF的分类算法。
-
关键词
朴素贝叶斯
下溢
核心关键词
TFIDF
文本分类
-
Keywords
naive Bayes
underflow
core words
TFIDF
text classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于节点内聚系数的局部社团发现算法
被引量:2
- 2
-
-
作者
赵文涛
赵好好
孟令军
-
机构
河南理工大学计算机科学与技术学院
河南省普通高等学校矿山信息化研究重点实验室
-
出处
《计算机应用与软件》
CSCD
2016年第12期270-274,共5页
-
基金
河南省科技攻关项目(142102210435)
河南省高等学校矿山信息化重点学科开放实验室开放基金项目(ky2012-02)
-
文摘
为了能够快速有效地发现复杂网络中的局部社团,提出一种基于节点内聚系数的局部社团发现算法。该算法选取最大度节点作为起始社团,不断搜索其邻居节点,将满足条件的节点不断加入起始社团从而形成新的社团。在不同规模的真实网络数据集和人工合成数据集上进行实验,并与其他三种局部社团发现算法进行社团划分效果的对比。实验结果表明,该算法能够在较短的运行时间内保持较高模块度来识别复杂网络中的局部社团结构,更适合于大规模复杂网络的社团结构挖掘。
-
关键词
局部社团
社团发现
复杂网络
节点内聚系数
-
Keywords
Local community
Community detecting
Complex network
Node cohesive clustering coefficient
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于相关拓扑势的社团发现算法
被引量:2
- 3
-
-
作者
赵文涛
赵好好
孟令军
-
机构
河南理工大学计算机科学与技术学院
河南省普通高等学校矿山信息化研究重点实验室
-
出处
《计算机应用与软件》
2017年第1期258-262,269,共6页
-
基金
河南省科技攻关计划项目(142102210435)
河南省高等学校矿山信息化重点学科开放实验室开放基金项目(ky2012-02)
-
文摘
针对传统算法社团划分精度较低以及模块度函数分辨率低的问题,提出一种基于相关拓扑势的社团发现算法,简称BITP算法。该算法考虑节点的相关性因素,引入相关拓扑势来衡量节点的影响力,寻找出其中的极大势值点,采用标签传播的思想对社团的规模进行控制。在人工合成网络和真实网络上,与多种算法进行实验对比,结果表明该算法多次运行结果相对稳定且社团划分精度较高。算法时间复杂度为O(n),且不需要先验知识,更适合大规模复杂网络上的社团结构挖掘。
-
关键词
社团结构
复杂网络
相关拓扑势
标签传播
-
Keywords
Community structure
Complex network
Interrelated topological potential
Label propagation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名分布式朴素贝叶斯算法在文本分类中的应用
被引量:2
- 4
-
-
作者
赵文涛
孟令军
赵好好
韩炳权
成亚飞
-
机构
河南理工大学计算机科学与技术学院
河南省普通高等学校矿山信息化研究重点实验室
河南理工大学测绘与国土信息工程学院
-
出处
《测控技术》
CSCD
2016年第6期50-55,共6页
-
基金
河南省科技攻关(142402210435)
河南省高等学校矿山信息化重点学科开放实验室开放基金项目(ky2015-05)
-
文摘
传统串行贝叶斯算法在对大规模数据进行分类时,性能较低下。为此,在TFIDF(词频-逆向文件频率)特征加权基础上,提出ICF(逆类别因子)类别加权因子,对传统贝叶斯分类模型进行改进。利用MapReduce并行计算框架在处理海量数据方面的优势,设计并实现了一种对TFIDF改进的分布式朴素贝叶斯文本分类算法。实验结果表明,与传统分布式朴素贝叶斯算法和TFIDF加权的分布式朴素贝叶斯算法相比,改进后的分类算法在查准率、查全率、F-measure等方面都有了较大提高。
-
关键词
MAPREDUCE框架
文本分类
朴素贝叶斯算法
-
Keywords
MapReduce framework
text classification
naive Bayes algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-