-
题名融合语义特征的加权朴素贝叶斯分类算法
被引量:6
- 1
-
-
作者
邱宁佳
贺金彪
薛丽娇
王鹏
赵建平
-
机构
长春理工大学计算机科学技术学院
-
出处
《计算机工程与设计》
北大核心
2020年第9期2523-2529,共7页
-
基金
吉林省科技发展计划技术攻关基金项目(20190302118GX)。
-
文摘
针对传统朴素贝叶斯算法属性独立性假设降低分类效果的问题,提出一种融合语义特征的加权朴素贝叶斯算法。在特征提取时引入Google距离衡量词语间语义相关性对节点权值进行重新计算;利用改进的NGD-TextRank算法提取数据集中关键特征,去除冗余属性进行降维;在分类过程中对不同特征项的影响程度进行划分,将特征项的权值融合到朴素贝叶斯公式中构造加权朴素贝叶斯分类算法。为验证算法性能,使用多类型数据集设计实验,与同类算法对比分析结果表明,该算法能够有效提取关键特征,经过加权处理后较好提高了文本分类的准确性。
-
关键词
Google距离
TextRank
Hellinger距离
权值优化
朴素贝叶斯
-
Keywords
Google distance
TextRank
Hellinger distance
weight optimization
naive Bayes
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进项目多属性类别划分的推荐算法
被引量:1
- 2
-
-
作者
邱宁佳
薛丽娇
贺金彪
王鹏
杨华民
-
机构
长春理工大学计算机科学技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第10期2932-2936,共5页
-
基金
吉林省科技发展计划技术攻关项目(20190302118GX):吉林省教育厅“十三五”科学技术项目(JJKH20190600KJ)。
-
文摘
针对传统度量相似性方法中忽略项目多属性类别差异的问题,提出一种改进项目多属性类别划分的推荐算法。首先构建项目—用户隶属矩阵挖掘用户间的隶属关系,并创建相似邻居FP-Tree以提取最近邻居集;然后分析用户间共同项目相似性和项目多属性类别划分的差异性,通过权重因子将共同项目和多属性类别融合,构建CNB度量模型度量邻居相似程度;最后对所得相似用户进行降序排列,获取更加精准的相似用户,完成推荐工作。结合医药数据集验证该算法的有效性,结果表明其时间复杂度、推荐准确性和平均精度均值均有较好的提升。
-
关键词
隶属矩阵
FP-TREE
多属性类别
CNB模型
-
Keywords
membership matrix
FP-Tree
multi-attribute categories
cos naive Bayes model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于PSO的支持向量机改进算法研究
被引量:2
- 3
-
-
作者
邱宁佳
贺金彪
赵建平
李岩芳
-
机构
长春理工大学计算机科学技术学院
-
出处
《长春理工大学学报(自然科学版)》
2019年第3期120-127,共8页
-
基金
吉林省重大科技招标项目(20170203004GX)
吉林省省级产业创新专项资金项目(2017C051)
-
文摘
提出一种改进的PSO-SVM算法。首先在文本预处理时,针对互信息方法存在的低频特征词倚重,忽略了高频特征词的不足之处,引入了权重因子、类内和类间离散因子进行属性约简;然后基于支持向量机分类模型,以不同核函数相结合构造混合核函数,利用粒子群优化算法(PSO优化算法)迭代寻找全局最优参数组合,并以此参数构造混合核函数结合哈夫曼最优二叉树生成分类器。使用经典数据集对PSO-SVM算法进行性能分析,实验表明改进后的算法可以有效地减少冗余属性,降低计算复杂度并具有更高的准确率和召回率。
-
关键词
支持向量机
互信息
属性简约
PSO优化算法
权值优化
-
Keywords
support vector machine
mutual information
attribute
PSO optimization algorithm
weight optimization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-