期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于偏最小二乘法的Logistic模型在文本分类中的应用
1
作者 王燕秋 田大钢 《商业经济》 2012年第2期30-32,共3页
鉴于文本分类具有高维性和高相关性的特点,已有文本分类研究采用能够有效降维和消除共线性的主成分Logistic模型。然而,这种模型定式在提取主成分时没有考虑解释变量与被解释变量之间的相关性,可能导致与文本分类关系密切的解释变量信... 鉴于文本分类具有高维性和高相关性的特点,已有文本分类研究采用能够有效降维和消除共线性的主成分Logistic模型。然而,这种模型定式在提取主成分时没有考虑解释变量与被解释变量之间的相关性,可能导致与文本分类关系密切的解释变量信息的丢失,从而削弱模型的分类能力。考虑到这一缺陷,在分析中引入偏最小二乘方法,并对20newsgroups语料库进行分类,结果显示,在高维分类时,其分类性能相对于主成分Logistic模型具有明显优势,表明这种方法用于文本分类的有效性。 展开更多
关键词 文本分类 偏最小二乘法 LOGISTIC回归 20newsgroups
下载PDF
基于中心抽样的KNN算法在文本分类中的应用 被引量:2
2
作者 肖绍武 王子牛 高建瓴 《贵州大学学报(自然科学版)》 2018年第1期78-81,共4页
文本分类是文本数据挖掘中的一个重要的内容,现阶段文本分类用到的主要算法有KNN,贝叶斯,神经网络等。KNN算法因为原理简单,分类效果较好,在文本分类中得到应用,但在数据量大时其运行效率上存在一定的局限性,本文提出一种基于中心抽样的... 文本分类是文本数据挖掘中的一个重要的内容,现阶段文本分类用到的主要算法有KNN,贝叶斯,神经网络等。KNN算法因为原理简单,分类效果较好,在文本分类中得到应用,但在数据量大时其运行效率上存在一定的局限性,本文提出一种基于中心抽样的KNN算法,并用20newsgroup数据集对其进行验证,在不影响准确率的情况下,提高了运行效率,取得了不错的效果。 展开更多
关键词 KNN 文本分类 中心抽样 20newsgroup
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部