期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
卡方统计中基于KL散度的高维文本数据特征筛选
被引量:
4
1
作者
甄志龙
张居晓
《统计与决策》
CSSCI
北大核心
2022年第17期43-46,共4页
特征的高维性和数据的稀疏性问题会严重影响分类的准确性,卡方统计可以在保持分类精度不变的情况下,有效地对高维文本数据特征进行筛选。文章通过KL散度检验观测值与理论值的偏差程度,用KL散度度量特征与类别之间的相关性,改进了现有的...
特征的高维性和数据的稀疏性问题会严重影响分类的准确性,卡方统计可以在保持分类精度不变的情况下,有效地对高维文本数据特征进行筛选。文章通过KL散度检验观测值与理论值的偏差程度,用KL散度度量特征与类别之间的相关性,改进了现有的最大或平均全局评价方法。采用KNN分类模型在标准数据集上进行实验的结果表明,所提方法在大幅度降低文本数据特征向量空间维数的同时,还能推动分类性能的提高。
展开更多
关键词
卡方统计
KL散度
高维文本数据
特征筛选
下载PDF
职称材料
题名
卡方统计中基于KL散度的高维文本数据特征筛选
被引量:
4
1
作者
甄志龙
张居晓
机构
通化师范学院计算机学院
南京特殊教育师范学院数学与信息科学学院
出处
《统计与决策》
CSSCI
北大核心
2022年第17期43-46,共4页
基金
国家自然科学基金资助项目(60673186)
江苏省高等学校自然科学研究重大项目(19KJA310002)
+1 种基金
江苏省高等学校自然科学研究项目(17KJD520006)
吉林省教育厅科学研究项目(JJKH20210533KJ)。
文摘
特征的高维性和数据的稀疏性问题会严重影响分类的准确性,卡方统计可以在保持分类精度不变的情况下,有效地对高维文本数据特征进行筛选。文章通过KL散度检验观测值与理论值的偏差程度,用KL散度度量特征与类别之间的相关性,改进了现有的最大或平均全局评价方法。采用KNN分类模型在标准数据集上进行实验的结果表明,所提方法在大幅度降低文本数据特征向量空间维数的同时,还能推动分类性能的提高。
关键词
卡方统计
KL散度
高维文本数据
特征筛选
Keywords
chi-squared statistics
KL divergence
high dimensional text data
feature screening
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
卡方统计中基于KL散度的高维文本数据特征筛选
甄志龙
张居晓
《统计与决策》
CSSCI
北大核心
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部