期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合卡方统计和TF-IWF算法的特征提取和短文本分类方法
被引量:
12
1
作者
李昌兵
段祺俊
+1 位作者
纪聪辉
张婷婷
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第5期135-140,222,共7页
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1...
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。
展开更多
关键词
短文本
TF-IWF权重
特征提取
情感分类
下载PDF
职称材料
题名
融合卡方统计和TF-IWF算法的特征提取和短文本分类方法
被引量:
12
1
作者
李昌兵
段祺俊
纪聪辉
张婷婷
机构
重庆邮电大学经济管理学院
重庆邮电大学计算机科学与技术学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第5期135-140,222,共7页
基金
国家自然科学基金项目(60905066/F030707)。
文摘
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。
关键词
短文本
TF-IWF权重
特征提取
情感分类
Keywords
short-text
TF-IWF algorithm
feature selection
sentiment classification
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合卡方统计和TF-IWF算法的特征提取和短文本分类方法
李昌兵
段祺俊
纪聪辉
张婷婷
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021
12
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部