期刊文献+

基于特征降维的网络文本数据分析算法研究

原文传递
导出
摘要 由于网络数据大规模增长而导致文本数据的高维稀疏性,使得在对高校学生网络舆情分析时带来了巨大挑战。为解决该问题,本文在传统文档频率、互信息和卡方检验基础上,提出融合三种特征降维算法优化方法。首先在互信息算法中加入文档频率因子,解决低频词缺陷问题。然后,在卡方检验算法中加入标准评分因子来解决负相关问题。最后计算平均值,融合三种算法优点,提出一种新的改进降维算法。仿真结果表明,该算法对文本数据进行处理后,情感分析的准确率得到了提高并保持在95%以上。召回率90%以上,F值保持在92%~94%之间。在此区间上高于其他改进算法且趋于稳定,说明该算法在处理海量文本数据时,能够有效提高微博文本数据分析的准确率和效率。
出处 《网络安全技术与应用》 2022年第7期32-34,共3页 Network Security Technology & Application
基金 2021年云南省教育厅科学研究基金项目(2021J1086)。
  • 相关文献

参考文献5

二级参考文献56

共引文献147

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部