期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于改进互信息的特征提取的文本分类系统 被引量:2
1
作者 郭飞 张先君 叶俊 《四川理工学院学报(自然科学版)》 CAS 2008年第3期93-96,共4页
文章提出并实现了一种改进互信息的特征提取和支持朴素贝叶斯的文本分类系统,改进的互信息算法加强了负值单词的互信息值,弥补了原来互信息预处理算法的不足,从而提高了分类精度.实验结果表明本算法和系统具有较高的分类准确率。
关键词 文本分类 特征提取 改进互信息 朴素贝叶斯
下载PDF
一种改进的互信息特征选取预处理算法 被引量:12
2
作者 卢新国 林亚平 陈治平 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第1期104-107,共4页
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息... 讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度. 展开更多
关键词 互信息 改进互信息 特征选取 文本分类
下载PDF
文本分类中改进的互信息特征选择方法研究
3
作者 罗勇 《福建电脑》 2009年第4期82-83,共2页
特征选择是文本分类的重要环节,评估函数直接影响特征选择的质量,互信息是几种常用的评估函数之一,也是一种分类精度相对较低的特征选择方法。本文在分析传统互信息方法缺陷的基础上,提出了一个改进方案,改进了互信息的计算公式,在其中... 特征选择是文本分类的重要环节,评估函数直接影响特征选择的质量,互信息是几种常用的评估函数之一,也是一种分类精度相对较低的特征选择方法。本文在分析传统互信息方法缺陷的基础上,提出了一个改进方案,改进了互信息的计算公式,在其中引入了频度因子和分散度因子,并通过理论和实验证明了这一改进的有效性。 展开更多
关键词 文本分类 特征选择 评估函数 改进互信息
下载PDF
基于互信息的特征提取方法在中文法律案情文本分类中的改进及应用
4
作者 李文 王炜立 洪胜华 《科技广场》 2006年第11期94-95,共2页
本文主要论述了一种改进的基于互信息的特征提取方法及其在中文法律案情文本分类中的应用,文中给出了具体实现过程及实验数据。
关键词 文本分类 改进互信息方法 特征提取
下载PDF
基于互信息改进的VMD算法及管道泄漏信号降噪 被引量:7
5
作者 刘杰辉 陶卓 王桂梅 《现代电子技术》 2021年第1期53-57,共5页
为了消除供水管道泄漏信号的噪声,准确定位供水管道泄漏位置,提出将基于互信息优化的VMD算法应用于供水管道泄漏振动信号的降噪处理。在处理前期,根据泄漏信号幅频特性,确定泄漏信号特征频带,并通过分析各模态函数中心频率确定合适的分... 为了消除供水管道泄漏信号的噪声,准确定位供水管道泄漏位置,提出将基于互信息优化的VMD算法应用于供水管道泄漏振动信号的降噪处理。在处理前期,根据泄漏信号幅频特性,确定泄漏信号特征频带,并通过分析各模态函数中心频率确定合适的分解参数K。在处理后期引入作为各模态分量的评价指标,选择合适模态分量重构信号,并使用带通滤波器对重构信号进行滤波。经实验和实地测试表明该算法能有效提高定位精度。 展开更多
关键词 VMD算法 信号降噪 管道泄漏 互信息改进 漏点定位 信号重构
下载PDF
改进的文本特征选取算法研究 被引量:2
6
作者 朱世玲 郑彦 《计算机技术与发展》 2019年第5期66-69,共4页
特征选取的好坏决定了文本分类的准确度。文本特征选取通常有文档频率、互信息、信息增益、卡方统计量等方法。文中讨论了文档频率和互信息在特征选取时的缺点,基于这些缺点,提出了一种混合文档频率和互信息的改进算法。文档频率进行特... 特征选取的好坏决定了文本分类的准确度。文本特征选取通常有文档频率、互信息、信息增益、卡方统计量等方法。文中讨论了文档频率和互信息在特征选取时的缺点,基于这些缺点,提出了一种混合文档频率和互信息的改进算法。文档频率进行特征选取时会偏向选择高频词,而没有考虑到该词是否在类别间有区分度,所以提出通过计算词的文档频率的类别方差作为文档频率的权重来进行特征选取。互信息偏向选择低频词,也忽略了互信息值为负的那些特征作用,有些互信息为负的词反而包含更多的类别信息。所以对互信息的值取了绝对值来加强互信息为负的词的作用。通过对比DF、MI和改进的DFMI的实验结果,发现该算法在精度、召回率和F_1度量上都有所提高,验证了该方法的有效性。 展开更多
关键词 特征选取 互信息 文档频率 文本分类 改进互信息 改进文档频率
下载PDF
一种新的中文文本分类特征提取的研究 被引量:2
7
作者 郭飞 张永锋 《数学的实践与认识》 北大核心 2016年第12期125-129,共5页
特征提取是中文文本分类中的关键,传统的互信息算法没有考虑特征存在负值时,互信息量对分类的影响,因此削弱了这些特征在分类中的作用.首先提出一种改进的互信息算法,对特征和类的互信息量取绝对值的方法来克服这个缺点.然后实现了基于... 特征提取是中文文本分类中的关键,传统的互信息算法没有考虑特征存在负值时,互信息量对分类的影响,因此削弱了这些特征在分类中的作用.首先提出一种改进的互信息算法,对特征和类的互信息量取绝对值的方法来克服这个缺点.然后实现了基于传统互信息KNN算法和改进互信息FV-KNN算法的两种中文文本自动分类系统.最后实验结果表明改进互信息FV-KNN算法在分类准确率、分类招回率和分类速度上都有较大的提高. 展开更多
关键词 特征提取 互信息 改进互信息 KNN FV-KNN
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部