期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于优化LM模糊神经网络的不均衡林业信息文本分类算法
被引量:
4
1
作者
陈宇
许莉薇
《中南林业科技大学学报》
CAS
CSCD
北大核心
2015年第4期27-32,59,共7页
为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不...
为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不均衡林业信息文本的精准与快速分类。实验结果表明该算法对少数类辨识准确率高,优于神经网络分类法以及SVM算法、模糊神经网络算法,为不均衡林业信息文本的分类提供了新思路。
展开更多
关键词
不均衡
文本
分类
算法
不均衡林业信息文本分类
优化LM模糊神经网络
分类
器
下载PDF
职称材料
基于高斯混合模型的林业信息文本分类算法
被引量:
3
2
作者
陈宇
许莉薇
《中南林业科技大学学报》
CAS
CSCD
北大核心
2014年第8期114-119,共6页
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维...
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
展开更多
关键词
林业
信息
文本
分类
高斯混合模型
参数估计
下载PDF
职称材料
不均衡数据集上文本分类的特征选择研究
被引量:
20
3
作者
徐燕
李锦涛
+2 位作者
王斌
孙春明
张森
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期58-62,共5页
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术.文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题.如何在不影响整体分类性能的基础上,提高稀有类别的分类效果是解决不均衡数据集问题的基本要求.从特征选择...
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术.文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题.如何在不影响整体分类性能的基础上,提高稀有类别的分类效果是解决不均衡数据集问题的基本要求.从特征选择的角度出发,提出选择具有较强类别信息的词条是提高稀有类别分类性能的关键.一般而言,具有较强类别信息的词条不是高频词,甚至有倾向于稀有词的趋势.提出了解决不均衡数据集问题的一个途径--构造形如DFICF的特征选择方法.在Reuters语料上进行实验,实验结果表明该特征选择方法的效果比IG,DF都要好,特别是在微平均指标上.从而表明该方法对稀有类别的分类效果有明显的改进.
展开更多
关键词
不均衡
数据集
特征选择
文本
分类
信息
检索
下载PDF
职称材料
一种改进的分类算法在不良信息过滤中的应用
被引量:
1
4
作者
刘志刚
杜娟
衣治安
《微计算机应用》
2011年第2期9-14,共6页
使用KNN(K Nearest Neighbor)分类算法进行不良文本信息过滤时,由于包含不良信息的样本不易获取,导致分类器预测结果严重倾向于多数类。为改善少数类过滤效果,从数据层的角度改进了传统的KNN算法:先将少数类样本聚类分组,再在每个聚类...
使用KNN(K Nearest Neighbor)分类算法进行不良文本信息过滤时,由于包含不良信息的样本不易获取,导致分类器预测结果严重倾向于多数类。为改善少数类过滤效果,从数据层的角度改进了传统的KNN算法:先将少数类样本聚类分组,再在每个聚类内部使用遗传交叉生成新样本,并验证其有效性,最终获取到各类别样本数量基本均衡的训练样本集合并训练KNN分类器。实验结果表明,本文的方法可有效识别不良文本。此方法同时适用于其他关注少数类分类精度的不均衡数据集分类问题。
展开更多
关键词
不均衡
数据集
样本生成
分类
不良
文本
信息
过滤
聚类
遗传交叉
下载PDF
职称材料
浅谈基于粗集理论的文本归类系统
5
作者
孟坛
张蓉
《河北工业科技》
CAS
2010年第6期414-416,共3页
文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算...
文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。
展开更多
关键词
粗集
林业
文本
信息
分类
APRIORI算法
下载PDF
职称材料
题名
基于优化LM模糊神经网络的不均衡林业信息文本分类算法
被引量:
4
1
作者
陈宇
许莉薇
机构
东北林业大学信息与计算机工程学院
出处
《中南林业科技大学学报》
CAS
CSCD
北大核心
2015年第4期27-32,59,共7页
基金
国家948项目(2011-4-04)
中央高校基本科研业务费专项资金项目(DL12CB02)
+3 种基金
黑龙江省教育厅科学技术研究项目(12513016)
黑龙江省博士后基金
黑龙江省自然科学基金项目(F201347)
哈尔滨市科技创新人才专项资金项目(2013RFQXJ100)
文摘
为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不均衡林业信息文本的精准与快速分类。实验结果表明该算法对少数类辨识准确率高,优于神经网络分类法以及SVM算法、模糊神经网络算法,为不均衡林业信息文本的分类提供了新思路。
关键词
不均衡
文本
分类
算法
不均衡林业信息文本分类
优化LM模糊神经网络
分类
器
Keywords
im-balanced text classification algorithm
uneven forestry information text classification
optimization LM fuzzy neural network
classifier
分类号
S757.3 [农业科学—森林经理学]
下载PDF
职称材料
题名
基于高斯混合模型的林业信息文本分类算法
被引量:
3
2
作者
陈宇
许莉薇
机构
东北林业大学信息与计算机工程学院
出处
《中南林业科技大学学报》
CAS
CSCD
北大核心
2014年第8期114-119,共6页
基金
国家948项目(2011-4-04)
中央高校基本科研业务费专项资金项目(DL12CB02)
+3 种基金
黑龙江省教育厅科学技术研究项目(12513016)
黑龙江省博士后基金
黑龙江省自然科学基金项目(F201347)
哈尔滨市科技创新人才专项资金项目(2013RFQXJ100)
文摘
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
关键词
林业
信息
文本
分类
高斯混合模型
参数估计
Keywords
forestry information
text classification
Gaussian mixture model
parametric estimation
分类号
S711 [农业科学—林学]
下载PDF
职称材料
题名
不均衡数据集上文本分类的特征选择研究
被引量:
20
3
作者
徐燕
李锦涛
王斌
孙春明
张森
机构
中国科学院计算技术研究所
华北电力大学
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期58-62,共5页
基金
国家自然科学基金项目(60473002,60603094)
北京市自然科学基金项目(4051004)
文摘
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术.文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题.如何在不影响整体分类性能的基础上,提高稀有类别的分类效果是解决不均衡数据集问题的基本要求.从特征选择的角度出发,提出选择具有较强类别信息的词条是提高稀有类别分类性能的关键.一般而言,具有较强类别信息的词条不是高频词,甚至有倾向于稀有词的趋势.提出了解决不均衡数据集问题的一个途径--构造形如DFICF的特征选择方法.在Reuters语料上进行实验,实验结果表明该特征选择方法的效果比IG,DF都要好,特别是在微平均指标上.从而表明该方法对稀有类别的分类效果有明显的改进.
关键词
不均衡
数据集
特征选择
文本
分类
信息
检索
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种改进的分类算法在不良信息过滤中的应用
被引量:
1
4
作者
刘志刚
杜娟
衣治安
机构
东北石油大学计算机与信息技术学院
出处
《微计算机应用》
2011年第2期9-14,共6页
文摘
使用KNN(K Nearest Neighbor)分类算法进行不良文本信息过滤时,由于包含不良信息的样本不易获取,导致分类器预测结果严重倾向于多数类。为改善少数类过滤效果,从数据层的角度改进了传统的KNN算法:先将少数类样本聚类分组,再在每个聚类内部使用遗传交叉生成新样本,并验证其有效性,最终获取到各类别样本数量基本均衡的训练样本集合并训练KNN分类器。实验结果表明,本文的方法可有效识别不良文本。此方法同时适用于其他关注少数类分类精度的不均衡数据集分类问题。
关键词
不均衡
数据集
样本生成
分类
不良
文本
信息
过滤
聚类
遗传交叉
Keywords
imbalanced data sets
generate samples
classify
malicious text
information filtering
clustering
genetic crossover
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
浅谈基于粗集理论的文本归类系统
5
作者
孟坛
张蓉
机构
国家林业局昆明勘察设计院
出处
《河北工业科技》
CAS
2010年第6期414-416,共3页
文摘
文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。
关键词
粗集
林业
文本
信息
分类
APRIORI算法
Keywords
rough sets
text categorization
Apriori algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于优化LM模糊神经网络的不均衡林业信息文本分类算法
陈宇
许莉薇
《中南林业科技大学学报》
CAS
CSCD
北大核心
2015
4
下载PDF
职称材料
2
基于高斯混合模型的林业信息文本分类算法
陈宇
许莉薇
《中南林业科技大学学报》
CAS
CSCD
北大核心
2014
3
下载PDF
职称材料
3
不均衡数据集上文本分类的特征选择研究
徐燕
李锦涛
王斌
孙春明
张森
《计算机研究与发展》
EI
CSCD
北大核心
2007
20
下载PDF
职称材料
4
一种改进的分类算法在不良信息过滤中的应用
刘志刚
杜娟
衣治安
《微计算机应用》
2011
1
下载PDF
职称材料
5
浅谈基于粗集理论的文本归类系统
孟坛
张蓉
《河北工业科技》
CAS
2010
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部