期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
57
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
江苏省国民经济主要指标的主成分分析
被引量:
18
1
作者
姚泽清
王衍波
《运筹与管理》
CSCD
2003年第3期58-62,共5页
本文透过2001年江苏省内13个省辖市的12项国民经济主要指标,使用主成分分析的方法,以87 5%的精度用两个新指标来代替原来的12个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而有效地将一个12维变量系统降至2维,并...
本文透过2001年江苏省内13个省辖市的12项国民经济主要指标,使用主成分分析的方法,以87 5%的精度用两个新指标来代替原来的12个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而有效地将一个12维变量系统降至2维,并利用第一主成分给出了这13个城市的综合经济实力的排序。
展开更多
关键词
江苏
国民经济
经济指标
主成分分析
综合经济实力
多元统计
经济发展
下载PDF
职称材料
西部十二省市区国民经济发展状况的实证分析
被引量:
2
2
作者
姚泽清
张倩
+1 位作者
蔡波
吕云
《运筹与管理》
CSCD
2008年第2期152-156,共5页
本文透过2005年中国西部12省、市、自治区的10项国民经济主要指标,使用主成分分析的方法[1],以94.12%的精度用两个新指标来代替原来的10个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而在力保数据信息丢失最少的...
本文透过2005年中国西部12省、市、自治区的10项国民经济主要指标,使用主成分分析的方法[1],以94.12%的精度用两个新指标来代替原来的10个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而在力保数据信息丢失最少的原则下有效地将一个10维变量系统降至2维,并利用第一主成分给出了西部12个省市区的综合经济实力的排序。
展开更多
关键词
数量经济学
降维
主成分分析
国民经济
下载PDF
职称材料
江苏省13城市国民经济主要指标的聚类分析
被引量:
3
3
作者
姚泽清
赵世玲
华中民
《解放军理工大学学报(自然科学版)》
EI
2003年第3期91-94,共4页
聚类分析是多元分析中研究“物以类聚”的一种方法 ,它在人们对社会、经济、技术系统的认识过程中有着广泛的应用。通过 2 0 0 1年江苏省 1 3个省辖市的 1 1项国民经济主要指标进行了排序处理 ,并在类与类的最小距离法下对各城市的经济...
聚类分析是多元分析中研究“物以类聚”的一种方法 ,它在人们对社会、经济、技术系统的认识过程中有着广泛的应用。通过 2 0 0 1年江苏省 1 3个省辖市的 1 1项国民经济主要指标进行了排序处理 ,并在类与类的最小距离法下对各城市的经济发展状况进行了聚类分析 ,将其划分为三大板块 ,在每一板块中又按同一模式细分为若干部分 ,并解释了此分类法的经济意义及各城市在江苏经济发展中的地位。
展开更多
关键词
国民经济
指标
聚类分析
下载PDF
职称材料
将素质教育贯穿于数学教学的始终
被引量:
7
4
作者
姚泽清
苏展
徐丹丹
《大学数学》
2011年第6期5-7,共3页
数学作为打开科学大门的钥匙,在素质教育中有着举足轻重的地位.本文通过几个典型案例,介绍了我们如何在数学教学的过程中贯彻素质教育的思想,以开发学员的学习潜能,启发学员的科学思维,调动学员的创造精神.
关键词
素质教育
数学教学
案例
下载PDF
职称材料
社会各阶层所关注的社会热点问题的聚类分析
被引量:
5
5
作者
姚泽清
《运筹与管理》
CSCD
2002年第2期111-116,共6页
本文透过社会各阶层对社会热点问题的看法 ,使用聚类分析的方法进行数据处理 ,在不同的平台高度上得到社会总体的二分、三分、四分、七分直至十分的分类法 。
关键词
社会热点问题
聚类分析
社会阶层
下载PDF
职称材料
定比回归法在价格指数预测中的应用
6
作者
姚泽清
赵世玲
《解放军理工大学学报(自然科学版)》
EI
2002年第1期90-92,共3页
为了解决各类统计方法在预测价格指数时精度普遍不高的问题 ,利用定比回归的思想 ,给出价格指数的一种具有较好精度和直接经济背景的预测方法 ,并在价格异常波动的年份通过修正回归直线的斜率的方式来得到修正的预测值 ,使人们在各种情...
为了解决各类统计方法在预测价格指数时精度普遍不高的问题 ,利用定比回归的思想 ,给出价格指数的一种具有较好精度和直接经济背景的预测方法 ,并在价格异常波动的年份通过修正回归直线的斜率的方式来得到修正的预测值 ,使人们在各种情况下都可以对价格指数的走向有一个较为明确的了解。这种方法 ,在预测各类增长指数型的指标时 。
展开更多
关键词
定比回归法
价格指数
预测
下载PDF
职称材料
文本分类中基于位置和类别信息的一种特征降维方法
被引量:
9
7
作者
刘海峰
王元元
+1 位作者
张学仁
姚泽清
《计算机应用研究》
CSCD
北大核心
2008年第8期2292-2294,共3页
从文本特征项所处的位置角度提出了特征项基于位置的降维方法;同时结合特征的类别分布进行了二次特征降维。这种基于位置和类别相结合的特征降维方法在最大程度减少信息损失的条件下,实现了特征维数的有效压缩。实验表明,该方法有较高...
从文本特征项所处的位置角度提出了特征项基于位置的降维方法;同时结合特征的类别分布进行了二次特征降维。这种基于位置和类别相结合的特征降维方法在最大程度减少信息损失的条件下,实现了特征维数的有效压缩。实验表明,该方法有较高的文本分类效率。
展开更多
关键词
文本分类
特征选择
特征降维
位置加权
类别分布
下载PDF
职称材料
文本分类中一种混合型特征降维方法
被引量:
11
8
作者
刘海峰
王元元
+1 位作者
姚泽清
张述祖
《计算机工程》
CAS
CSCD
北大核心
2009年第2期194-196,共3页
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度...
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。
展开更多
关键词
文本分类
特征选择
特征抽取
主成分分析
下载PDF
职称材料
基于词频的优化互信息文本特征选择方法
被引量:
13
9
作者
刘海峰
姚泽清
苏展
《计算机工程》
CAS
CSCD
2014年第7期179-182,共4页
互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分...
互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分布上的差异以及类内不同文本之间分布上的差异等角度,通过引入特征项的类内频数因子、类内位置分布因子以及类间分布因子,提出一种改进的MI文本特征选择方法,使得特征项的频数信息在MI模型中得到有效利用,合理改善互信息模型在文本特征选择方面的不足。文本分类实验结果表明,改进MI文本特征选择方法的平均准确率、召回率分别提高约5.2%及4.6%,平均综合评价指标值提高约4.9%,有效提高了模型的文本分类效率。
展开更多
关键词
文本分类
特征选择
互信息
特征频率
特征降维
类内分布
下载PDF
职称材料
文本分类中一种基于选择的二次特征降维方法
被引量:
8
10
作者
刘海峰
王元元
+1 位作者
姚泽清
陈琦
《情报学报》
CSSCI
北大核心
2009年第1期23-27,共5页
特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性,却很少考虑特征之间的冗余性问题,从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法,既考虑一些类...
特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性,却很少考虑特征之间的冗余性问题,从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法,既考虑一些类别信息较强的特征的选取,又减少一些类别判定方面的冗余特征,在尽量减少信息损失的前提下达到有效缩减特征维数的目的。对中文文本的分类实验结果表明,本文提出的特征降维方法在文本分类的准确率方面效果较好。
展开更多
关键词
文本分类
特征选择
互信息
期望交叉熵
下载PDF
职称材料
基于类别选择的改进KNN文本分类
被引量:
9
11
作者
刘海峰
张学仁
+1 位作者
姚泽清
刘守生
《计算机科学》
CSCD
北大核心
2009年第11期213-216,共4页
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能。提出了一种降维条件下基于类别的KNN改进模型,解决了k近邻选择时大类别、高密度样本占优问题。首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初...
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能。提出了一种降维条件下基于类别的KNN改进模型,解决了k近邻选择时大类别、高密度样本占优问题。首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初步判定,最后在压缩后的样本集上使用KNN分类器进行分类。试验结果表明,提出的改进分类模型提高了分类效率。
展开更多
关键词
K-最近邻
特征降维
特征选择
文本分类
下载PDF
职称材料
基于位置的文本特征加权方法研究
被引量:
9
12
作者
刘海峰
姚泽清
+1 位作者
汪泽焱
张学仁
《微电子学与计算机》
CSCD
北大核心
2009年第2期188-192,共5页
TF-IDF是文本特征赋权的常用方法.该方法简单易行,但没有考虑位置因素对特征赋权的影响.通过修改因子,分析不同条件下文本表现形式的差异,提出3个基于位置的文本特征加权方法.随后的文本分类试验表明,此加权模型相比较于传统的方法,均...
TF-IDF是文本特征赋权的常用方法.该方法简单易行,但没有考虑位置因素对特征赋权的影响.通过修改因子,分析不同条件下文本表现形式的差异,提出3个基于位置的文本特征加权方法.随后的文本分类试验表明,此加权模型相比较于传统的方法,均具有较好的文本标注效果.
展开更多
关键词
特征加权
位置加权
改进
文本分类
下载PDF
职称材料
文本分类中基于训练样本空间分布的K近邻改进算法
被引量:
9
13
作者
刘海峰
刘守生
姚泽清
《情报学报》
CSSCI
北大核心
2013年第1期80-85,共6页
KNN算法是文本分类中广泛应用的算法。作为一种基于实例的算法,训练样本的数量和分布位置影响KNN分类器分类性能。合理的样本剪裁以及样本赋权方法可以提高分类器的效率。提出了一种基于样本分布状况的KNN改进模型。首先基于样本位置...
KNN算法是文本分类中广泛应用的算法。作为一种基于实例的算法,训练样本的数量和分布位置影响KNN分类器分类性能。合理的样本剪裁以及样本赋权方法可以提高分类器的效率。提出了一种基于样本分布状况的KNN改进模型。首先基于样本位置对训练集进行删减以节约计算开销,然后针对类偏斜现象对分类器的赋权方式进行优化,改善k近邻选择时大类别、高密度训练样本的占优现象。试验结果表明,本文提出的改进KNN文本分类算法提高了KNN的分类效率。
展开更多
关键词
K最近邻
类偏斜
样本剪裁
文本分类
下载PDF
职称材料
文本分类中基于K-means的类偏斜KNN样本剪裁
被引量:
6
14
作者
刘海峰
姚泽清
+1 位作者
苏展
张学仁
《微电子学与计算机》
CSCD
北大核心
2012年第5期24-28,共5页
KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合...
KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能.
展开更多
关键词
K最近邻
类偏斜
样本剪裁
聚类
下载PDF
职称材料
文本分类中一种基于密度的KNN改进方法
被引量:
4
15
作者
刘海峰
汪泽焱
+1 位作者
姚泽清
刘守生
《情报学报》
CSSCI
北大核心
2009年第6期834-838,共5页
特征降维与分类算法的性能是文本自动分类的两个主要问题。KNN算法以其简单、有效、非参数特点常用于文本分类,但是训练文本分布的不均匀对KNN的分类效果产生负面影响,而在实际应用中训练文本分布不均是常见现象。本文针对这种分类环境...
特征降维与分类算法的性能是文本自动分类的两个主要问题。KNN算法以其简单、有效、非参数特点常用于文本分类,但是训练文本分布的不均匀对KNN的分类效果产生负面影响,而在实际应用中训练文本分布不均是常见现象。本文针对这种分类环境,首先提出了一种改进的tf-idf赋权方法用于特征降维,在此基础上进一步提出了一种基于密度的改进KNN方法用于文本分类,使处于样本点分布较密集区域的样本点之间的距离增大。随后的文本分类试验表明,本文提出的方法基于密度的KNN方法具有较好的文本分类效果。
展开更多
关键词
TF-IDF
文本分类
KNN算法
特征降维
下载PDF
职称材料
文本分类中基于核的非线性判别
被引量:
4
16
作者
刘海峰
姚泽清
+1 位作者
刘守生
王倩
《应用科学学报》
CAS
CSCD
北大核心
2008年第6期627-631,共5页
针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类...
针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类时线性可分性较差的问题.在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩.文本分类试验结果表明,这种非线性方法与无核的最大散度差方法相比,F1值提高了4.7%,具有明显的效率上的优势.
展开更多
关键词
文本分类
特征抽取
散度差
核变换
下载PDF
职称材料
一种基于特征聚类的文本分类模型研究
被引量:
2
17
作者
刘海峰
王元元
+1 位作者
姚泽清
王倩
《情报学报》
CSSCI
北大核心
2008年第2期224-228,共5页
借助特征聚类进行特征抽取是信息检索领域进行文本特征降维的重要手段之一。本文通过x^2统计和特征聚类相结合的模式,在尽量减少信息缺失的前提下两次对特征项维数进行压缩,通过分析特征的类别分布信息,实现了基于统计的特征降维;...
借助特征聚类进行特征抽取是信息检索领域进行文本特征降维的重要手段之一。本文通过x^2统计和特征聚类相结合的模式,在尽量减少信息缺失的前提下两次对特征项维数进行压缩,通过分析特征的类别分布信息,实现了基于统计的特征降维;进而在基于类别概率分布的模式下实现了文本的矩阵表示,借助矩阵范数进行文本分类。实验结果表明,该方法的分类效率较高。
展开更多
关键词
特征选择
特征聚类
Bayes分布
文本表示
文本分类
下载PDF
职称材料
NTRU中间距失败的概率分析及其影响
被引量:
2
18
作者
陈桂东
陈亦望
姚泽清
《计算机工程与设计》
CSCD
北大核心
2007年第14期3354-3356,共3页
NTRU是一种极有发展潜力的公钥密码体制,然而它的解密机制是不完善的,可能出现合法密文无法解密的现象,这严重影响了该体制的安全性。间距失败是导致解密失败的一个重要原因,对此,在=2相关多项式均为系数为0或1的二元多项式条件下,讨论...
NTRU是一种极有发展潜力的公钥密码体制,然而它的解密机制是不完善的,可能出现合法密文无法解密的现象,这严重影响了该体制的安全性。间距失败是导致解密失败的一个重要原因,对此,在=2相关多项式均为系数为0或1的二元多项式条件下,讨论了卷积系数的弱线性相关性,在此基础上对间距失败的概率计算进行了介绍和分析,得到了相关的计算公式,并介绍了一种利用间距失败对NTRU的攻击方法。
展开更多
关键词
公钥密码体制
安全性
间距失败
卷积
概率计算
下载PDF
职称材料
一种基于改进K-means聚类的文本特征选择模型
被引量:
2
19
作者
刘海峰
刘守生
+1 位作者
姚泽清
张学仁
《微电子学与计算机》
CSCD
北大核心
2009年第6期29-31,35,共4页
介绍了文本聚类中基于划分的方法,针对该算法对孤立点的过于敏感问题,提出了一种用于特征选择的算法改进模型,通过对特征集里孤立点的剔除改善了特征聚类效果.随后的文本分类试验表明,提出的改进的算法具有较好的特征选择效果,文本分类...
介绍了文本聚类中基于划分的方法,针对该算法对孤立点的过于敏感问题,提出了一种用于特征选择的算法改进模型,通过对特征集里孤立点的剔除改善了特征聚类效果.随后的文本分类试验表明,提出的改进的算法具有较好的特征选择效果,文本分类的效率较高.
展开更多
关键词
特征选择
特征降维
特征聚类
文本分类
下载PDF
职称材料
一种基于散度差组合型文本特征降维方法
被引量:
2
20
作者
刘海峰
姚泽清
+1 位作者
王元元
张述祖
《微电子学与计算机》
CSCD
北大核心
2008年第8期69-71,75,共4页
讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度...
讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.试验结果表明,这种方法在文本分类上的效率较好.
展开更多
关键词
文本分类
特征抽取
特征降维
散度差
下载PDF
职称材料
题名
江苏省国民经济主要指标的主成分分析
被引量:
18
1
作者
姚泽清
王衍波
机构
解放军理工大学理学院
解放军理工大学通信工程学院
出处
《运筹与管理》
CSCD
2003年第3期58-62,共5页
文摘
本文透过2001年江苏省内13个省辖市的12项国民经济主要指标,使用主成分分析的方法,以87 5%的精度用两个新指标来代替原来的12个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而有效地将一个12维变量系统降至2维,并利用第一主成分给出了这13个城市的综合经济实力的排序。
关键词
江苏
国民经济
经济指标
主成分分析
综合经济实力
多元统计
经济发展
Keywords
national economy
index
principal component analysis
分类号
F127.53 [经济管理—世界经济]
F224.7 [经济管理—国民经济]
下载PDF
职称材料
题名
西部十二省市区国民经济发展状况的实证分析
被引量:
2
2
作者
姚泽清
张倩
蔡波
吕云
机构
解放军理工大学理学院
出处
《运筹与管理》
CSCD
2008年第2期152-156,共5页
基金
国家自然科学基金资助项目(70571087)
文摘
本文透过2005年中国西部12省、市、自治区的10项国民经济主要指标,使用主成分分析的方法[1],以94.12%的精度用两个新指标来代替原来的10个指标,这两个新指标是原指标的线性组合,且彼此之间还是互不相关的,从而在力保数据信息丢失最少的原则下有效地将一个10维变量系统降至2维,并利用第一主成分给出了西部12个省市区的综合经济实力的排序。
关键词
数量经济学
降维
主成分分析
国民经济
Keywords
quantitative economics
dimension reduction
principal component analysis
national economy
分类号
F224 [经济管理—国民经济]
下载PDF
职称材料
题名
江苏省13城市国民经济主要指标的聚类分析
被引量:
3
3
作者
姚泽清
赵世玲
华中民
机构
解放军理工大学理学院
南京市城市社会调查局
解放军理工大学校务部
出处
《解放军理工大学学报(自然科学版)》
EI
2003年第3期91-94,共4页
文摘
聚类分析是多元分析中研究“物以类聚”的一种方法 ,它在人们对社会、经济、技术系统的认识过程中有着广泛的应用。通过 2 0 0 1年江苏省 1 3个省辖市的 1 1项国民经济主要指标进行了排序处理 ,并在类与类的最小距离法下对各城市的经济发展状况进行了聚类分析 ,将其划分为三大板块 ,在每一板块中又按同一模式细分为若干部分 ,并解释了此分类法的经济意义及各城市在江苏经济发展中的地位。
关键词
国民经济
指标
聚类分析
Keywords
national economy
index
cluster analysis
分类号
O212.4 [理学—概率论与数理统计]
下载PDF
职称材料
题名
将素质教育贯穿于数学教学的始终
被引量:
7
4
作者
姚泽清
苏展
徐丹丹
机构
解放军理工大学理学院
出处
《大学数学》
2011年第6期5-7,共3页
文摘
数学作为打开科学大门的钥匙,在素质教育中有着举足轻重的地位.本文通过几个典型案例,介绍了我们如何在数学教学的过程中贯彻素质教育的思想,以开发学员的学习潜能,启发学员的科学思维,调动学员的创造精神.
关键词
素质教育
数学教学
案例
Keywords
quality education
mathematics teaching
teaching case
分类号
G642 [文化科学—高等教育学]
下载PDF
职称材料
题名
社会各阶层所关注的社会热点问题的聚类分析
被引量:
5
5
作者
姚泽清
机构
解放军理工大学理学院
出处
《运筹与管理》
CSCD
2002年第2期111-116,共6页
文摘
本文透过社会各阶层对社会热点问题的看法 ,使用聚类分析的方法进行数据处理 ,在不同的平台高度上得到社会总体的二分、三分、四分、七分直至十分的分类法 。
关键词
社会热点问题
聚类分析
社会阶层
Keywords
social problem
cluster analysis
分类号
C91 [经济管理]
O212.4 [理学—概率论与数理统计]
下载PDF
职称材料
题名
定比回归法在价格指数预测中的应用
6
作者
姚泽清
赵世玲
机构
解放军理工大学理学院
南京市城市社会经济调查队
出处
《解放军理工大学学报(自然科学版)》
EI
2002年第1期90-92,共3页
文摘
为了解决各类统计方法在预测价格指数时精度普遍不高的问题 ,利用定比回归的思想 ,给出价格指数的一种具有较好精度和直接经济背景的预测方法 ,并在价格异常波动的年份通过修正回归直线的斜率的方式来得到修正的预测值 ,使人们在各种情况下都可以对价格指数的走向有一个较为明确的了解。这种方法 ,在预测各类增长指数型的指标时 。
关键词
定比回归法
价格指数
预测
Keywords
regression analysis
price index
predication
分类号
F726 [经济管理—产业经济]
O212.1 [理学—概率论与数理统计]
下载PDF
职称材料
题名
文本分类中基于位置和类别信息的一种特征降维方法
被引量:
9
7
作者
刘海峰
王元元
张学仁
姚泽清
机构
解放军理工大学指挥自动化学院
解放军理工大学理学院
出处
《计算机应用研究》
CSCD
北大核心
2008年第8期2292-2294,共3页
基金
国家自然科学基金资助项目(70571087)
文摘
从文本特征项所处的位置角度提出了特征项基于位置的降维方法;同时结合特征的类别分布进行了二次特征降维。这种基于位置和类别相结合的特征降维方法在最大程度减少信息损失的条件下,实现了特征维数的有效压缩。实验表明,该方法有较高的文本分类效率。
关键词
文本分类
特征选择
特征降维
位置加权
类别分布
Keywords
text categorization
feature selection
feature reduce
position weight
sort distribution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本分类中一种混合型特征降维方法
被引量:
11
8
作者
刘海峰
王元元
姚泽清
张述祖
机构
解放军理工大学指挥自动化学院
解放军理工大学理学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第2期194-196,共3页
基金
国家自然科学基金资助项目(70571087)
文摘
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。
关键词
文本分类
特征选择
特征抽取
主成分分析
Keywords
text classification
feature selection
feature extraction
Principle Component Analysis(PCA)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词频的优化互信息文本特征选择方法
被引量:
13
9
作者
刘海峰
姚泽清
苏展
机构
解放军理工大学理学院
出处
《计算机工程》
CAS
CSCD
2014年第7期179-182,共4页
基金
国家自然科学基金资助项目(71071161
61273209)
江苏省自然科学基金资助项目(BK2012511)
文摘
互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分布上的差异以及类内不同文本之间分布上的差异等角度,通过引入特征项的类内频数因子、类内位置分布因子以及类间分布因子,提出一种改进的MI文本特征选择方法,使得特征项的频数信息在MI模型中得到有效利用,合理改善互信息模型在文本特征选择方面的不足。文本分类实验结果表明,改进MI文本特征选择方法的平均准确率、召回率分别提高约5.2%及4.6%,平均综合评价指标值提高约4.9%,有效提高了模型的文本分类效率。
关键词
文本分类
特征选择
互信息
特征频率
特征降维
类内分布
Keywords
text classification
feature selection
Mutual Information(MI)
feature frequency
feature dimension reduction
distributionwithin class
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
文本分类中一种基于选择的二次特征降维方法
被引量:
8
10
作者
刘海峰
王元元
姚泽清
陈琦
机构
解放军理工大学
出处
《情报学报》
CSSCI
北大核心
2009年第1期23-27,共5页
基金
国家自然科学基金资助项目(编号:70571087).
文摘
特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性,却很少考虑特征之间的冗余性问题,从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法,既考虑一些类别信息较强的特征的选取,又减少一些类别判定方面的冗余特征,在尽量减少信息损失的前提下达到有效缩减特征维数的目的。对中文文本的分类实验结果表明,本文提出的特征降维方法在文本分类的准确率方面效果较好。
关键词
文本分类
特征选择
互信息
期望交叉熵
Keywords
text classification, feature selection, mutual information, expected cross entropy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于类别选择的改进KNN文本分类
被引量:
9
11
作者
刘海峰
张学仁
姚泽清
刘守生
机构
解放军理工大学理学院
出处
《计算机科学》
CSCD
北大核心
2009年第11期213-216,共4页
基金
国家自然科学基金项目(编号:70571087)资助
文摘
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能。提出了一种降维条件下基于类别的KNN改进模型,解决了k近邻选择时大类别、高密度样本占优问题。首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初步判定,最后在压缩后的样本集上使用KNN分类器进行分类。试验结果表明,提出的改进分类模型提高了分类效率。
关键词
K-最近邻
特征降维
特征选择
文本分类
Keywords
KNN, Feature reduction, Feature selection, Text categorization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于位置的文本特征加权方法研究
被引量:
9
12
作者
刘海峰
姚泽清
汪泽焱
张学仁
机构
解放军理工大学理学院
出处
《微电子学与计算机》
CSCD
北大核心
2009年第2期188-192,共5页
基金
国家自然科学基金项目(70571087)
文摘
TF-IDF是文本特征赋权的常用方法.该方法简单易行,但没有考虑位置因素对特征赋权的影响.通过修改因子,分析不同条件下文本表现形式的差异,提出3个基于位置的文本特征加权方法.随后的文本分类试验表明,此加权模型相比较于传统的方法,均具有较好的文本标注效果.
关键词
特征加权
位置加权
改进
文本分类
Keywords
feature weighting
position weighting
text classification
modified TF-IDF
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本分类中基于训练样本空间分布的K近邻改进算法
被引量:
9
13
作者
刘海峰
刘守生
姚泽清
机构
解放军理工大学理学院
出处
《情报学报》
CSSCI
北大核心
2013年第1期80-85,共6页
基金
国家自然科学基金资助项目(直觉模糊聚类理论及其应用,编号:71071161)
文摘
KNN算法是文本分类中广泛应用的算法。作为一种基于实例的算法,训练样本的数量和分布位置影响KNN分类器分类性能。合理的样本剪裁以及样本赋权方法可以提高分类器的效率。提出了一种基于样本分布状况的KNN改进模型。首先基于样本位置对训练集进行删减以节约计算开销,然后针对类偏斜现象对分类器的赋权方式进行优化,改善k近邻选择时大类别、高密度训练样本的占优现象。试验结果表明,本文提出的改进KNN文本分类算法提高了KNN的分类效率。
关键词
K最近邻
类偏斜
样本剪裁
文本分类
Keywords
K-nearest neighbor, category deflection, sample reducing, text categorization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本分类中基于K-means的类偏斜KNN样本剪裁
被引量:
6
14
作者
刘海峰
姚泽清
苏展
张学仁
机构
解放军理工大学理学院
出处
《微电子学与计算机》
CSCD
北大核心
2012年第5期24-28,共5页
基金
国家自然科学基金项目(71071161)
文摘
KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能.
关键词
K最近邻
类偏斜
样本剪裁
聚类
Keywords
K-nearest neighbor
category deflection
sample selection
clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本分类中一种基于密度的KNN改进方法
被引量:
4
15
作者
刘海峰
汪泽焱
姚泽清
刘守生
机构
解放军理工大学理学院
出处
《情报学报》
CSSCI
北大核心
2009年第6期834-838,共5页
基金
基金项目:国家自然科学基金资助项目(编号:70571087).
文摘
特征降维与分类算法的性能是文本自动分类的两个主要问题。KNN算法以其简单、有效、非参数特点常用于文本分类,但是训练文本分布的不均匀对KNN的分类效果产生负面影响,而在实际应用中训练文本分布不均是常见现象。本文针对这种分类环境,首先提出了一种改进的tf-idf赋权方法用于特征降维,在此基础上进一步提出了一种基于密度的改进KNN方法用于文本分类,使处于样本点分布较密集区域的样本点之间的距离增大。随后的文本分类试验表明,本文提出的方法基于密度的KNN方法具有较好的文本分类效果。
关键词
TF-IDF
文本分类
KNN算法
特征降维
Keywords
tf- idf
text classification
KNN algorithm
feature reduction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G633.7 [文化科学—教育学]
下载PDF
职称材料
题名
文本分类中基于核的非线性判别
被引量:
4
16
作者
刘海峰
姚泽清
刘守生
王倩
机构
解放军理工大学理学院
徐州工程学院
出处
《应用科学学报》
CAS
CSCD
北大核心
2008年第6期627-631,共5页
基金
国家自然科学基金资助项目(No.70571087)
文摘
针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类时线性可分性较差的问题.在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩.文本分类试验结果表明,这种非线性方法与无核的最大散度差方法相比,F1值提高了4.7%,具有明显的效率上的优势.
关键词
文本分类
特征抽取
散度差
核变换
Keywords
text categorization, feature extraction, scatter difference, kernel commutation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于特征聚类的文本分类模型研究
被引量:
2
17
作者
刘海峰
王元元
姚泽清
王倩
机构
解放军理工大学指挥自动化学院
解放军理工大学理学院
徐州工程学院
出处
《情报学报》
CSSCI
北大核心
2008年第2期224-228,共5页
文摘
借助特征聚类进行特征抽取是信息检索领域进行文本特征降维的重要手段之一。本文通过x^2统计和特征聚类相结合的模式,在尽量减少信息缺失的前提下两次对特征项维数进行压缩,通过分析特征的类别分布信息,实现了基于统计的特征降维;进而在基于类别概率分布的模式下实现了文本的矩阵表示,借助矩阵范数进行文本分类。实验结果表明,该方法的分类效率较高。
关键词
特征选择
特征聚类
Bayes分布
文本表示
文本分类
Keywords
feature selection, feature clustering, Bayes distributing, text expressing, text categorization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
F123.16 [经济管理—世界经济]
下载PDF
职称材料
题名
NTRU中间距失败的概率分析及其影响
被引量:
2
18
作者
陈桂东
陈亦望
姚泽清
机构
解放军理工大学理学院
出处
《计算机工程与设计》
CSCD
北大核心
2007年第14期3354-3356,共3页
文摘
NTRU是一种极有发展潜力的公钥密码体制,然而它的解密机制是不完善的,可能出现合法密文无法解密的现象,这严重影响了该体制的安全性。间距失败是导致解密失败的一个重要原因,对此,在=2相关多项式均为系数为0或1的二元多项式条件下,讨论了卷积系数的弱线性相关性,在此基础上对间距失败的概率计算进行了介绍和分析,得到了相关的计算公式,并介绍了一种利用间距失败对NTRU的攻击方法。
关键词
公钥密码体制
安全性
间距失败
卷积
概率计算
Keywords
NTRUpublic-keycryptosystem
security
gap failure
convolution
probabilities analysis
分类号
TP393.08 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于改进K-means聚类的文本特征选择模型
被引量:
2
19
作者
刘海峰
刘守生
姚泽清
张学仁
机构
解放军理工大学理学院
出处
《微电子学与计算机》
CSCD
北大核心
2009年第6期29-31,35,共4页
基金
国家自然科学基金项目(70571087)
文摘
介绍了文本聚类中基于划分的方法,针对该算法对孤立点的过于敏感问题,提出了一种用于特征选择的算法改进模型,通过对特征集里孤立点的剔除改善了特征聚类效果.随后的文本分类试验表明,提出的改进的算法具有较好的特征选择效果,文本分类的效率较高.
关键词
特征选择
特征降维
特征聚类
文本分类
Keywords
feature selection
feature reduction
feature clustering
text classification
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于散度差组合型文本特征降维方法
被引量:
2
20
作者
刘海峰
姚泽清
王元元
张述祖
机构
解放军理工大学理学院
解放军理工大学指挥自动化学院
出处
《微电子学与计算机》
CSCD
北大核心
2008年第8期69-71,75,共4页
基金
国家自然科学基金项目(70571087)
文摘
讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.试验结果表明,这种方法在文本分类上的效率较好.
关键词
文本分类
特征抽取
特征降维
散度差
Keywords
text classification
feature extraction
feature reduction
scatter difference
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
江苏省国民经济主要指标的主成分分析
姚泽清
王衍波
《运筹与管理》
CSCD
2003
18
下载PDF
职称材料
2
西部十二省市区国民经济发展状况的实证分析
姚泽清
张倩
蔡波
吕云
《运筹与管理》
CSCD
2008
2
下载PDF
职称材料
3
江苏省13城市国民经济主要指标的聚类分析
姚泽清
赵世玲
华中民
《解放军理工大学学报(自然科学版)》
EI
2003
3
下载PDF
职称材料
4
将素质教育贯穿于数学教学的始终
姚泽清
苏展
徐丹丹
《大学数学》
2011
7
下载PDF
职称材料
5
社会各阶层所关注的社会热点问题的聚类分析
姚泽清
《运筹与管理》
CSCD
2002
5
下载PDF
职称材料
6
定比回归法在价格指数预测中的应用
姚泽清
赵世玲
《解放军理工大学学报(自然科学版)》
EI
2002
0
下载PDF
职称材料
7
文本分类中基于位置和类别信息的一种特征降维方法
刘海峰
王元元
张学仁
姚泽清
《计算机应用研究》
CSCD
北大核心
2008
9
下载PDF
职称材料
8
文本分类中一种混合型特征降维方法
刘海峰
王元元
姚泽清
张述祖
《计算机工程》
CAS
CSCD
北大核心
2009
11
下载PDF
职称材料
9
基于词频的优化互信息文本特征选择方法
刘海峰
姚泽清
苏展
《计算机工程》
CAS
CSCD
2014
13
下载PDF
职称材料
10
文本分类中一种基于选择的二次特征降维方法
刘海峰
王元元
姚泽清
陈琦
《情报学报》
CSSCI
北大核心
2009
8
下载PDF
职称材料
11
基于类别选择的改进KNN文本分类
刘海峰
张学仁
姚泽清
刘守生
《计算机科学》
CSCD
北大核心
2009
9
下载PDF
职称材料
12
基于位置的文本特征加权方法研究
刘海峰
姚泽清
汪泽焱
张学仁
《微电子学与计算机》
CSCD
北大核心
2009
9
下载PDF
职称材料
13
文本分类中基于训练样本空间分布的K近邻改进算法
刘海峰
刘守生
姚泽清
《情报学报》
CSSCI
北大核心
2013
9
下载PDF
职称材料
14
文本分类中基于K-means的类偏斜KNN样本剪裁
刘海峰
姚泽清
苏展
张学仁
《微电子学与计算机》
CSCD
北大核心
2012
6
下载PDF
职称材料
15
文本分类中一种基于密度的KNN改进方法
刘海峰
汪泽焱
姚泽清
刘守生
《情报学报》
CSSCI
北大核心
2009
4
下载PDF
职称材料
16
文本分类中基于核的非线性判别
刘海峰
姚泽清
刘守生
王倩
《应用科学学报》
CAS
CSCD
北大核心
2008
4
下载PDF
职称材料
17
一种基于特征聚类的文本分类模型研究
刘海峰
王元元
姚泽清
王倩
《情报学报》
CSSCI
北大核心
2008
2
下载PDF
职称材料
18
NTRU中间距失败的概率分析及其影响
陈桂东
陈亦望
姚泽清
《计算机工程与设计》
CSCD
北大核心
2007
2
下载PDF
职称材料
19
一种基于改进K-means聚类的文本特征选择模型
刘海峰
刘守生
姚泽清
张学仁
《微电子学与计算机》
CSCD
北大核心
2009
2
下载PDF
职称材料
20
一种基于散度差组合型文本特征降维方法
刘海峰
姚泽清
王元元
张述祖
《微电子学与计算机》
CSCD
北大核心
2008
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部