期刊文献+
共找到311篇文章
< 1 2 16 >
每页显示 20 50 100
融合特征权重与改进粒子群优化的特征选择算法
1
作者 刘振超 苑迎春 +1 位作者 王克俭 何晨 《计算机工程与科学》 CSCD 北大核心 2024年第2期282-291,共10页
随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算... 随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算各个特征的权重,筛除冗余特征,然后在筛选后的特征集合中利用改进粒子群算法搜索最优特征子集。实验结果表明,在6个UCI公共数据集上,经RF-ATPSO算法进行特征选择后,平均准确率提升了10.04%,且平均特征子集规模最小、收敛速度最快;在学生学业成绩画像特征数据集上,该算法以较小的特征子集规模达到较高的分类准确率,平均准确率为94.77%,明显优于其它特征选择算法,实验充分证明了该算法具有实际应用意义。 展开更多
关键词 特征选择 特征权 改进粒子群优化 T-分布
下载PDF
基于灰狼-鸟群算法的特征权重优化方法
2
作者 严爱军 严晶 《北京工业大学学报》 CAS CSCD 北大核心 2023年第10期1088-1098,共11页
针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;... 针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;其次,将改进后的GWO算法位置更新策略融入BSA的觅食行为中,得到一种新的局部搜索策略;然后,将BSA的警觉行为与飞行行为用作混合算法的全局搜索平衡策略,从而得到一种收敛的灰狼-鸟群算法(grey wolf and bird swarm algorithm, GWBSA),通过GWBSA的迭代寻优可获得各特征的权重值。利用标准测试函数和标准分类数据集进行了对比实验,与遗传算法、蚁狮算法等方法相比,GWBSA具有较快的收敛速度且不易陷入局部最优,可以提高模式分类问题的求解质量。 展开更多
关键词 特征权 灰狼优化(grey wolf optimizer GWO)算法 鸟群算法(bird swarm algorithm BSA) 混合算法 问题求解 模式分类
下载PDF
基于特征权重与K-Medoids算法结合的非均衡数据处理方法
3
作者 杨栋 程科 +1 位作者 张晨 张瑞祥 《计算机与数字工程》 2023年第6期1338-1342,共5页
目前处理非均衡数据的方法多是以重采样方法来延伸的,传统的方法在解决非均衡数据分类问题时会使样本数据分类的精确度偏向于多数类样本,而且没有解决好类内不均衡的问题,未将样本数据的特征权重考虑到分类算法或者采样方法中。因此论... 目前处理非均衡数据的方法多是以重采样方法来延伸的,传统的方法在解决非均衡数据分类问题时会使样本数据分类的精确度偏向于多数类样本,而且没有解决好类内不均衡的问题,未将样本数据的特征权重考虑到分类算法或者采样方法中。因此论文提出了一种基于特征权重值与K-Medoids算法相结合的欠采样方法,这种方法解决了之前提出的问题,抽样得到的数据更有利于决策处理,从而使得分类器对不平衡数据的分类性能有所提高。通过实验表明,论文提出的方法与传统的随机欠采样方法相比,在处理相同标准数据集时具有更好分类效果,显著提高了数据集中各类的分类精度。 展开更多
关键词 非均衡数据集 特征权 K-Medoids 欠采样
下载PDF
学习特征权值对K-均值聚类算法的优化 被引量:48
4
作者 王熙照 王亚东 +1 位作者 湛燕 袁方 《计算机研究与发展》 EI CSCD 北大核心 2003年第6期869-873,共5页
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这... K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 展开更多
关键词 K-均值聚类 相似度量 特征权 梯度下降技术
下载PDF
基于相似粗糙集的案例特征权值确定新方法 被引量:15
5
作者 周平 丁进良 +1 位作者 岳恒 柴天佑 《信息与控制》 CSCD 北大核心 2006年第3期329-334,共6页
针对现有案例特征权值确定方法客观性差、算法复杂等问题,首先介绍和完善了基于传统粗糙集的权值确定方法.其次,针对基于传统粗糙集的方法会造成案例相似度测量误差从而影响案例推理的准确性的问题,将传统粗糙集的不可分辨关系推广为相... 针对现有案例特征权值确定方法客观性差、算法复杂等问题,首先介绍和完善了基于传统粗糙集的权值确定方法.其次,针对基于传统粗糙集的方法会造成案例相似度测量误差从而影响案例推理的准确性的问题,将传统粗糙集的不可分辨关系推广为相似关系,提出了一种基于相似粗糙集的案例特征权值确定方法.给出了相似粗糙集的基本定义,以及利用该方法基于差别矩阵进行特征权值计算的两个定理.最后,用实例表明了方法的有效性.* 展开更多
关键词 案例推理 案例特征权 粗糙集 相似粗糙集
下载PDF
基于特征权重量化的相似度计算方法 被引量:8
6
作者 刘铭 吴冲 +1 位作者 刘远超 孙承杰 《计算机学报》 EI CSCD 北大核心 2015年第7期1420-1433,共14页
随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知... 随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知识,例如用户提供的限制数据,来衡量特征的重要性,并将其应用于相似度计算中以获取更加准确的计算结果.传统的特征权值量化方法均忽视了两点问题:(1)限制数据在特征空间中极有可能为非均匀分布;(2)限制数据可能包含不一致性.上述问题的存在使得传统的权值量化方法无法获得准确的结果甚至无法运行.基于此,文中提出了一种新颖的特征权值量化方法用以处理上述两点问题:(1)将限制数据划分为若干个等价类,进而通过计算参数"分布系数"来均匀化数据的分布;(2)将限制数据连接为无向图,进而通过计算参数"置信度"来衡量及弱化限制数据的不一致性.之后将这两个参数结合到特征权值量化函数中以获得准确的相似度计算结果.实验结果显示:该特征权值量化方法能够结合限制数据来获取不同特征对相似度计算的贡献能力,并能应用于任何聚类算法中以提高聚类的准确度. 展开更多
关键词 限制数据 特征权重量化 分布系数 置信度
下载PDF
文本分类特征权重改进算法 被引量:26
7
作者 台德艺 王俊 《计算机工程》 CAS CSCD 北大核心 2010年第9期197-199,202,共4页
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进ID... TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。 展开更多
关键词 向量空间模型 文本分类 特征权 特征分布
下载PDF
一种有效的特征权重计算方法 被引量:9
8
作者 孙挺 耿国华 周明全 《郑州大学学报(理学版)》 CAS 2008年第4期48-51,共4页
研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中... 研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中的重要程度.实验结果表明,该方法可以有效地改善分类性能. 展开更多
关键词 文本分类 向量空间模型 特征权
下载PDF
一种改进的特征权重算法 被引量:20
9
作者 张瑜 张德贤 《计算机工程》 CAS CSCD 北大核心 2011年第5期210-212,共3页
特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况。为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-S... 特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况。为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-SI的特征权重改进算法,分别采用支持向量机和朴素贝叶斯2种分类算法进行测试。测试结果表明,与其他改进算法相比,该算法能够获得更好的分类效果。 展开更多
关键词 文本分类 特征权 类间偏斜度 类内离散度 重调整因子
下载PDF
动态自适应特征权重的多类文本分类算法研究 被引量:9
10
作者 裴颂文 吴百锋 《计算机应用研究》 CSCD 北大核心 2011年第11期4092-4096,共5页
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现... 文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现的频率及该特征项所属文本在训练集中的数量,而且通过考查特征项的分散度和特征向量梯度差以自适应动态文本的分类。实验结果表明,采用DATW方法计算特征权重可以有效提高文本分类的性能。 展开更多
关键词 文本分类 特征权 TF-IDF 分散度 梯度差
下载PDF
特征权对贝叶斯分类器文本分类性能的影响 被引量:3
11
作者 高秀梅 陈芳 +1 位作者 宋枫溪 金忠 《计算机应用》 CSCD 北大核心 2008年第12期3080-3083,共4页
在文本分类研究中,人们希望用特征权来改善文本分类效果。以最优分类器——贝叶斯分类器为基准分类器,研究了特征权对文本分类性能的可能影响。理论推导表明,就最优分类器而言,特征权不能有效提高文本分类效果。
关键词 文本分类 文本表示 特征权 贝叶斯分类器 分类器性能
下载PDF
机器翻译系统特征权值的贝叶斯优化方法 被引量:11
12
作者 李芳菊 张聪品 《计算机工程与设计》 北大核心 2019年第4期1156-1160,共5页
针对机器翻译中存在的特征权重的领域自适应问题,提出一种联合最小贝叶斯融合的系统权重训练方法。在协同训练的框架内,采用不同解码器的输出作为参考译文,通过扩展开发集,保证特征权重训练的有效性。通过利用最小贝叶斯风险融合方法,... 针对机器翻译中存在的特征权重的领域自适应问题,提出一种联合最小贝叶斯融合的系统权重训练方法。在协同训练的框架内,采用不同解码器的输出作为参考译文,通过扩展开发集,保证特征权重训练的有效性。通过利用最小贝叶斯风险融合方法,提升协同训练的稳定性。实验结果表明,该方法较好解决了特征权重的领域自使用问题,优化了机器翻译质量。 展开更多
关键词 机器翻译 协同训练 最小贝叶斯风险 特征权 领域自适应
下载PDF
新的短文本特征权重计算方法 被引量:8
13
作者 马雯雯 邓一贵 《计算机应用》 CSCD 北大核心 2013年第8期2280-2282,2292,共4页
短文本固有的特征稀疏和样本高度不均衡等特点,使得传统长文本的加权方法难以直接套用。针对此问题,提出一种针对短文本的特征权重计算方法——综合类别法。该方法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布... 短文本固有的特征稀疏和样本高度不均衡等特点,使得传统长文本的加权方法难以直接套用。针对此问题,提出一种针对短文本的特征权重计算方法——综合类别法。该方法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布情况。实验结果表明,相对于其他特征权重方法,该方法的微平均和宏平均值均在90%以上,能增强样本在负类中的类别区分能力,改善短文本分类的查准率和查全率。 展开更多
关键词 短文本 特征权 不均衡样本 文本分类
下载PDF
粒子群选择特征和信息增益确定特征权值的入侵检测 被引量:8
14
作者 黄会群 孙虹 《计算机应用》 CSCD 北大核心 2014年第6期1686-1688,1693,共4页
为了提高网络入侵检测正确率,提出一种粒子群算法(PSO)选择特征和信息增益(IG)法确定特征权值的网络入侵检测模型(PSO-IG)。首先采用PSO选择网络入侵特征子集,消除冗余特征;然后采用IG法确定特征子集中的特征权重,并采用支持向量机(SVM... 为了提高网络入侵检测正确率,提出一种粒子群算法(PSO)选择特征和信息增益(IG)法确定特征权值的网络入侵检测模型(PSO-IG)。首先采用PSO选择网络入侵特征子集,消除冗余特征;然后采用IG法确定特征子集中的特征权重,并采用支持向量机(SVM)建立分类模型;最后采用KDD CUP 99数据集对PSO-IG的性能进行测试。测试结果表明:PSO-IG消除了冗余特征,降低了输入维数,提高了网络入侵检测速度;通过合理确定特征权值,提高了入侵检测正确率。 展开更多
关键词 特征选择 特征权 入侵检测 粒子群算法
下载PDF
文本分类中特征权重算法的改进 被引量:14
15
作者 沈志斌 白清源 《南京师范大学学报(工程技术版)》 CAS 2008年第4期95-98,149,共5页
TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重... TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重,并用分类器来验证其有效性.该方法优于原来的TFIDF算法,实验表明了改进的策略是可行的. 展开更多
关键词 文本分类 特征权 TFIDF 类别区分 BOR-TFIDF
下载PDF
基于遗传算法的图像检索中特征权重自动调整 被引量:8
16
作者 崔文成 邵虹 《计算机工程与应用》 CSCD 北大核心 2008年第2期106-108,共3页
综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法的多特征权重自动赋值方法,首先将图像检索中特征权重调整问题转换为优化问题,进一... 综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法的多特征权重自动赋值方法,首先将图像检索中特征权重调整问题转换为优化问题,进一步利用遗传算法求取权重的最优解,使检索效果达到最好。实验表明,该方法查全率和查准率较高,并且具有较强的鲁棒性和推广能力,对于各种特征和特征表示方法,都能够提供最佳的组合。 展开更多
关键词 基于内容的图像检索 遗传算法 特征权
下载PDF
负投影梯度的特征权重Leader聚类算法 被引量:2
17
作者 隋玉敏 孙秀芳 +1 位作者 武优西 任志考 《小型微型计算机系统》 CSCD 北大核心 2014年第9期2147-2150,共4页
Leader算法是一种基于粗糙集的层次聚类算法,其聚类过程中各维特征贡献作用均等,这样的处理方法降低了主要特征在聚类中的贡献作用,从而影响聚类的效果.采用负投影梯度法对各维特征的权重进行自适应学习,从而优化地获得各维特征的权值,... Leader算法是一种基于粗糙集的层次聚类算法,其聚类过程中各维特征贡献作用均等,这样的处理方法降低了主要特征在聚类中的贡献作用,从而影响聚类的效果.采用负投影梯度法对各维特征的权重进行自适应学习,从而优化地获得各维特征的权值,进而建立了基于负投影梯度法的特征权重Leader聚类算法.该算法强化了重要特征在聚类过程中的作用.聚类结果用"熵"和"精度"来评价,实验结果证明,改进后的聚类算法能够改善聚类的效果,验证了本文方法的可行性与有效性. 展开更多
关键词 聚类算法 负投影梯度 特征权 Leader算法
下载PDF
一种可靠信任推荐文本分类特征权重算法 被引量:6
18
作者 焦庆争 蔚承建 《计算机应用研究》 CSCD 北大核心 2010年第2期472-474,共3页
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦... 从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。 展开更多
关键词 文本分类 特征权 可信计算 概率确定性密度 自然语言处理
下载PDF
基于多维特征权重的虚假评论识别方法 被引量:2
19
作者 皇苏斌 修宇 +1 位作者 赵森严 汪千松 《长江大学学报(自科版)(上旬)》 CAS 2015年第6期34-38,4,共5页
在线商品评论是消费者网购决策的重要依据,利益的驱动使得越来越多的网络虚假评论呈现在消费者面前。针对此问题,提出一种多维特征权重的在线虚假评论识别方法。首先,从网购信息有用性角度出发,在商品、评论者和评论内容3个维度中选取9... 在线商品评论是消费者网购决策的重要依据,利益的驱动使得越来越多的网络虚假评论呈现在消费者面前。针对此问题,提出一种多维特征权重的在线虚假评论识别方法。首先,从网购信息有用性角度出发,在商品、评论者和评论内容3个维度中选取9个对评论属类语义贡献大的特征。然后,基于Fisher准则,运用赋予权重的特征构建用于识别虚假评论的方法。试验结果验证了基于多维特征权重的虚假评论识别方法的有效性:多维特征权重方法的准确率。 展开更多
关键词 虚假评论 特征选择 特征权 FISHER准则
下载PDF
自适应特征权重的K-means聚类算法 被引量:10
20
作者 李四海 满自斌 《计算机技术与发展》 2013年第6期98-101,105,共5页
为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属... 为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属性在距离公式中的特征权重,以便更准确地反映数据点在欧氏空间中的真实距离,最后选取UCI上的BCW乳腺肿瘤等数据集对算法的有效性进行验证。结果表明:算法的准确率和稳定性均明显好于传统K-means算法。 展开更多
关键词 K—means 医学数据聚类 自适应特征权 聚类评价 混淆矩阵
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部