期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于特征自动选择方法的汉语隐喻计算 被引量:2
1
作者 曾华琳 周昌乐 +1 位作者 陈毅东 史晓东 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第3期406-412,共7页
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种... 汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种最优特征模板自动抽取的隐喻识别算法,讨论了3种不同层次的特征模板,既包含了经典的简单特征,又将跨多个词的远距离上下文信息,以及描述语义信息的词语相似性引入特征模板进行考察.实验结果表明,该算法提高了隐喻识别准确率,是一种对于汉语隐喻计算行之有效的机器学习方法. 展开更多
关键词 汉语隐喻计算 隐喻识别 机器学习 自动特征选择
下载PDF
考虑光谱变异性的多光谱植被识别最优特征空间构建
2
作者 林怡 厉朗 +4 位作者 宇洁 高忱 钟代琪 陈鑫 杨羽轩 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期225-232,共8页
在中低分辨率遥感卫星影像上,植被识别受数据获取条件和不同生长期等因素的影响,会存在端元光谱变异现象,导致植被解混误差较大。提出了一种顾及端元光谱变异性的最佳距离遗传算法(IIDGA),通过自动特征选择方法减小端元类内差异,增大类... 在中低分辨率遥感卫星影像上,植被识别受数据获取条件和不同生长期等因素的影响,会存在端元光谱变异现象,导致植被解混误差较大。提出了一种顾及端元光谱变异性的最佳距离遗传算法(IIDGA),通过自动特征选择方法减小端元类内差异,增大类间差异,构建适用于中等分辨率影像的植被解混最优特征空间,提高Landsat影像的植被识别精度。通过比较传统波段组合、光谱和纹理特征全集与IIDGA优选特征的线性解混模型效果,验证了最优特征选择的重要性。结果显示,特征选择有助于提升解混精度(IIDGA的均方根误差最低,为0.180);同时,通过比较基于IID指数的Filter算法、基于标准GA的Wrapper算法和IIDGA在最优特征自动选取方面的性能,证实了IIDGA在平衡精度与效率方面的优势。 展开更多
关键词 多光谱遥感 植被识别 端元光谱差异 最佳距离遗传算法 自动特征选择算法
下载PDF
基于特征选择和最大熵模型的汉语词义消歧 被引量:37
3
作者 何径舟 王厚峰 《软件学报》 EI CSCD 北大核心 2010年第6期1287-1295,共9页
词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在... 词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在此基础上提出一套基于最大熵分类模型的自动特征选择方法,包括针对所有歧义词的统一特征模板选择和针对单个歧义词的独立特征模板优化算法.实验结果表明,使用自动选择的特征,不仅简化了特征模板,而且提高了汉语词义消歧的性能.与SemEval2007:task#5的最好成绩相比,该方法分别在微平均值MicroAve(micro-average accuracy)和宏平均值MacroAve(macro-average accuracy)上提升了3.10%和2.96%. 展开更多
关键词 最大熵模型 分类特征 自动特征选择 汉语词义消歧
下载PDF
基于词元语义特征的汉语框架排歧研究 被引量:7
4
作者 李国臣 张立凡 +2 位作者 李茹 刘海静 石佼 《中文信息学报》 CSCD 北大核心 2013年第4期44-51,共8页
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地... 框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。 展开更多
关键词 框架排歧 汉语框架网语义资源 自动特征选择 词元语义特征
下载PDF
特征自适应的精准目标跟踪算法 被引量:1
5
作者 贾静平 张飞舟 +1 位作者 柴艳妹 赵荣椿 《系统工程与电子技术》 EI CSCD 北大核心 2008年第11期2255-2258,共4页
提出了一种能够自动选择最优特征、精准描述目标尺寸连续变化的新的序列图像目标跟踪算法。该算法首先计算由RGB分量线性组合而成的区分目标和背景的最优特征,将每一帧输入图像按照此最优特征转换成目标概率分布图,然后通过检测该图在... 提出了一种能够自动选择最优特征、精准描述目标尺寸连续变化的新的序列图像目标跟踪算法。该算法首先计算由RGB分量线性组合而成的区分目标和背景的最优特征,将每一帧输入图像按照此最优特征转换成目标概率分布图,然后通过检测该图在尺度空间中微分滤波器输出的极值,来决定目标的尺度。最后采用QP_TR信任域算法在尺度空间里和图像平面内快速搜索概率分布图多尺度规范化Laplacian滤波函数的极值,实现了目标的定位,从而完成了跟踪任务。通过与现有算法进行比较,并结合大量真实序列图像进行实验验证,结果表明算法不但能够更准确地描述目标的大小,而且显著提高了跟踪算法的精度。 展开更多
关键词 计算机图像处理 视频跟踪 自动特征选择 尺度空间
下载PDF
基于条件随机场的哈萨克语基本短语自动识别 被引量:3
6
作者 汪泱 古丽拉.阿东别克 +1 位作者 户冰心 牛宁宁 《计算机工程与设计》 CSCD 北大核心 2014年第10期3602-3607,共6页
为解决识别哈萨克语基本短语的问题,提出一种基于条件随机场模型的哈萨克语基本短语自动识别方法。利用基于贪心策略的特征模板自动选择算法,结合哈萨克语基本短语的特点,从众多上下文特征中选取出合适的特征;每次从备选特征模板中挑选... 为解决识别哈萨克语基本短语的问题,提出一种基于条件随机场模型的哈萨克语基本短语自动识别方法。利用基于贪心策略的特征模板自动选择算法,结合哈萨克语基本短语的特点,从众多上下文特征中选取出合适的特征;每次从备选特征模板中挑选出局部最优的特征模板项,加入到最终的特征模板中,进一步提高识别准确率。实验结果表明,该方法的识别准确率和召回率分别达到了89.01%和84.07%。 展开更多
关键词 基本短语识别 条件随机场 特征模板自动选择 哈萨克语 贪心策略
下载PDF
基于复合分类模型的社交网络恶意用户识别方法 被引量:12
7
作者 谈磊 连一峰 陈恺 《计算机应用与软件》 CSCD 北大核心 2012年第12期1-5,17,共6页
社交网络近年发展迅速,微博类社交网络的用户数目及规模急剧增大的同时也带来了诸多安全问题,为了保护用户的隐私和个人、集体的利益,需要针对这些恶意行为进行识别并对恶意用户进行处理。提出一种采用复合分类模型对用户进行分类的方法... 社交网络近年发展迅速,微博类社交网络的用户数目及规模急剧增大的同时也带来了诸多安全问题,为了保护用户的隐私和个人、集体的利益,需要针对这些恶意行为进行识别并对恶意用户进行处理。提出一种采用复合分类模型对用户进行分类的方法,并开发了一个对微博类社交网络用户进行分类的系统。通过研究用户的属性和行为特点,比较属性间的相关性,从两方面兼顾了分类的准确性和效率。 展开更多
关键词 新浪微博 社交网络 自动分类特征选择 恶意用户
下载PDF
基于离散哈希的聚类
8
作者 轩书婷 刘惊雷 《计算机应用》 CSCD 北大核心 2022年第3期713-723,共11页
传统的聚类方法是在数据空间进行,且聚类数据的维度较高。为了解决这两个问题,提出了一种新的二进制图像聚类方法——基于离散哈希的聚类(CDH)。该框架通过L21范数实现自适应的特征选择,从而降低数据的维度;同时通过哈希方法将数据映射... 传统的聚类方法是在数据空间进行,且聚类数据的维度较高。为了解决这两个问题,提出了一种新的二进制图像聚类方法——基于离散哈希的聚类(CDH)。该框架通过L21范数实现自适应的特征选择,从而降低数据的维度;同时通过哈希方法将数据映射到二进制的汉明空间,随后,在汉明空间中对稀疏的二进制矩阵进行低秩矩阵分解,完成图像的快速聚类;最后使用可以快速收敛的优化方案来对目标函数进行优化求解。在Caltech101、Yale、COIL20、ORL图像数据集上的实验结果表明,该方法可以有效提升聚类效率。在Caltech101数据集的Gabor视图,与传统的K-means、谱聚类方法相比,在处理高维度数据时,CDH的时间效率分别提高了约87和98个百分点。 展开更多
关键词 哈希方法 自动特征选择 稀疏二进制矩阵 L21范数 收敛优化 汉明空间
下载PDF
Battle damage assessment based on an improved Kullback-Leibler divergence sparse autoencoder 被引量:9
9
作者 Zong-feng QI Qiao-qiao LIU +1 位作者 Jun WANG Jian-xun LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2017年第12期1991-2000,共10页
The nodes number of the hidden layer in a deep learning network is quite difficult to determine with traditional methods. To solve this problem, an improved Kullback-Leibler divergence sparse autoencoder (KL-SAE) is... The nodes number of the hidden layer in a deep learning network is quite difficult to determine with traditional methods. To solve this problem, an improved Kullback-Leibler divergence sparse autoencoder (KL-SAE) is proposed in this paper, which can be applied to battle damage assessment (BDA). This method can select automatically the hidden layer feature which contributes most to data reconstruction, and abandon the hidden layer feature which contributes least. Therefore, the structure of the network can be modified. In addition, the method can select automatically hidden layer feature without loss of the network prediction accuracy and increase the computation speed. Experiments on University ofCalifomia-Irvine (UCI) data sets and BDA for battle damage data demonstrate that the method outperforms other reference data-driven methods. The following results can be found from this paper. First, the improved KL-SAE regression network can guarantee the prediction accuracy and increase the speed of training networks and prediction. Second, the proposed network can select automatically hidden layer effective feature and modify the structure of the network by optimizing the nodes number of the hidden layer. 展开更多
关键词 Battle damage assessment Improved Kullback-Leibler divergence sparse autoencoder Structural optimization Feature selection
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部