期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于K-最近距离的自动文本分类的研究 被引量:13
1
作者 孙健 王伟 钟义信 《北京邮电大学学报》 EI CAS CSCD 北大核心 2001年第1期42-46,共5页
提出并实现了利用统计词频信息和语言信息相结合的方法选择特征 ,计算特征的权重值时不仅考虑词频 ,还利用了特征的集中度、分散度 .经过训练和统计对每一类文本形成特征的权重向量 ,利用 K-最近距离的方法对测试集进行分类 .对英文文... 提出并实现了利用统计词频信息和语言信息相结合的方法选择特征 ,计算特征的权重值时不仅考虑词频 ,还利用了特征的集中度、分散度 .经过训练和统计对每一类文本形成特征的权重向量 ,利用 K-最近距离的方法对测试集进行分类 .对英文文本的测试结果表明 。 展开更多
关键词 自然语言理解 向量空间模型 k-最近距离 自动文本分类
下载PDF
文本分类的几种方法研究 被引量:1
2
作者 沙俐敏 《南方冶金学院学报》 2004年第1期50-54,共5页
经过训练和统计对每一类文本形成特征的权重向量,利用K-最近距离的方法对测试集进行分类.Sleepingexpert算法采用正权重和负权重较好地描述了多义词的特性,该文在原算法中插入了一种权重补偿模块,其目标是实现权重和当前概念的一致性,... 经过训练和统计对每一类文本形成特征的权重向量,利用K-最近距离的方法对测试集进行分类.Sleepingexpert算法采用正权重和负权重较好地描述了多义词的特性,该文在原算法中插入了一种权重补偿模块,其目标是实现权重和当前概念的一致性,具有更好的分类性能. 展开更多
关键词 文本分类 基于k-最近距离 SLEEPING EXPERT 概念推理网 权重
下载PDF
哈萨克语文本分类系统的设计与实现 被引量:3
3
作者 玛依来.哈帕尔 古丽拉.阿东别克 《计算机工程》 CAS CSCD 北大核心 2011年第5期196-198,共3页
利用K-最近距离算法对哈萨克语文本进行分类,通过统计词频信息和语言信息相结合的方法选择特征,实现一个哈萨克语文本分类系统。在计算特征权重值时不仅考虑词频,还利用特征的集中度、分散度,经过训练和统计对每一类哈萨克语文本形成特... 利用K-最近距离算法对哈萨克语文本进行分类,通过统计词频信息和语言信息相结合的方法选择特征,实现一个哈萨克语文本分类系统。在计算特征权重值时不仅考虑词频,还利用特征的集中度、分散度,经过训练和统计对每一类哈萨克语文本形成特征的权重向量,根据K-最近距离算法判断测试文本的所属类别,实验结果表明该方法可行。 展开更多
关键词 文本分类 k-最近距离 集中度 分散度
下载PDF
离群数据挖掘在高炉物料消耗数据认证中的应用
4
作者 万辉 吴敏 《计算技术与自动化》 2007年第3期110-113,共4页
物料消耗量是指导高炉生产,计算各项生产指标的重要计量数据。及时核对认证高炉物料消耗数据,将为企业的科学决策提供重要的依据。在分析比较离群数据挖掘算法的基础上,采用k-最近邻距离法,对高炉物料消耗数据进行离群数据挖掘,找到错... 物料消耗量是指导高炉生产,计算各项生产指标的重要计量数据。及时核对认证高炉物料消耗数据,将为企业的科学决策提供重要的依据。在分析比较离群数据挖掘算法的基础上,采用k-最近邻距离法,对高炉物料消耗数据进行离群数据挖掘,找到错误数据后,用金属料平衡法对其进行修正,实现高炉物料消耗计量数据的自动认证。基于上述思想所开发的系统,弥补人工认证的缺陷,提高数据的认证效率和准确性。 展开更多
关键词 高炉物料消耗 离群数据挖掘 k-最近距离 金属料平衡法
下载PDF
城市燃气负荷离群数据的挖掘及分析 被引量:1
5
作者 苗艳姝 段常贵 《煤气与热力》 2006年第3期14-16,共3页
采用k-最近邻距离法对燃气负荷时序数列进行离群点的数据挖掘,分析了离群点产生的原因。结合实例,采用燃气负荷特征曲线法,对查找出来的离群点进行修正。
关键词 城市燃气负荷 数据挖掘 离群数据 k-最近距离
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部