期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
考虑数据排序的改进CABOSFV聚类 被引量:2
1
作者 武森 王静 谭一松 《计算机工程与应用》 CSCD 北大核心 2011年第34期127-129,共3页
CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序... CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序以改进CABOSFV算法的聚类质量。采用UCI基准数据集进行实验,结果表明与传统的CABOSFV算法相比,CABOSFV_CS有效地提高了聚类准确率。 展开更多
关键词 cabosfv算法 高维数据 稀疏特征 聚类
下载PDF
基于CABOSFV聚类算法的汉语词汇类别知识挖掘研究 被引量:1
2
作者 王东波 朱丹浩 《计算机科学》 CSCD 北大核心 2013年第7期211-215,共5页
在清华大学973汉语树库的基础上,根据汉语词汇的句法功能分布状况,构建了句法功能分布知识库。在构建的句法功能分布知识库基础上,使用CABOSFV(Clustering Algorithm Based On Sparse Feature Vector)聚类算法,从中挖掘了汉语词汇的类... 在清华大学973汉语树库的基础上,根据汉语词汇的句法功能分布状况,构建了句法功能分布知识库。在构建的句法功能分布知识库基础上,使用CABOSFV(Clustering Algorithm Based On Sparse Feature Vector)聚类算法,从中挖掘了汉语词汇的类别知识,并对这些类别知识逐一进行了分析。 展开更多
关键词 973汉语树库 句法分布功能 知识库 cabosfv
下载PDF
基于客户知识的客户CABOSFV聚类 被引量:3
3
作者 刘希宋 喻登科 李玥 《情报杂志》 CSSCI 北大核心 2008年第2期7-9,6,共4页
客户知识的多元性与多源性决定了客户知识的高维特性,而个性化与离散化又决定其稀疏特性。针对客户知识的高维稀疏特性,借助稀疏特征向量及其可加性原理,提出基于客户知识的客户CABOSFV聚类算法,并利用其进行实例分析,检验其相对于传统... 客户知识的多元性与多源性决定了客户知识的高维特性,而个性化与离散化又决定其稀疏特性。针对客户知识的高维稀疏特性,借助稀疏特征向量及其可加性原理,提出基于客户知识的客户CABOSFV聚类算法,并利用其进行实例分析,检验其相对于传统聚类算法的优越性。 展开更多
关键词 客户 客户知识 cabosfv 聚类
下载PDF
CABOSFV算法中集合稀疏差异度阈值确定方法
4
作者 宋艳 肖乾 《舰船科学技术》 北大核心 2006年第1期99-102,共4页
在实际应用中,CABOSFV算法初始参数———集合稀疏差异度阈值b的确定是否合理,对聚类结果是否有效起决定作用。本文针对如何科学方便地确定集合稀疏差异度阈值b进行了深入研究,给出了集合稀疏差异度阈值确定方法,并通过该方法进行了实... 在实际应用中,CABOSFV算法初始参数———集合稀疏差异度阈值b的确定是否合理,对聚类结果是否有效起决定作用。本文针对如何科学方便地确定集合稀疏差异度阈值b进行了深入研究,给出了集合稀疏差异度阈值确定方法,并通过该方法进行了实例计算。计算结果表明,由于该方法能够确定聚类结果中类的对象组成最小数量,聚类结果的粗糙与精细程度可以人为控制,对聚类结果的准确及高效提供了很好的保证,能够为CABOSFV算法进行聚类提供合理的阈值。 展开更多
关键词 聚类 cabosfv算法 集合稀疏差异度 阅值
下载PDF
CABOSFV算法的改进方法
5
作者 殷佳 武森 王沙骋 《情报探索》 2007年第9期112-114,共3页
通过CABOSFV算法得出集合稀疏差异度,并结合实例分析,提出其可能的改进方向。
关键词 cabosfv 稀疏差异度 聚类
下载PDF
DS-CABOSFV流数据聚类算法
6
作者 向浩 《中国科技成果》 2011年第16期64-66,69,共4页
流数据技术已成为当今数据处理领域的研究热点,流数据挖掘是数据流技术研究的重要分支。流数据挖掘的核心思想是设计数据集单遍扫描算法,在有限的内存中存储少量代表流数据特征的概要数据,即时、快速地处理概要数据以得到响应结果,... 流数据技术已成为当今数据处理领域的研究热点,流数据挖掘是数据流技术研究的重要分支。流数据挖掘的核心思想是设计数据集单遍扫描算法,在有限的内存中存储少量代表流数据特征的概要数据,即时、快速地处理概要数据以得到响应结果,实现流数据实时、在线分析,对流数据进行聚类、分类,具有广泛的应用价值。本文完成了流数据概要的构建并综合研究传统数据挖掘的聚类算法,改进更新了CABOSFV聚类算法,实现了应用于流数据这一新的数据模型上,对传统数据挖掘技术进行改进,实现了数据的实时处理和在线分析,并给出了具体的实现方法,实验结果验证了该算法在流数据挖掘技术上的可行性。 展开更多
关键词 流数据挖掘 聚类 cabosfv算法
原文传递
拓展差异度的高维数据聚类算法 被引量:7
7
作者 武森 何慧霞 范岩岩 《计算机工程与应用》 CSCD 北大核心 2020年第23期38-44,共7页
CABOSFV是一种有效的高维数据聚类算法。针对CABOSFV算法倾向于将数据对象分配到更大的类中这一问题,提出一种拓展差异度的高维数据聚类算法(CABOSFV_D)。该算法引入了调整指数p,对原始稀疏差异度进行拓展,降低类大小对对象分配的影响;... CABOSFV是一种有效的高维数据聚类算法。针对CABOSFV算法倾向于将数据对象分配到更大的类中这一问题,提出一种拓展差异度的高维数据聚类算法(CABOSFV_D)。该算法引入了调整指数p,对原始稀疏差异度进行拓展,降低类大小对对象分配的影响;同时用位集的方式实现CABOSFV_D算法,使算法的运算效率明显提升。基于多个UCI标准数据集进行聚类实验,结果表明CABOSFV_D在聚类效果和时间效率上均优于原始CABOSFV算法。 展开更多
关键词 拓展差异度 cabosfv 高维聚类 cabosfv_D 位集
下载PDF
基于排序思想的高维稀疏数据聚类 被引量:2
8
作者 祝琴 高学东 +2 位作者 武森 陈敏 陈华 《计算机工程》 CAS CSCD 北大核心 2010年第22期13-14,共2页
针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高... 针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高CABOSFV聚类的质量。 展开更多
关键词 高维稀疏数据 cabosfv聚类 排序
下载PDF
基于聚类的数据挖掘技术在电子商务CRM中的应用研究 被引量:2
9
作者 梁辰 张庆 《电脑与电信》 2008年第6期92-93,95,共3页
本文通过对电子商务中客户关系管理聚类数据挖掘技术的研究,提出基于CABOSFV算法的客户聚类算法,用于解决客户关系管理中大量高维稀疏数据组成的客户行为数据集聚类分析和信息管理问题。
关键词 电子商务 聚类 数据挖掘 客户关系管理 cabosfv算法
下载PDF
基于高维聚类技术的中文关键词提取算法 被引量:2
10
作者 高学东 吴玲玉 《中国管理信息化》 2011年第9期23-27,共5页
关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、... 关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。 展开更多
关键词 关键词提取 小词典分词 高维聚类 cabosfv
下载PDF
一种基于高维空间聚类的离群数据发现算法 被引量:2
11
作者 李旭辉 郑丽英 +2 位作者 徐顼 贾海鹏 何知军 《微电子学与计算机》 CSCD 北大核心 2007年第12期44-46,共3页
针对高维稀疏聚类CABOSFV算法仅能解决二态变量高维稀疏聚类问题而对其他类型变量算法将失效的情况,通过定义"属性绝对值距离"解决了CABOSFV算法固有的这一缺陷。另外,针对聚类后产生伪孤立点问题,提出相应的异常数据处理策略... 针对高维稀疏聚类CABOSFV算法仅能解决二态变量高维稀疏聚类问题而对其他类型变量算法将失效的情况,通过定义"属性绝对值距离"解决了CABOSFV算法固有的这一缺陷。另外,针对聚类后产生伪孤立点问题,提出相应的异常数据处理策略,从而得到较为精确的离群数据。 展开更多
关键词 离群数据 cabosfv算法 聚类 伪孤立点
下载PDF
I-Miner环境下聚类分析算法研究与实现
12
作者 徐德 谭维 +2 位作者 杨燕 侯天子 黄乐 《现代计算机》 2009年第2期30-34,共5页
聚类分析是一种非监督型知识发现的方法,能有效地处理大量的、繁杂的、属性众多的且没有类标志的数据。DBSCAN算法能实现任意形状的数据集的聚类,模糊C均值适合于那些在簇中心周围呈均匀分布的数据集,CABOSFV算法对于高维稀疏数据集(例... 聚类分析是一种非监督型知识发现的方法,能有效地处理大量的、繁杂的、属性众多的且没有类标志的数据。DBSCAN算法能实现任意形状的数据集的聚类,模糊C均值适合于那些在簇中心周围呈均匀分布的数据集,CABOSFV算法对于高维稀疏数据集(例如Web数据)能很好地聚类。在I-Miner中嵌入DBSCAN、CABOSFV和模糊C均值三种聚类分析算法,能够较好地满足用户的需要,建立数据挖掘模型,支持生产决策。 展开更多
关键词 聚类分析 DBSCAN算法 模糊C均值 cabosfv算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部