期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于高斯混合模型和自适应簇数的文本聚类
1
作者 程宏兵 王本安 +2 位作者 陈友荣 张旭东 吴前锋 《浙江工业大学学报》 北大核心 2023年第6期602-609,共8页
针对海量文本难以精准聚类问题,提出了一种基于高斯混合模型和自适应簇数的文本聚类算法(TCA)。首先,采用无意义符号去除、基于齐次马尔科夫假设的文本分词和停用词去除方法,实现数据分词和清洗;其次,提出权衡关键词频率和普适性的关键... 针对海量文本难以精准聚类问题,提出了一种基于高斯混合模型和自适应簇数的文本聚类算法(TCA)。首先,采用无意义符号去除、基于齐次马尔科夫假设的文本分词和停用词去除方法,实现数据分词和清洗;其次,提出权衡关键词频率和普适性的关键词权重,选择关键词和进行文本向量化;再次,在高斯混合模型的基础上,引入文本相似度,提出权衡条件概率和相似度的文本权重;最后,通过轮盘赌初始化聚类中心,更新多维高斯分布模型参数,实现分簇数量确定的文本聚类。同时,为了自适应文本分簇数量,在肘部法则的基础上确定最优分簇数量,从而提高聚类效果。仿真结果表明:TCA能自适应文本聚类数量和获得其分布,提高聚类的准确率和召回率,有助于更好地实现海量文本的精确聚类。 展开更多
关键词 文本聚类 高斯混合模型 自适应簇数 相似度 条件概率
下载PDF
新疆吉木萨尔页岩油藏压裂水平井压裂簇数优化研究 被引量:5
2
作者 谢建勇 石璐铭 +5 位作者 吴承美 陈昊枢 许锋 张兴娇 张金风 孙海波 《陕西科技大学学报》 CAS 北大核心 2021年第1期103-109,152,共8页
页岩油藏原始渗透率极低,自然条件下无经济产能,实践表明大型水力压裂是高效开发页岩油藏的最有效手段.然而,目前鲜有关于页岩油藏压裂水平井裂缝簇数优化研究的报道.针对这一问题,利用不稳定渗流理论建立了多段压裂水平井多井数值模型... 页岩油藏原始渗透率极低,自然条件下无经济产能,实践表明大型水力压裂是高效开发页岩油藏的最有效手段.然而,目前鲜有关于页岩油藏压裂水平井裂缝簇数优化研究的报道.针对这一问题,利用不稳定渗流理论建立了多段压裂水平井多井数值模型,在储量动用充分的原则,提出了一套页岩油藏多段压裂水平井裂缝簇数优化方法,并进行了实例应用分析.结果发现,当昌吉油田页岩油藏多段压裂水平井裂缝簇数大于80条,累计产油量的增长趋势趋于平缓,可确定其合理的裂缝簇数为70~80,簇间距范围在15~20 m左右.由最优裂缝簇数为75的理论模型进行产量预测,计算发现昌吉油田页岩油藏压裂水平井的累计产油量为25150 m 3,此工作可为新疆昌吉油田页岩油藏的压裂水平井裂缝簇数设计提供理论参考. 展开更多
关键词 页岩油藏 昌吉油田 压裂水平井 裂缝簇数
下载PDF
一种基于特征间隙的检测簇数的谱聚类算法 被引量:1
3
作者 胡海峰 刘萍萍 《计算机技术与发展》 2015年第9期37-42,共6页
数据挖掘中如何根据数据之间的相似度确定簇(Cluster)数一直是聚类算法中需要解决的难题。文中在经典谱聚(Spectral Clustering)算法的基础上提出了一种基于特征间隙检测簇数的谱聚类算法(Spectral Clustering with Identifying Cluster... 数据挖掘中如何根据数据之间的相似度确定簇(Cluster)数一直是聚类算法中需要解决的难题。文中在经典谱聚(Spectral Clustering)算法的基础上提出了一种基于特征间隙检测簇数的谱聚类算法(Spectral Clustering with Identifying Clustering Number based on Eigengap,SC-ICNE)。通过构建规范的拉普拉斯矩阵,顺序求解其特征值和相应特征向量,并得到矩阵相邻特征值的间隙,通过判断特征间隙的位置来确定簇数k。最后,通过对前k个特征向量的k-means算法实现数据集的聚类。文中通过仿真分析了高斯相似度函数对SC-ICNE聚类性能的影响,在非凸球形数据集和UCI数据集上进行了性能仿真,并和k-means聚类算法进行了对比,在检测簇数和聚类准确性方面,验证了SC-ICNE算法的有效性。 展开更多
关键词 谱聚类 簇数 特征间隙 高斯相似度
下载PDF
基于机会信号的区块模型的能效最优簇数的研究
4
作者 刘东 熊召新 《现代电子技术》 北大核心 2018年第19期19-22,26,共5页
依据无线传感网络(WSNs)中WiFi、声或可见光的机会信号,提出基于最优簇数的区块模型(CML)。区块模型为衰落模型,反映机会信号随传播距离的衰减变化。为了减少总体能耗,利用区块模型的泰勒级数展开的不同阶次计算最优簇数。最后利用移动... 依据无线传感网络(WSNs)中WiFi、声或可见光的机会信号,提出基于最优簇数的区块模型(CML)。区块模型为衰落模型,反映机会信号随传播距离的衰减变化。为了减少总体能耗,利用区块模型的泰勒级数展开的不同阶次计算最优簇数。最后利用移动手机、无线接入点、声和光信号建立真实的实验平台,分析最优簇数。实验数据表明,相比Exponential模型和对数Log模型,CML的能耗分别下降约6%和8%。此外,相比于WiFi和声信号,可见光信号的能效提高近12%。 展开更多
关键词 无线传感网络 能效 机会信号 区块模型 最优簇数
下载PDF
基于语义的中文文本聚类最佳簇数研究
5
作者 刘金岭 《计算机工程与设计》 CSCD 北大核心 2010年第9期2034-2036,2100,共4页
分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在... 分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在文本向量集的每个文本向量中抽取出一个词汇,按相似度有序排列,用增量逐层划分以得到最优划分所对应的簇类数。这样通过扫描一遍数据就可以获得多个统计信息,最后求出最优解。实验结果表明了该算法的高质量和高效率。 展开更多
关键词 文本聚类 聚类簇数 增量 划分 CTBP
下载PDF
一种采用新型聚类方法的最佳类簇数确定算法 被引量:8
6
作者 朱二周 孙悦 +3 位作者 张远翔 高新 马汝辉 李学俊 《软件学报》 EI CSCD 北大核心 2021年第10期3085-3103,共19页
聚类分析是统计学、模式识别和机器学习等领域的研究热点.通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来.然而,无监督学习的特性使得当前已有的聚类方法依旧面临着聚类效果不稳定、无法对多种结构的数据集进行正确聚... 聚类分析是统计学、模式识别和机器学习等领域的研究热点.通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来.然而,无监督学习的特性使得当前已有的聚类方法依旧面临着聚类效果不稳定、无法对多种结构的数据集进行正确聚类等问题.针对这些问题,首先将K-means算法和层次聚类算法的聚类思想相结合,提出了一种混合聚类算法K-means-AHC;其次,采用拐点检测的思想,提出了一个基于平均综合度的新聚类有效性指标DAS(平均综合度之差,difference of average synthesis degree),以此来评估K-means-AHC算法聚类结果的质量;最后,将K-means-AHC算法和DAS指标相结合,设计了一种寻找数据集最佳类簇数和最优划分的有效方法.实验将K-means-AHC算法用于测试多种结构的数据集,结果表明:该算法在不过多增加时间开销的同时,提高了聚类分析的准确性.与此同时,新的DAS指标在聚类结果的评价上要优于当前已有的常用聚类有效性指标. 展开更多
关键词 聚类分析 聚类算法 聚类有效性指标 最佳类簇数 据挖掘
下载PDF
分簇传感器网络中最佳簇数的研究 被引量:5
7
作者 冯成旭 刘忠 罗亚松 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第10期49-53,共5页
基于二维泊松点过程、泰森多边形等随机几何学原理,提出了一种求解最佳簇数的计算方法.将网络节点的随机部署与分布抽象为二维泊松点过程,分析计算了该分簇结构网络的特征参数,然后以最小化网络能耗、延长网络寿命为目标,分别提出了求... 基于二维泊松点过程、泰森多边形等随机几何学原理,提出了一种求解最佳簇数的计算方法.将网络节点的随机部署与分布抽象为二维泊松点过程,分析计算了该分簇结构网络的特征参数,然后以最小化网络能耗、延长网络寿命为目标,分别提出了求解单跳和多跳无线传感器网络(WSN)最佳簇数的计算方法,通过数值分析的方法计算求得了最佳的簇数值.网络仿真实验表明:当网络分簇的个数为最佳簇数时全网络的能耗达到最低;相比传统的分簇算法,基于最佳簇数的分簇算法有着更长的网络生存时间. 展开更多
关键词 无线传感器网络 算法 随机几何学 最佳簇数 泊松点过程 网络能耗
原文传递
一种基于谱聚类算法的分簇路由协议
8
作者 芮啟建 韩冰青 《信息技术与信息化》 2024年第3期37-40,共4页
针对经典LEACH协议随机选择簇首导致的极大簇和极小簇、簇首分布不均,从而导致网络生命周期较短的问题,提出一种基于谱聚类的分簇路由协议。在网络初始化时期,在基站计算确定最优簇首数目后,将谱聚类算法应用到节点的分簇中;分簇完成后... 针对经典LEACH协议随机选择簇首导致的极大簇和极小簇、簇首分布不均,从而导致网络生命周期较短的问题,提出一种基于谱聚类的分簇路由协议。在网络初始化时期,在基站计算确定最优簇首数目后,将谱聚类算法应用到节点的分簇中;分簇完成后,节点的分簇保持不变;簇首选择阶段,根据节点剩余能量因子、节点到基站的距离因子来竞争簇首;数据传输阶段,簇内节点通过单跳的方式将数据传送给簇首,簇首将数据融合后通过单跳的方式传送给基站。通过网络仿真实验,比较了网络生存周期、节点剩余总能量和基站接受数据包数量等参数,结果表明:相较于LEACH协议,新协议均衡了网络中节点能耗,延长了网络生存期。 展开更多
关键词 LEACH协议 路由协议 谱聚类 首选举
下载PDF
基于最优簇首数划分单元格的改进GAF算法 被引量:6
9
作者 梁青 李卓冉 +1 位作者 韩昊澎 熊伟 《计算机应用研究》 CSCD 北大核心 2013年第12期3622-3624,共3页
为构造良好的拓扑结构,降低节点能耗,延长网络生存期,对传统的GAF算法进行了改进。改进算法中考虑到连通度和最优簇首数的问题,提出了新的虚拟单元格划分方法。在簇首选择阶段,不仅考虑到节点剩余能量及节点距基站的距离,还考虑到节点... 为构造良好的拓扑结构,降低节点能耗,延长网络生存期,对传统的GAF算法进行了改进。改进算法中考虑到连通度和最优簇首数的问题,提出了新的虚拟单元格划分方法。在簇首选择阶段,不仅考虑到节点剩余能量及节点距基站的距离,还考虑到节点吞吐率的问题,并通过定义簇首选择函数来进行簇首选择。仿真结果显示,改进的GAF算法有效地节省了节点能耗,延长了网络生存期。该算法的各项性能均优于传统的GAF算法。 展开更多
关键词 无线传感器网络 GAF算法 最优 节点吞吐率 首选择函
下载PDF
页岩气井多簇压裂套管应力影响因素分析 被引量:1
10
作者 孙锐 梁飞 +2 位作者 杨钊 高丽 王宇 《石油机械》 北大核心 2023年第8期148-156,共9页
页岩气井储层改造多采用多簇压裂技术实现增产目的,同时也引发了套管失效问题。为研究多簇压裂对套管应力的影响,基于理论公式和有限元分析方法,建立套管应力力学计算模型和多簇裂缝-地层-水泥环-套管三维有限元模型,借助力学模型验证... 页岩气井储层改造多采用多簇压裂技术实现增产目的,同时也引发了套管失效问题。为研究多簇压裂对套管应力的影响,基于理论公式和有限元分析方法,建立套管应力力学计算模型和多簇裂缝-地层-水泥环-套管三维有限元模型,借助力学模型验证有限元模型的可行性,模拟裂缝簇数、岩石弹性模量、水泥环弹性模量、套管内壁压力和地应力变化对套管应力的影响,并针对威荣区块某井压裂段进行实例分析。研究结果表明:套管应力随着裂缝倾角θ的增大而减小,θ=15°为套管应力风险值;套管应力随着压裂簇数的增加整体呈现先小幅增大后减小的趋势;套管应力随着岩石弹性模量的增大而减小,当岩石弹性模量低于45 GPa时,套管应力随着水泥环的硬度增强而增大;套管应力随着水泥环弹性模量的增大而增大,变内压不会改变套管应力变化趋势;套管应力随套管内壁压力的增大而增大,地应力差值的变化不改变套管应力变化趋势;随着地应力差值的增大,套管应力呈现增大的趋势。研究成果对多簇压裂套管的损坏防治具有一定的指导意义。 展开更多
关键词 压裂 套管应力 裂缝诱导应力场 裂缝簇数 地应力场 页岩气井
下载PDF
高能中微子与核乳胶碰撞中的相对赝快度和簇射粒子数密度研究
11
作者 刘福虎 孙君芬 《原子核物理评论》 CAS CSCD 1997年第2期99-101,共3页
论述了高能中微子与核乳胶碰撞中,归一化的两粒子相对赝快度分布。
关键词 相对赝快度 射粒子密度 中微子 核乳胶
下载PDF
基于零级N/T泛数完整簇的概率逻辑算子的研究
12
作者 许海洋 王萍 姜德民 《计算机应用与软件》 CSCD 2009年第2期242-243,265,共3页
在人工智能中不确定性理论、主观Bayes方法、证据理论等都是基于概率论的。但是,这些不确定性推理方法仅仅是基于概率,而不能真正实现逻辑框架内的概率逻辑不确定推理,产生这种现象的主要原因是概率逻辑自身存在着缺陷。按照泛逻辑学的... 在人工智能中不确定性理论、主观Bayes方法、证据理论等都是基于概率论的。但是,这些不确定性推理方法仅仅是基于概率,而不能真正实现逻辑框架内的概率逻辑不确定推理,产生这种现象的主要原因是概率逻辑自身存在着缺陷。按照泛逻辑学的生成规则,基于零级N/T/S范数完整簇从泛逻辑学的角度来构造概率逻辑算子。结果表明概率逻辑是能够在泛逻辑学的框架内进行柔性化的,是命题泛逻辑在h=0.75时的一种特例。 展开更多
关键词 概率逻辑 泛逻辑 零级N/T泛完整 生成元规则
下载PDF
多跳分簇自组网络的最优簇内跳数分析 被引量:4
13
作者 张文庆 李旭 黄文俊 《兵工学报》 EI CAS CSCD 北大核心 2018年第11期2220-2227,共8页
多跳分簇自组网络的网络规模扩展性差、开销大,簇内跳数的选取是影响分簇网络性能的关键。综合考虑路由层簇维护和媒体介入控制层调度的开销,利用硬核泊松点过程推导网络的干扰与容量,进一步建立网络吞吐量与信道利用率模型,以吞吐量最... 多跳分簇自组网络的网络规模扩展性差、开销大,簇内跳数的选取是影响分簇网络性能的关键。综合考虑路由层簇维护和媒体介入控制层调度的开销,利用硬核泊松点过程推导网络的干扰与容量,进一步建立网络吞吐量与信道利用率模型,以吞吐量最大化为目标,以信道利用率为约束,得到最优的簇内跳数。仿真结果表明,所建立的模型能有效反映簇内跳数、节点密度等参数对干扰强度、网络吞吐量和信道利用率的影响,簇内跳数的最优值取决于路径损耗系数和节点密度。 展开更多
关键词 多跳分 自组网络 内跳 硬核泊松点过程 节点吞吐量
下载PDF
无线传感器网络泊松分布最优簇首数目的研究 被引量:3
14
作者 李晓慧 赵远超 赵建平 《通信技术》 2020年第2期335-340,共6页
在无线传感器网络分簇路由协议中,簇首节点通常会消耗更多的能量。簇首节点过多或过少都会增加网络能耗。因此,为延长整个网络的生存周期,需要合理设置簇首节点的个数。在节点服从二维泊松分布的基础上,为最小化网络能耗,提出了一种求... 在无线传感器网络分簇路由协议中,簇首节点通常会消耗更多的能量。簇首节点过多或过少都会增加网络能耗。因此,为延长整个网络的生存周期,需要合理设置簇首节点的个数。在节点服从二维泊松分布的基础上,为最小化网络能耗,提出了一种求解网络最优簇首数目的方法。网络仿真表明,簇首个数为最优簇首数时,整个网络能量消耗最低。将求解的最优簇首数用于LEACH协议中,不仅延长了第一个节点的死亡时间,也提高了整个网络的生存周期。 展开更多
关键词 无线传感器网络 路由协议 网络能耗 泊松分布 最优
下载PDF
基于泊松分布的WSN最优簇首数的研究 被引量:1
15
作者 李晓慧 赵建平 《通信技术》 2020年第6期1385-1391,共7页
针对传统LEACH协议中簇首数随机设置导致网络能耗增加的问题,提出了节点基于泊松分布下sink节点位于传感器网络内部的最优簇首数求解方法。首先,通过建立二维泊松点分布模型模拟传感器节点分布情况;其次,分别讨论网络不同覆盖面积、不... 针对传统LEACH协议中簇首数随机设置导致网络能耗增加的问题,提出了节点基于泊松分布下sink节点位于传感器网络内部的最优簇首数求解方法。首先,通过建立二维泊松点分布模型模拟传感器节点分布情况;其次,分别讨论网络不同覆盖面积、不同节点数等应用场景下的能耗公式,以提高推导的精确性;最后,以最小化网络能耗为目的求出最优值计算公式。理论与仿真结果表明:相比于传统LEACH协议,在不同应用场景中选择合适的簇首数,极大地提高了节点的生存时间,也延长了网络的整体寿命。 展开更多
关键词 无线传感器网络 LEACH协议 网络能耗 泊松分布 最优
下载PDF
铷簇同位素效应的量化研究
16
作者 邸淑红 张阳 +6 位作者 杨会静 崔乃忠 李艳坤 刘会媛 李伶利 石凤良 贾玉璇 《物理学报》 SCIE EI CAS CSCD 北大核心 2023年第18期231-242,共12页
针对簇类同位素位移难以测定及其产生原因难以鉴别等问题,本文运用光磁共振和热离解相结合的技术,获得了气态Rb同位素原子簇^(87,85)Rb_(n)(n=1,2,…,13)两系列共振离解光谱、等数簇矩移、塞曼能移.并对每个簇进行基于巨原子概念模型量... 针对簇类同位素位移难以测定及其产生原因难以鉴别等问题,本文运用光磁共振和热离解相结合的技术,获得了气态Rb同位素原子簇^(87,85)Rb_(n)(n=1,2,…,13)两系列共振离解光谱、等数簇矩移、塞曼能移.并对每个簇进行基于巨原子概念模型量化计算,其结果与实测结果严格一致,表明铷簇可以作为巨原子分析.进一步运用铷簇塞曼能级间隔公式计算出^(87,85)Rb_(n)(n=1,2,3,…,92)5s电子壳层能级结构,发现5s单电子壳层结构主要秩序和步距与钠簇的在球状对称势阱下3s单电子壳层结构相似,证实铷簇5s单电子壳层结构可以由塞曼能级大能隙决定.共振离解光谱的奇偶交替特性及其在特殊数(如n=2)处的反常磁矩特征峰均是由价电子的内在性质和分子结构特性引起.还发现^(87)Rb_(n)与^(85)Rb_(n)的5s单电子壳层结构步调严格一致,量值大小均有3/2比值关系,且二者光谱中心频率及展宽存在反常差异,可能与^(87,85)Rb的核素处于核壳层闭合面附近直接相关. 展开更多
关键词 同位素效应 量化矩移和塞曼能移 巨原子和电子壳结构
下载PDF
威远页岩气水平井压裂参数优化 被引量:2
17
作者 车明光 王萌 +4 位作者 王永辉 宋毅 何封 董凯 阮峰 《西安石油大学学报(自然科学版)》 CAS 北大核心 2022年第2期53-58,共6页
使用Petrel软件建立了威远20XHXX平台的三维地质模型,优化了页岩气水平井分段压裂参数。研究表明不同的压裂段长与射孔簇数有合理的匹配关系,而且存在最优的用液强度和加砂强度,随着压裂段长、射孔簇数的增加,需要合理调减水平井间距。... 使用Petrel软件建立了威远20XHXX平台的三维地质模型,优化了页岩气水平井分段压裂参数。研究表明不同的压裂段长与射孔簇数有合理的匹配关系,而且存在最优的用液强度和加砂强度,随着压裂段长、射孔簇数的增加,需要合理调减水平井间距。针对威远页岩气水平井压裂,建议增加射孔簇数缩小簇间距,提高施工排量,不同压裂段长时采用优化的用液强度和加砂强度值。 展开更多
关键词 页岩气水平井压裂 压裂段长 射孔簇数 水平井间距
下载PDF
基于模糊控制的环形WSN多跳分簇路由算法 被引量:2
18
作者 张雁东 赵宏伟 +1 位作者 王出航 杨兴旺 《吉林大学学报(信息科学版)》 CAS 2020年第4期467-473,共7页
为解决环形无线传感器网络能量空洞和能量最小问题,提出一种基于模糊控制的分簇路由算法FCRA(Fuzzy logic control based Clustering Routing Algorithm)。首先将网络分为宽度相等的环,以每环能耗最小为目标函数,计算出各环的最优簇数... 为解决环形无线传感器网络能量空洞和能量最小问题,提出一种基于模糊控制的分簇路由算法FCRA(Fuzzy logic control based Clustering Routing Algorithm)。首先将网络分为宽度相等的环,以每环能耗最小为目标函数,计算出各环的最优簇数。然后设计簇头选举模糊控制器,其输入为节点剩余能量和到基站距离,输出为节点成为簇头概率。最后,采用簇间多跳模式进行数据传输,基于节点剩余能量、下一跳距离以及到基站跳数确定每条传输路径的权重函数,获得最优下一跳中继节点。仿真结果表明FCRA能有效减小网络能耗、延长网络生命周期。 展开更多
关键词 环形无线传感器网络 模糊控制 最优簇数 多跳路由
下载PDF
自适应邻域密度聚类及事故黑点识别应用
19
作者 刘韡 黄俊龙 +1 位作者 鲁娜 刁麓弘 《黑龙江交通科技》 2024年第6期138-143,150,共7页
聚类作为识别交通事故黑点的主要方法之一,其主要问题是交通事故多发区事先无法确定,即无法提前知道聚类簇数。利用样本点之间的连接概率定义了数据点的局部密度,根据局部密度大小来确定聚类中心和簇数,再对数据点进行聚类。结果表明:... 聚类作为识别交通事故黑点的主要方法之一,其主要问题是交通事故多发区事先无法确定,即无法提前知道聚类簇数。利用样本点之间的连接概率定义了数据点的局部密度,根据局部密度大小来确定聚类中心和簇数,再对数据点进行聚类。结果表明:一是算法对参数不敏感,具有较好的通用性;二是算法能自动确定聚类簇数;三是算法聚类过程只依赖局部密度与邻接点,能够识别噪声点,提升结果的准确性。运用算法在一些真实数据集上进行试验,将聚类结果与其他算法结果利用评价指标ARI(Adjusted Rand Index)和NMI(Normalized Mutual Information)进行比较。最后利用算法对美国6个州的交通事故进行聚类,结果表明算法对交通事故有较好的适应性,能将城市及周边道路上事故密集区域准确识别出来。 展开更多
关键词 交通事故黑点 聚类算法 聚类簇数 自适应邻域聚类 局部密度
下载PDF
海量中文短信文本最佳聚类数研究 被引量:1
20
作者 刘金岭 《计算机工程》 CAS CSCD 北大核心 2010年第8期66-68,共3页
针对海量中文短信文本的聚类簇数的确定问题,提出一种基于聚类过程的短信文本最佳聚类数确定方法。通过扫描一遍数据即可获得多个统计信息,利用增量逐层划分得到最优划分所对应的簇类数,求出最优解。实验结果表明,与其他方法相比,该方... 针对海量中文短信文本的聚类簇数的确定问题,提出一种基于聚类过程的短信文本最佳聚类数确定方法。通过扫描一遍数据即可获得多个统计信息,利用增量逐层划分得到最优划分所对应的簇类数,求出最优解。实验结果表明,与其他方法相比,该方法的分类效率较高。 展开更多
关键词 聚类 簇数 增量 划分
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部