期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
CBC算法在网页分类中的应用研究 被引量:1
1
作者 张婕 山岚 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第B12期90-94,共5页
针对目前网页分类存在的问题,选择利用近义词聚类的方法,将CBC算法运用到网页聚类中,并加入搜索词作为主要的参照数据,通过在聚类算法中加入限定参数的方法对CBC算法进行了改进。用数据集实验对改进后的CBC算法与传统的k-means算法的结... 针对目前网页分类存在的问题,选择利用近义词聚类的方法,将CBC算法运用到网页聚类中,并加入搜索词作为主要的参照数据,通过在聚类算法中加入限定参数的方法对CBC算法进行了改进。用数据集实验对改进后的CBC算法与传统的k-means算法的结果进行了比较,结果表明改进算法在精确度上优于传统的k-means算法,在效率上也有较为明显的优势。 展开更多
关键词 聚类算法 网页分类 特征权值 cbc算法
下载PDF
基于CBC聚类方法对特定领域术语的自动获取
2
作者 谢芳 胡泉 《软件导刊》 2008年第9期23-24,共2页
提出并建立了一种基于CBC聚类方法的领域术语自动获取模型,该模型避免了单纯以领域相减或统计方法获取领域术语的局限性。并引入修正的余弦公式来进行术语间相似度的计算,来实现领域术语自动获取系统的核心模块。
关键词 术语 领域术语 cbc聚类 中文信息处理
下载PDF
基于聚类方法对特定领域术语的自动筛选 被引量:7
3
作者 李勇 《计算机工程与科学》 CSCD 2008年第2期64-66,134,共4页
从大规模无标注的文本中获取特定领域的术语词典,通常采用的方法是从术语抽取器得到相关术语,而后使用手工的方式进行术语筛选,得到相关领域的术语。这需要大量的人力物力,并且标准无法统一。本文提出了一种利用CBC聚类方法从抽取的术... 从大规模无标注的文本中获取特定领域的术语词典,通常采用的方法是从术语抽取器得到相关术语,而后使用手工的方式进行术语筛选,得到相关领域的术语。这需要大量的人力物力,并且标准无法统一。本文提出了一种利用CBC聚类方法从抽取的术语文本中自动剔除非此领域的术语,并且通过对训练语料库文本的不断丰富,还可以对新词进行识别,以扩大该领域的术语集。最后,通过对实验结果进行评测,显示了CBC聚类方法对术语筛选的良好效果。 展开更多
关键词 cbc聚类方法 术语筛选 语料库 术语抽取
下载PDF
基于聚类和协同标注的TSVM算法 被引量:4
4
作者 杜红乐 张燕 《河南科学》 2017年第1期22-27,共6页
针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进... 针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进行投票,提高标记准确率,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能.KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率. 展开更多
关键词 直推式支持向量机 聚类算法 委员会投票算法 协同标注
下载PDF
致密砂岩气藏动态分类委员会机器测井流体识别方法 被引量:10
5
作者 白洋 谭茂金 +4 位作者 肖承文 韩闯 武宏亮 罗伟平 徐彬森 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2021年第5期1745-1758,共14页
致密砂岩流体识别难度大,智能算法能够较好地建立其流体识别模型.相较于单一智能算法,分类委员会机器通过联合多个专家(智能算法)有助于提升智能模型整体性能.而针对分类委员会机器中单个专家性能难以提升的问题,添加门网络构建动态分... 致密砂岩流体识别难度大,智能算法能够较好地建立其流体识别模型.相较于单一智能算法,分类委员会机器通过联合多个专家(智能算法)有助于提升智能模型整体性能.而针对分类委员会机器中单个专家性能难以提升的问题,添加门网络构建动态分类委员会机器是一种更有效的模块化学习方式.本研究首先采用门网络将输入数据划分为多个子数据集,然后联合决策树、概率神经网络、贝叶斯分类、BP神经网络、最近邻算法分别训练子数据集得到多个子模型,最后利用组合器最优化子模型组合得到最佳的流体识别模型.针对塔里木盆地库车坳陷大北、克深、博孜地区致密砂岩地层测井数据和测试数据,采用平均影响值法优选敏感测井系列作为输入,构建了动态的测井流体识别模型,其训练、验证准确率分别为96.29%和91.39%.利用此模型以BZ9井为例进行流体类型判别,预测结果与测试结果一致.该方法将无监督与有监督学习相结合,引入门网络提高了数据集利用效率,避免了数据集分布不均衡对模型构建的影响;采用投票机制集成多种专家,建立了子模型与专家的适应关系,流体识别模型预测精度和泛化能力大大提高. 展开更多
关键词 致密气 流体识别 智能算法 聚类 动态分类委员会机器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部