期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于关联规则挖掘的中文文本自动分类 被引量:13
1
作者 王元珍 钱铁云 冯小年 《小型微型计算机系统》 CSCD 北大核心 2005年第8期1380-1383,共4页
随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类... 随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类器,可用于类标号未知的文档的区分.实验证明,该算法能较快地获得可理解的规则并且具有较好的召回率和准确率. 展开更多
关键词 基于关联的分类 中文文本分类 关联规则挖掘
下载PDF
结合类频率的关联中文文本分类 被引量:12
2
作者 钱铁云 王元珍 冯小年 《中文信息学报》 CSCD 北大核心 2004年第6期30-36,共7页
该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关... 该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。 展开更多
关键词 计算机应用 中文信息处理 基于关联的分类 中文文本分类 词类频率 类别特征词集合
下载PDF
使用多支持度的关联规则分类算法 被引量:2
3
作者 黄亚东 刘渊 《计算机应用与软件》 2017年第9期246-252,共7页
传统关联分类算法使用单一最小项目支持度挖掘关联规则,导致稀有项关联规则无法被发现,从而影响分类的准确性和实用性。提出一种多支持度关联规则分类算法MS-CBAR(Multiple Supports-Classification Based on Association Rules),将多... 传统关联分类算法使用单一最小项目支持度挖掘关联规则,导致稀有项关联规则无法被发现,从而影响分类的准确性和实用性。提出一种多支持度关联规则分类算法MS-CBAR(Multiple Supports-Classification Based on Association Rules),将多最小项目支持度模型应用于关联分类,以有效挖掘稀有项。该算法为数据库中的规则项提供了用户可定义的最小项目支持度。MS-CBAR算法使用项的最小项支持度阈值、类的最小类支持度值和规则项的最小支持度值决定分类规则是否频繁。生成分类规则集后,使用最高优先度规则覆盖法基于规则集建立分类器。实验表明,所提算法在包含稀有项目及稀有类的数据集中准确率高于传统关联分类算法及其相关算法,表现更稳定。 展开更多
关键词 数据挖掘 多最小项目支持度 基于关联的分类算法 MS-CBAR
下载PDF
挖掘重要项集的关联文本分类 被引量:2
4
作者 蔡金凤 白清源 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第5期544-550,共7页
针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用... 针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用特征项权重定义了k-项集重要度,通过挖掘重要项集来产生关联规则,并考虑提升度对待分类文本的影响.实验结果表明,挖掘重要项集的ISARC算法可以提高关联文本分类的准确率. 展开更多
关键词 文本分类 基于关联规则的分类算法 权重 重要项集
下载PDF
基于数据挖掘的银行全成本分析 被引量:4
5
作者 任秀丽 史忠植 《计算机应用研究》 CSCD 北大核心 2007年第9期53-54,57,共3页
针对银行全成本分析的业务特点和数据挖掘各种算法的应用特征,提出了基于关联规则的分类算法在银行全成本分析系统中的分析模型。将此模型与其他机器学习分类算法进行实验比较,得出此算法在该领域的最佳效果,所挖掘出的规则得到银行工... 针对银行全成本分析的业务特点和数据挖掘各种算法的应用特征,提出了基于关联规则的分类算法在银行全成本分析系统中的分析模型。将此模型与其他机器学习分类算法进行实验比较,得出此算法在该领域的最佳效果,所挖掘出的规则得到银行工作人员的肯定。 展开更多
关键词 银行全成本分析 数据挖掘 基于关联规则的分类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部