期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Incrementally Exploiting Sentential Association for Email Classification
1
作者 李曲 何玉 +1 位作者 冯剑琳 冯玉才 《Journal of Southwest Jiaotong University(English Edition)》 2006年第2期129-134,共6页
A novel association-based algorithm EmailinClass is proposed for incremental Email classification. In view of the fact that the basic semantic unit in an Email is actually a sentence, and the words within the same sen... A novel association-based algorithm EmailinClass is proposed for incremental Email classification. In view of the fact that the basic semantic unit in an Email is actually a sentence, and the words within the same sentence are typically more semantically related than the words that just appear in the same Email, EmailInClass views a sentence rather than an Email as a transaction. Extensive experiments conducted on benchmark corpora Enron reveal that the effectiveness of EmallInClass is superior to the non-incremental alternatives such as NalveBayes and SAT-MOD. In addition, the classification rules generated by EroaillnClass are human readable and revisable, 展开更多
关键词 Document requent itemset Category frequent itemset MODFIT heuristic Category prefix-tree Incremental classification
下载PDF
在线挖掘数据流闭频繁项集的高效算法 被引量:2
2
作者 毛伊敏 陈志刚 《计算机科学》 CSCD 北大核心 2013年第2期229-234,共6页
数据流闭频繁项集挖掘算法得到了广泛的研究,其中一个典型的工作就是NewMoment算法。针对New-Moment算法存在搜索空间大而造成算法时间效率低的问题,提出了一种改进的数据流闭频繁项集挖掘算法A-New-Moment。它设计了一个二进制位表示... 数据流闭频繁项集挖掘算法得到了广泛的研究,其中一个典型的工作就是NewMoment算法。针对New-Moment算法存在搜索空间大而造成算法时间效率低的问题,提出了一种改进的数据流闭频繁项集挖掘算法A-New-Moment。它设计了一个二进制位表示项目与扩展的频繁项目列表相结合的数据结构,来记录数据流信息及闭频繁项集。在窗体初始阶段,首先挖掘频繁1-项集所产生的支持度为最大的最长闭频繁项集,接着提出新的"不需扩展策略"和"向下扩展策略"来避免生成大量中间结果,快速发现其余闭频繁项集,达到极大缩小搜索空间的目的。在窗体滑动阶段,提出"动态不频繁剪枝策略"来从已生成的闭频繁项集中快速删除非闭频繁项集,并提出"动态不搜索策略"来动态维护所有闭频繁项集的生成,以降低闭频繁项集的维护代价,提高算法的效率。理论分析与实验结果表明,A-New-Moment算法具有较好的性能。 展开更多
关键词 数据挖掘 数据流 频繁项集 闭频繁项集
下载PDF
关于Top-N最频繁项集挖掘的研究
3
作者 朱颢东 李红婵 《电子科技大学学报》 EI CAS CSCD 北大核心 2010年第5期757-761,773,共6页
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的T... 最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。 展开更多
关键词 关联规则 倒排表 频繁项集 集合理论 支持度
下载PDF
我国天然气产业发展正处于“四期叠加期” 被引量:1
4
作者 刘满平 《当代石油石化》 CAS 2019年第9期1-4,17,共5页
在分析我国天然气行业未来发展趋势和发展方向上,提出了我国天然气产业正处于"四期叠加期",即"快速发展期""政策频出期""改革适应期"和"利益博弈期"。
关键词 快速发展期 政策频出期 改革适应期 利益博弈期
下载PDF
体育院校大学生开设文学欣赏课必要性探析
5
作者 李微微 《吉林体育学院学报》 2009年第4期125-126,共2页
针对当今体育院校对开设文学欣赏课的非议和体育大学生的特点,阐述了体育院校大学生开设文学欣赏课的必要性。
关键词 文学欣赏 认知能力 精神需求 意志品质
下载PDF
基于频繁项自适应学习的分类算法
6
作者 于海鹏 《河南工程学院学报(自然科学版)》 2018年第1期65-70,共6页
为了提高大数据在存在类间闭频繁项干扰下的分类提取能力,提出了一种基于频繁项自适应学习的大数据优化分类算法.采用离散高斯随机序列分析方法构建大数据信息流模型,对大数据分布式时间序列进行奇异值分解和特征空间重组,将大规模的数... 为了提高大数据在存在类间闭频繁项干扰下的分类提取能力,提出了一种基于频繁项自适应学习的大数据优化分类算法.采用离散高斯随机序列分析方法构建大数据信息流模型,对大数据分布式时间序列进行奇异值分解和特征空间重组,将大规模的数据问题变为一系列小规模特征分解运算.采用分段预白化匹配滤波算法进行类间闭频繁项干扰抑制处理,提高大数据分类的局部平稳性和泛化性.在重组的特征空间中提取大数据信息流的高阶累积量特征,采用模糊K均值聚类方法对提取的特征量进行分类处理,实现了大数据分类算法的改进.仿真结果表明,采用该算进行大数据分类的准确性较好,抗干扰能力较强,可实现海量大数据的快速聚类,具有较好的自适应学习能力,全局收敛性较好. 展开更多
关键词 频繁项 自适应学习 大数据 分类 模糊K均值聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部