期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于包含与演绎分析的无冗余序列规则挖掘
1
作者 周新 王乙民 +1 位作者 刘婧 尤涛 《计算机应用与软件》 CSCD 2016年第3期52-55,66,共5页
序列规则挖掘旨在发现频繁序列之间的因果关联,当前最优的序列规则产生方法仅考虑两规则间的包含关系而没有考虑多规则间的演绎关系,故而存在大量冗余。引入演绎无冗余规则的概念,分析演绎冗余的原因,重新定义了无冗余规则的概念。在频... 序列规则挖掘旨在发现频繁序列之间的因果关联,当前最优的序列规则产生方法仅考虑两规则间的包含关系而没有考虑多规则间的演绎关系,故而存在大量冗余。引入演绎无冗余规则的概念,分析演绎冗余的原因,重新定义了无冗余规则的概念。在频繁闭序列及其生成子的基础上,基于最大重叠项冗余性检查给出了无冗余规则抽取算法。理论分析和实验评估表明该算法在处理效率基本不变的前提下,提高了序列规则的生成质量。 展开更多
关键词 事件 序列规则 包含 演绎 无冗余
下载PDF
基于规则置信度调整的知识挖掘及在烟草科技管理中的应用
2
作者 王塑 张萍 +1 位作者 周新 王乙民 《计算机应用与软件》 CSCD 2016年第3期87-89,95,共4页
介绍信息管理领域中的一个热门研究主题——知识挖掘。知识挖掘旨在从结构化、半结构化的数据中挖掘信息。例如从电子文档、不完备的历史数据中搜索稳定的模式或模型,分析挖掘数据间的交互特征和规律,以辅助管理人员制定、调整规范与标... 介绍信息管理领域中的一个热门研究主题——知识挖掘。知识挖掘旨在从结构化、半结构化的数据中挖掘信息。例如从电子文档、不完备的历史数据中搜索稳定的模式或模型,分析挖掘数据间的交互特征和规律,以辅助管理人员制定、调整规范与标准,构建专家库和知识库。提出知识挖掘的一种改进方法,通过动态规则置信度生成算法提高所获得规则的准确性与适应性,并结合烟草企业科技项目智能辅助管理中的实际应用进行了验证,取得了一定的成效。 展开更多
关键词 知识挖掘 规则置信度 信息管理
下载PDF
面向烟草企业的数据挖掘中分类算法分析与量化研究
3
作者 王塑 张萍 +1 位作者 周新 王乙民 《办公自动化》 2014年第17期45-49,共5页
采用交叉验证方法针对C4.5、Bayesian置信网络、序贯最小优化(SMO)三种主流数据挖掘分类算法对中国烟草年鉴2011-2012中的销售数据进行了实验分析,分别得出了在相同训练、测试样本数据下三种算法建立模型所需时间、分类准确性、覆盖率及... 采用交叉验证方法针对C4.5、Bayesian置信网络、序贯最小优化(SMO)三种主流数据挖掘分类算法对中国烟草年鉴2011-2012中的销售数据进行了实验分析,分别得出了在相同训练、测试样本数据下三种算法建立模型所需时间、分类准确性、覆盖率及Margin曲线。分析了训练样本数量对三种算法的不同影响,为使用者在不同的样本质量下选择相应的分类算法提供理论和实验依据。 展开更多
关键词 数据挖掘 分类算法 训练样本 Margin曲线
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部