期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
全局模式下的深网数据抽取与挖掘 被引量:1
1
作者 姚晓鹏 高圣兴 +1 位作者 薛君志 陆敏超 《计算机应用与软件》 北大核心 2018年第2期91-95,共5页
随着现代信息量的快速增长,深网作为网络数据载体包含了大量数据,因此,对深网数据抽取的研究十分重要。提出一种全局模式下的数据抽取和挖掘的方法。该方法分析实际例子的属性,运用改进的贝叶斯信念网络算法,确定相应的标签,构建一个动... 随着现代信息量的快速增长,深网作为网络数据载体包含了大量数据,因此,对深网数据抽取的研究十分重要。提出一种全局模式下的数据抽取和挖掘的方法。该方法分析实际例子的属性,运用改进的贝叶斯信念网络算法,确定相应的标签,构建一个动态的全局模式,接着抽取并识别结果页面中的数据;根据基于密度的离群点来检测并剔除其中的无用信息;运用挖掘布尔关联规则频繁项集的算法进行关联挖掘,整合数据项。实验结果表明,该方法相对于其他几种数据抽取方法,能准确、快速、有效地抽取数据,并且通过数据挖掘后得到数据项间的关联性较大,无效信息更少。 展开更多
关键词 深网全局模式 数据抽取 数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部