广义Web内容挖掘模型算法被引量：1

Models and algorithms for Web content mining in broad sense

下载PDF

导出

摘要在信息时代的今天,网络以几何速度飞速发展,成为现代人获取信息的主要来源之一.也正因为网络信息增长太快,人们反而面临“信息爆炸”与“知识贫瘠”共存的局面.数据挖掘(DM)是通过数据获取知识的最佳工具,由此,产生了Web数据挖掘,即KDW的概念.本文重点论述广义Web内容挖掘的特点与发展、狭义的内容挖掘中页面内和页面间挖掘的区分及应用的主要算法、结构挖掘中的两大算法及其优劣. The network developing at the speed of geometry becomes one of main sources for the moderns to get information in this information age. Yet because the development speed is too high, the people face the situation of 'information explosion' and 'barren knowledge' coexisting. Data Mining is the best tool to obtain knowledge through data analysis and therefore the concept of KDW is produced. In this paper, the author mainly discusses Web Content Mining in broad sense, the differentiation between inside and outside web-page mining, main algorithms and their variants for web content mining in a narrow sense, and the good and bad points of two major algorithms in web structure mining.

作者高宏朱耀稷

机构地区天津大学管理学院

出处《天津理工大学学报》 2005年第2期29-32,共4页 Journal of Tianjin University of Technology

基金天津市自然科学基金资助项目(043612211).

关键词广义Web内容挖掘数据挖掘 DM 结构挖掘算法 Web content mining in broad sense OEM VSM HITS PageRank

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1王宁,徐宏炳,王能斌.基于带根连通有向图的对象集成模型及代数[J].软件学报,1998,9(12):894-898. 被引量：25
2Han Jia-wei, Kamber M. Data mining concepts and techniques[M]. LOS ALtos: Morgan Kaufmann Publishers, 2001.
3Chakrabarti S. Data mining for hypertext:a tutorial survey[J].ACM SIGKDD, 2000, 1(2):15- 18.
4Goldman R, Chawathe S, Crespo A, et al. A standard textual interchange format for the object exchange model[ EB/OL].http://www. db. standford. edu/～ mchughj/oemsyntax. html,2002-03-10/2004-06-12.
5林建勤.XML与Web数据挖掘技术[J].贵州师范大学学报（自然科学版）,2003,21(2):106-110. 被引量：4
6杨炳儒,陈泓婕.多最小支持度规则的挖掘算法[J].计算机工程,2003,29(6):40-41. 被引量：5

二级参考文献6

1Yang Bingru(School of information Engineering,University of Science and Technology of BeiJing,100083, P. R. China)Xiong Fanlun(The institute of Intelligent Machine, Academic Sinica,Hefei 230031, P. R. China).KD(D&K) and Double-Bases Cooperating Mechanism[J].Journal of Systems Engineering and Electronics,1999,10(2):48-54. 被引量：7
2Wang N，Proceedings of the 1997 IEEE International Conference on Intelligent Processing Systems，1997年，1589页
3王能斌，数据库系统，1995年，24页
4陈莉,焦李成.Internet/Web数据挖掘研究现状及最新进展[J].西安电子科技大学学报,2001,28(1):114-119. 被引量：77
5左开中,汪伟.XML语言在Web数据挖掘中的应用[J].微机发展,2002,12(3):59-61. 被引量：16
6沈洁,薛贵荣.一种基于XML的Web数据挖掘模型[J].系统工程理论与实践,2002,22(9):74-77. 被引量：33

共引文献31

1林建勤.基于Web的数据挖掘应用模式研究[J].贵州师范大学学报（自然科学版）,2004,22(3):92-96. 被引量：10
2王晓刚,王治纲,卢正鼎.PANORAMA多数据库系统的后处理查询策略[J].小型微型计算机系统,2004,25(10):1861-1865.
3朱征宇,王亮,赵银春,程代杰.基于扩展标记图的网页信息重组技术[J].计算机科学,2004,31(5):56-60. 被引量：3
4鲁明羽,陆玉昌.基于OEM模型的半结构化数据的模式抽取[J].清华大学学报（自然科学版）,2004,44(9):1264-1267. 被引量：8
5张仕,赖会霞,毛宇光.XML形式数据模型及其查询代数[J].计算机工程与设计,2005,26(2):335-338. 被引量：2
6张英朝,张维明,肖卫东,沙基昌.虚拟组织中面向共享的信息统一描述模型研究[J].系统工程学报,2005,20(1):62-72. 被引量：12
7韩江洪,郑淑丽,魏振春,蒋建文,吴永忠.面向XML的Web数据模型研究[J].小型微型计算机系统,2005,26(4):609-613. 被引量：5
8吴安阳,赵卫东.基于多最小支持度的空间关联规则发现[J].计算机应用,2005,25(9):2171-2174. 被引量：7
9张伟业,贺飞,顾明.基于OIM数据对象模型的数据交换系统研究[J].计算机应用研究,2005,22(11):34-37.
10史原,鲁汉榕,罗菁,高婷.基于规模约简和多支持度的关联规则挖掘[J].计算机工程与设计,2006,27(21):4105-4107. 被引量：8

同被引文献9

1杨鲲,孟波.一种基于XML的Web数据挖掘方法[J].计算机应用,2003,23(z1):160-161. 被引量：9
2戴东波,印鉴.结合使用挖掘和内容挖掘的web推荐服务[J].计算机工程与应用,2005,41(18):162-165. 被引量：10
3杨彬.利用XML技术进行Web内容挖掘[J].计算机与现代化,2005(11):48-50. 被引量：6
4王玉珍.Web数据挖掘技术与XML[J].信息技术,2005,29(10):142-144. 被引量：11
5张建喜,王洪国,赵培英.XML在Web数据挖掘技术中的应用[J].信息技术与信息化,2005(5):109-111. 被引量：2
6郑跃平,陈传峰.基于XML的WEB数据收集的一种应用[J].福建电脑,2005,21(12):1-2. 被引量：1
7王震江.基于XML数据库的Web应用研究[J].计算机应用研究,2005,22(12):215-217. 被引量：3
8陈晓红,秦杨.基于Web数据挖掘的高效关联规则研究[J].计算机工程与科学,2005,27(11):48-51. 被引量：9
9涂承胜,鲁明羽,陆玉昌.Web内容挖掘技术研究[J].计算机应用研究,2003,20(11):5-9. 被引量：23

引证文献1

1曾小宁.基于XML的Web挖掘[J].广西教育学院学报,2007(2):72-74.

1李长江.基于web的数据挖掘技术的应用研究[J].才智,2009,0(10):62-62.
2恽爽,韩立新,董浚,陈道蓄.KDW综述:基于Web的数据挖掘[J].计算机工程,2003,29(1):284-286. 被引量：19
3王晶.基于Web的数据挖掘技术研究综述[J].光盘技术,2008(7):14-14. 被引量：1
4李斌.沙地上永远的开拓者[J].信息网络,2004(10):39-40.
5沈佑田.计算机网络安全问题与防护策略探讨[J].产业与科技论坛,2011(6):62-63. 被引量：21
6熊永亮.关于计算机网络安全问题与防护的思考[J].硅谷,2011,4(9):189-189. 被引量：2
7刘毅.计算机软件制作上数据库架构的应用探析[J].数码世界,2016,0(8):6-7.
8邵雪.计算机网络安全问题与防护策略探讨[J].产业与科技论坛,2011(7):84-85. 被引量：8
9彭英.KDW新技术探讨[J].长沙通信职业技术学院学报,2004,3(2):28-31.
10尚福华,孙丽.基于XML的Web数据抽取方法的研究[J].黑龙江工程学院学报,2004,18(1):28-30. 被引量：2

天津理工大学学报

2005年第2期

浏览历史

内容加载中请稍等...

广义Web内容挖掘模型算法被引量：1

参考文献6

二级参考文献6

共引文献31

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

广义Web内容挖掘模型算法 被引量：1

参考文献6

二级参考文献6

共引文献31

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

广义Web内容挖掘模型算法被引量：1