协方差特征爬虫网页语义概念树构建方法被引量：1

Construction Method of Webpage Semantic Concept Tree Based on Covariance Features Reptile

下载PDF

导出

摘要提出一种基于协方差特征爬虫的网页语义概念树构建方法,引入语义概念决策树算法进行主特征建模,根据语义三叉特征决策树概率正则训练迁移法则,得到决策树网络节点最近时刻获得的数据集有效特征概率,采用协方差特征网页爬虫进行网页语义概念树构建算法的改进。通过协方差特征爬虫,进行自相关成分的独立快速分离,得到语义自相关检索编码,实现网页语义概念树构建指导信息检索。仿真结果表明,该算法能有效进行数据挖掘和网页语义概念树的构建,为信息定位提供了最优分叉路径,从而实现对主题热点信息的准确检索和定位,算法具有较好的网页召回和定位检索性能,数据召回率提高明显,展示了较好的应用价值。 Construction method of Webpage semantic concept tree is proposed based on covariance features reptile, the decision tree algorithm of feature modeling is obtained, according to semantic trigeminal feature decision tree probability regular training transfer rule, decision tree node set effective feature probability is obtained, the covariance feature Webpage crawler is used to design Webpage semantic concept tree construction algorithm. The covariance features reptile, rapid separation of autocorrelation components are independent, the semantic correlation retrieval code, and the Webpage semantic concept tree construction guidance information retrieval is realized. The simulation results show that, the algorithm can effectively realize data mining and Webpage semantic concept tree, it provides the optimal branching path for the information orientation, so as to realize the theme topic information retrieval and location accuracy, the algorithm has better Webpage recall and positioning data retrieval performance, it can improve the recall rate significantly, it has a good application value.

作者梁武苏燕

机构地区北海职业学院电子信息工程系

出处《科技通报》北大核心 2015年第4期85-87,共3页 Bulletin of Science and Technology

基金广西高等教育教改工程项目(NO.2012JGB404)

关键词协方差特征爬虫网页语义概念树 covariance characteristics of crawler Webpage semantic concept tree

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王曙燕,耿国华,李丙春.决策树算法在医学图像数据挖掘中的应用[J].西北大学学报（自然科学版）,2005,35(3):262-265. 被引量：22
2饶翔,王怀民,陈振邦,周扬帆,蔡华,周琦,孙廷韬.云计算系统中基于伴随状态追踪的故障检测机制[J].计算机学报,2012,35(5):856-870. 被引量：23
3刘燕.基于云计算信息处理系统体系结构设计[J].科技通报,2012,28(8):100-102. 被引量：24
4杨来,史忠植,梁帆,齐保元.基于Hadoop云平台的并行数据挖掘方法[J].系统仿真学报,2013,25(5):936-944. 被引量：38
5覃雄派,王会举,李芙蓉,李翠平,陈红,周烜,杜小勇,王珊.数据管理技术的新格局[J].软件学报,2013,24(2):175-197. 被引量：110
6A Goupil,J Palicot.An Efficient Blind Decision Feedback Equalizer[J].Communications Letters,2010,14(5):462-464.

二级参考文献163

1Candea G, Kawamoto S, Fujiki Y et al. Microreboot--A technique for cheap reeovery//Proceedings of the 6th Confer- ence on Symposium on Opearting Systems Design & Imple- mentation-Volume 6. San Francisco, USA, 2004:3.
2Lin T T Y, Siewiorek D P. Error log analysis: Statistical modeling and heuristic trend analysis. IEEE Transactions on Reliability, 1990, 39(4): 419-432.
3Yuan D, Mai H, Xiong W et al. SherLog: Error diagnosis by connecting clues from run-time logs//Proceedings of the 15th Edition of ASPLOS on Architectural Support for Pro- gramming Languages and Operating Systems. Pittsburgh, Pennsylvania, USA, 2010:143-154.
4Zheng A X, Lloyd J, Brewer E. Failure diagnosis using deci- sion trees//Proeeedings of the 1st International Conference on Autonomie Computing. Limassol, Cyprus, 2004:36-43.
5Tan J, Kavulya S, Gandhi R et al. Visual, Log-based causal tracing for performance debugging of MapReduce systems// Proceedings of the 2010 IEEE 30th International Conference on Distributed Computing Systems. Genoa, Italy, 2010: 795-806.
6Zheng Z, Lan Z, Park B H et al. System log pre-processing to improve failure prediction//Proceedings of the IEEE/IFIP International Conference on Dependable Systems & Net- works(DSN'09). Lisbon, Poltugal, 2009:572-577.
7Reidemeister T, Munawar M A, Jiang Met al. Diagnosis of recurrent faults using log files//Proeeedings of the 2009 Con- ference of the Center for Advanced Studies on Collaborative Research. Ontario, Canada, 2009: 12-23.
8Chen M Y, Kiciman E, Fratkin E et al. Pinpoint: Problem determination in large, dynamic internet services//Proceed- ings of the 2002 International Conference on Dependable Sys- tems and Networks. Bethesda, USA, 2002:595-604.
9Barham P, Donnelly A, Isaaes R et al. Using magpie for request extraction and workload modelling//Proceedings of the 6th Conference on Symposium on Opearting Systems Design & Implementation-Volume 6. San Francisco, USA, 2004:18.
10Tan P N, Steinbach M, Kumar V. Introduction to Data Mining. Bostom Pearson Addison Wesley, 2006.

共引文献200

1蔡维,尚雷明,杨子辉,石志勇,郝丽娟,胡丽琴.聚变实验装置数据库设计[J].计算机系统应用,2020,29(10):109-113.
2刘汉龙,马彦彬,仉文岗.大数据技术在地质灾害防治中的应用综述[J].防灾减灾工程学报,2021,41(4):710-722. 被引量：22
3张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013,50(S2):216-233. 被引量：375
4叶明全.数据挖掘在医疗数据中的应用[J].安徽工程科技学院学报（自然科学版）,2007,22(3):54-57. 被引量：5
5王曙燕,耿国华,陈绮.Rough集在乳腺癌辅助诊断中的应用[J].西北大学学报（自然科学版）,2007,37(4):573-576. 被引量：2
6张春芬,朱玉全,陈耿,王敏.基于Cascade组合分类器的医学图像分类方法研究[J].计算机工程与应用,2007,43(36):211-213. 被引量：1
7游福成.一种新的分层概念信息熵方法及其应用[J].电子学报,2007,35(B12):136-139.
8易静,苏新良,王润华.决策树在乳腺癌高位淋巴结转移判别诊断中的应用[J].重庆医科大学学报,2009,34(5):606-609. 被引量：7
9黄秋勇,唐爱龙.关联规则在图像数据挖掘中的应用[J].计算机与现代化,2009(10):98-100. 被引量：5
10潘雯.基于决策树的异常高频心电图识别[J].物理实验,2009,29(11):29-34. 被引量：2

同被引文献8

1张红云,刘炜,熊前兴.一种基于语义本体的网络爬虫模型[J].计算机应用与软件,2009,26(11):101-103. 被引量：4
2杨俊峰,黎建辉,杨风雷.深层网站Ajax页面数据采集研究综述[J].计算机应用研究,2013,30(6):1606-1610. 被引量：26
3王跃,于世伟,路博,金桦.基于爬虫的移动互联网应用监测分析系统研究[J].电视技术,2015,39(13):88-92. 被引量：2
4王景中,邱铜相.基于TF-IDF改进算法的聚焦主题网络爬虫[J].计算机应用,2015,35(10):2901-2904. 被引量：16
5侯东阳,武昊,王军锋,王明山.基于深层网络爬虫的Web地图服务发现方法[J].地理与地理信息科学,2015,31(5):10-13. 被引量：11
6张胜桥,尹青,常瑞,朱晓东.基于APK的Android应用程序GUI遍历自动化方法[J].计算机应用,2016,36(11):3178-3182. 被引量：3
7常炳国,刘清星.基于深度学习的慢性肝病CT报告相似度分析[J].计算机应用与软件,2018,35(8):289-294. 被引量：2
8刘进,印宏坤,陈果,张宇,顾祖超,唐静.MRI组学特征构建机器学习模型预测胸腰段再骨折[J].中国组织工程研究,2022,26(33):5323-5328. 被引量：6

引证文献1

1白金川,王豪,焦宝园,娄元仓,陈秋冰,李中伟.Python网络爬虫在医学影像领域的发展现状与趋势研究[J].生物医学工程学进展,2023,44(3):260-266. 被引量：2

二级引证文献2

1裴莹,王鏖清,韩霄松.基于国际新闻的疾病趋势预测算法[J].生物医学工程学进展,2023,44(4):398-404.
2王晨.基于Python爬虫的豆瓣书籍数据分析和可视化[J].信息与电脑,2023,35(23):174-176.

1孙亚琳,赵林林,杨小平.基于主题词表和FCA的网页语义概念树构建研究[J].计算机应用研究,2014,31(11):3308-3315. 被引量：2
2王邦军,李凡长,张莉,于剑,何书萍.基于改进协方差特征的李-KNN分类算法[J].模式识别与人工智能,2014,27(2):173-178. 被引量：8
3杨海南.基于语义概念树和局部上下文分析的查询扩展[J].武汉理工大学学报（信息与管理工程版）,2011,33(1):79-82. 被引量：3
4花樱,彭宏京,顾佳玲.Boosting协方差特征的人脸检测方法[J].计算机工程与应用,2010,46(18):186-189. 被引量：4
5卢承山.基于本体语义树的主题空间向量模型[J].计算机系统应用,2011,20(10):44-48. 被引量：1
6严灿勋,刘慧敏,宋兰.基于C#正则表达式的英汉翻译对抽取[J].科技信息,2011(26):1-2. 被引量：1
7倪景秀,尤克,贾民政.语义模型在Overlay网络服务发现机制中的应用[J].计算机工程,2008,34(4):143-145.
8曹海燕.网页爬虫系统的设计[J].中国科技博览,2015,0(5):226-226. 被引量：1
9李松林.快速分离Flash中的MP3文件[J].电脑迷,2004,0(1):7-7. 被引量：1
10谭海中,何波.基于多因素方差分析的文本向量特征挖掘算法[J].科技通报,2015,31(6):139-141. 被引量：2

科技通报

2015年第4期

浏览历史

内容加载中请稍等...

协方差特征爬虫网页语义概念树构建方法被引量：1

参考文献6

二级参考文献163

共引文献200

同被引文献8

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

协方差特征爬虫网页语义概念树构建方法 被引量：1

参考文献6

二级参考文献163

共引文献200

同被引文献8

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

协方差特征爬虫网页语义概念树构建方法被引量：1