聚焦爬虫在互联网金融领域的应用
摘要
聚焦爬虫是一种可以按照特定主题来对主页内容进行自动抓取的程序,目前很多搜索引擎和网站都应用了这种技术。因为其自动抓取数据的特点贴合了互联网金融对数据的需求,所以在很多互联网金融行业中也引入了聚焦爬虫,并把它作为重要的数据来源。
出处
《产业与科技论坛》
2016年第11期50-51,共2页
Industrial & Science Tribune
二级参考文献38
-
1周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量:154
-
2姚树宇,赵少东.一种使用分布式技术的搜索引擎[J].计算机应用与软件,2005,22(10):127-129. 被引量:7
-
3李卫,刘建毅,何华灿,王枞.基于主题的智能Web信息采集系统的研究与实现[J].计算机应用研究,2006,23(2):163-166. 被引量:15
-
4QIN JL, ZHOU YL, CHAU M. Building domain specific web collec- tions for scientific digital libraries: a meta search enhanced focused crawling method [A]. Proceedings of the 4th ACM/IEEE - CS joint conference on Digital libraries [C]. 2004. 6.
-
5KRISHNA B, GEORGEAM. When experts agree: using nenaffiliated experts to rank popular topics: prec. of the 10th International World WideWeb Conference [C]. [s.l.]: [s.n.], 2001.
-
6HAVELIWALA T H. Topic---sensitive PageRank: proc. of the 11th International World Wide Web Conference [ C ]. [ s.l. ]: [ s. n. ], 2002.
-
7Kleinberg J. Authoritative sources in a hyperlinked environment [J]. Journal of the ACM, 1999, 46 (5) : 604 - 632.
-
8M. R. Henzinge. Hyperlink analysis for the Web [ J]. IEEE. lntemet Computing, Jan/Feb, 2001, 5 (1): 45- 50.
-
9Yang Shengyuan. A focused crawler with ontology- supported website models for information agents [ C ]. Advances in Grid and Pervasive Computing, 2010: 522-532.
-
10UDDIN M Z, LEE J J, KIM T S, Independent shape component- based human activity recognition via Hidden Markov Model [J]. Ap- plied Intelligence, 2010, 33 (2) : 193 - 206.
共引文献146
-
1赵志滨,贾岩峰,姚兰,鲍玉斌.含有丰富结构化数据的Web页面分类技术的研究[J].计算机研究与发展,2013,50(S1):53-60. 被引量:5
-
2尹江,尹治本,黄洪.网络爬虫效率瓶颈的分析与解决方案[J].计算机应用,2008,28(5):1114-1116. 被引量:18
-
3曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,17(5):122-126. 被引量:39
-
4王岩.搜索引擎中网络爬虫技术的发展[J].电信快报(网络与通信),2008(10):20-22. 被引量:11
-
5戚欣.基于本体的主题网络爬虫设计[J].武汉理工大学学报,2009,31(3):138-141. 被引量:14
-
6蒋元成,蔡皖东.基于主动探测的BT行为监测系统设计与实现[J].航空计算技术,2009,39(1):134-137. 被引量:1
-
7张博,蔡皖东.面向主题的网络蜘蛛技术研究及系统实现[J].微电子学与计算机,2009,26(5):52-55. 被引量:13
-
8曾云令,蔡皖东.eMule行为监测技术研究与系统实现[J].微电子学与计算机,2009,26(5):126-129.
-
9张春元,康耀红,伍小芹.Web新闻自动采集发布系统的设计与实现[J].计算机技术与发展,2009,19(9):250-252. 被引量:7
-
10王正,陆余良,刘金红,施凡.基于Lucene的互联网文献信息检索系统的研究[J].安徽大学学报(自然科学版),2009,33(5):32-35. 被引量:2
-
1邵长年,单建生.金币“阳光工程”春暖新年[J].中国金融家,2011(1):109-112.
-
2陈双.税收监控预警系统的设计与实现[J].物联网技术,2016,6(4):96-99. 被引量:4
-
32009年央行将发行20种纪念金币[J].中国贵金属,2009(4):47-48.
-
4林梦.金银币 再逢春[J].中外文化交流,2011(8):44-47.
-
5汪昌桥.中国现代纪念币知识问答[J].安徽钱币,2000(3):38-41.
-
6全球首个投资机器人亮相1分钟可完成40小时工作量[J].走向世界,2016,0(19):9-9.
-
7中国贵金属纪念币基础知识[J].中国金融家,2006(9):81-83.
-
8张庆.纪念币反假问题的思考[J].广西金融研究,2008(B12):54-54.
-
9徐林章.政府上网和税务部门网站[J].税收与社会,1999(10):53-53.
-
10谭薇.银行结售汇数据核查方法探讨[J].金融经济(下半月),2014(3):193-195.