期刊文献+
共找到204篇文章
< 1 2 11 >
每页显示 20 50 100
节点对等Web Spider设计与实现
1
作者 张林才 张燕 王红霞 《计算机技术与发展》 2010年第3期195-198,202,共5页
由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。受计算资源限制,单机多线程Web Spider的采集速率不高。带中心节点的分布式并行Web Spider又容易产生中心节点瓶颈问题。利用P... 由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。受计算资源限制,单机多线程Web Spider的采集速率不高。带中心节点的分布式并行Web Spider又容易产生中心节点瓶颈问题。利用ProActive网格网络并行分布计算中间件提供的主动对象技术、网络并行计算技术、自动部署机制等设计和实现了一个名为P-Spider2.0的节点对等的分布式并行Web Spider,并设计了一个基于Raibin算法的URL去重算法。实验表明该Web Spider方便管理和部署,并且比单机多线程Web Spider具有更高的采集速率。 展开更多
关键词 网络爬虫 PROACTIVE 并行 分布式 节点对等
下载PDF
Web Page Forensics:A Web Spider Based Approach
2
作者 Ya-Dong Li Dong-Hui Hu +1 位作者 Yu-Qi Fan Xin-Dong Wu 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2014年第6期46-50,共5页
Cyber-crimes are growing rapidly,so it is important to obtain the digital evidence on the web page.Usually,people can examine the browser history on the client side and data files on the server side,but both of them h... Cyber-crimes are growing rapidly,so it is important to obtain the digital evidence on the web page.Usually,people can examine the browser history on the client side and data files on the server side,but both of them have shortcomings in real criminal investigation.To overcome the weakness,this paper designs a web page forensic scheme to snapshot the pages from web servers with the help of web spider.Also,it designs several steps to improve the trustworthiness of these pages.All the pages will be dumped in local database which can be presented as reliable evidence on the court. 展开更多
关键词 web page digital forensics web spider
下载PDF
Predator perception of detritus and eggsac decorations spun by orb-web spiders Cyclosa octotuberculata:Do they function to camouflage the spiders? 被引量:2
3
作者 Wenjin GAN Fengxiang LIU +1 位作者 Zengtao ZHANG Daiqin LI 《Current Zoology》 SCIE CAS CSCD 北大核心 2010年第3期379-387,共9页
Camouflage is one of the most widespread and powerful strategies that animals use to make detection/recognitionmore difficult. Many orb-web spiders of the genus Cyclosa add prey remains, plant debris, moults, and/or e... Camouflage is one of the most widespread and powerful strategies that animals use to make detection/recognitionmore difficult. Many orb-web spiders of the genus Cyclosa add prey remains, plant debris, moults, and/or eggsacs to their webscalled web decorations. Web decorations resembling spider body colour pattern have been considered to camouflage the spiderfrom predators. While this camouflage is obvious from a human's perspective, it has rarely been investigated from a predator'sperspective. In this study, we tested the visibility of web decorations by calculating chromatic and achromatic contrasts of detritusand eggsac decorations built by Cyclosa octotuberculata, against four different backgrounds viewed by both bird (e.g., blue tits)and hymenopteran (e.g. wasps) predators. We showed that both juvenile and adult spiders on webs with detritus or egg-sac decorationswere undetectable by both hymenopteran and bird predators over short and long distances. Our results thus suggest thatdecorating webs with detritus or eggsacs by C. octotuberculata may camouflage the spiders from both hymenopteran and birdpredators in their common habitats [Current Zoology 56 (3): 379-387, 2010]. 展开更多
关键词 网络蜘蛛 装饰品 伪装网 捕食者 碎屑 球体 鸟类栖息地 函数
下载PDF
基于ProActive的分布式并行WebSpider设计
4
作者 张林才 梁正友 《计算机工程》 CAS CSCD 北大核心 2008年第19期47-48,52,共3页
单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-S... 单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-Spider采集速率是单机多线程Web Spider的2.2倍。 展开更多
关键词 web spider程序 ProActive中间件 并行 分布式
下载PDF
Exploration behaviour and behavioural flexibility in orb-web spiders: A review 被引量:1
5
作者 Thomas HESSELBERG 《Current Zoology》 SCIE CAS CSCD 2015年第2期313-327,共15页
关键词 网络蜘蛛 行为规则 活性 球型 无脊椎动物 空间认知 空间限制 网络建设
原文传递
Economic analysis of spider web airline networks
6
作者 Wen-dong Yang, Jin-fu Zhu, Qiang Gao,Wen-fang Wang College of Civil Aviation, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China. 《Journal of Pharmaceutical Analysis》 SCIE CAS 2009年第1期49-53,共5页
The distinct network organization, management, service and operating characteristics of US Southwest Airlines are key elements of its success compared with other airlines. As a network organization type, the spider we... The distinct network organization, management, service and operating characteristics of US Southwest Airlines are key elements of its success compared with other airlines. As a network organization type, the spider web airline network has received more attention. In this paper, we analyzed the relation between the spider web airline network and spider web, and the structure of spider web airline network, built the assignment model of the spider web airline network,and investigated the economics concerned. 展开更多
关键词 spider web spider web airline network economic analysis
下载PDF
Time till death affects spider mobility and web-building behavior during web construction in an orb-web spider
7
作者 Mylene ANOTAUX Camille TOSCANI +2 位作者 Raymond LEBORGNE Nicolas CHALINE Alain PASQUET 《Current Zoology》 SCIE CAS CSCD 2016年第2期123-130,共8页
关键词 持续时间 网络建设 蜘蛛网 死亡 建设行为 移动性 广义线性模型 流动参数
原文传递
蜘蛛网流道冷板冷却液对向流锂离子电池散热分析
8
作者 刘显茜 曹军磊 +1 位作者 李文辉 曾朴 《材料导报》 EI CAS CSCD 北大核心 2024年第4期10-15,共6页
锂离子电池工作温度过高或温差过大将导致其容量降低和寿命缩短。为了降低其工作温度及温差,设计了一款蜘蛛网流道冷板,采用数值方法对其冷却液对向流锂离子电池散热进行了计算。比较了蜘蛛网流道冷板冷却液对向流与同向流锂离子电池的... 锂离子电池工作温度过高或温差过大将导致其容量降低和寿命缩短。为了降低其工作温度及温差,设计了一款蜘蛛网流道冷板,采用数值方法对其冷却液对向流锂离子电池散热进行了计算。比较了蜘蛛网流道冷板冷却液对向流与同向流锂离子电池的散热情况,分析了冷却液流量以及冷板内流道夹角、槽深、壁厚对电池散热的影响。结果表明:与冷却液同向流电池相比,冷却液对向流电池最高温度、温差都降低,电池温度分布更加均匀。在0.02~0.06 kg/s区间,随着冷却液流量增大,电池最高温度和温差快速降低,而冷却液压降缓慢增大;当冷却液流量大于0.06 kg/s时,随着冷却液流量增大,电池最高温度和温差缓慢降低,而冷却液压降快速增大。增大流道夹角可使流道在冷板内分布更加均匀,提高冷板散热能力。当冷却液质量流量恒定时,增大流道槽深可使冷却液压降显著减小,但会引起电池最高温度和温差略微升高。随着流道壁厚增大,电池最高温度和温差均呈下降趋势。蜘蛛网流道冷板在流道夹角80°、槽深1 mm、壁厚2 mm、冷却液流量0.06 kg/s对向流冷却条件下,可使锂离子电池3C放电最高温度和温差降至31.02℃和4.54℃。 展开更多
关键词 蜘蛛网流道 对向流 散热 锂离子电池
下载PDF
面向Web论坛的网络信息获取技术及系统实现 被引量:7
9
作者 彭冬 蔡皖东 《计算机工程与科学》 CSCD 北大核心 2011年第1期157-160,共4页
网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,... 网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,提出了基于遍历策略的信息搜索技术;根据正文信息分布及论坛自身特点,提出了基于DOM与分块算法相结合的正文提取技术。实验结果表明,遍历策略比传统的网络爬虫遍历策略具有更高的效率,能够采集到更多主题相关度高的网页;经过噪声清洗处理后,有效提取网页正文,提高了信息采集精度。 展开更多
关键词 网络爬虫 web论坛 正文提取 主题相关度
下载PDF
基于Lucene的Web搜索引擎的研究和实现 被引量:7
10
作者 周凤丽 林晓丽 《计算机技术与发展》 2012年第1期140-142,160,共4页
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站... 互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。 展开更多
关键词 网络爬虫 应用系统 搜索引擎 多线程
下载PDF
RL_Spider:一种自主垂直搜索引擎网络爬虫 被引量:2
11
作者 黄蔚 刘忠 刘全 《计算机应用与软件》 CSCD 2011年第12期183-187,共5页
在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大... 在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大。将得到的网页存储、索引,用户通过搜索引擎的搜索接口,就可以得到最佳的搜索结果。对多个网站进行主题爬虫搜索,实验结果表明,该方法对于网络的查全率和查准率都具有较大的提高。 展开更多
关键词 可控强化学习 垂直搜索引擎 网络爬虫
下载PDF
基于Spark技术的气象数据分析
12
作者 刘丽景 刘力维 +1 位作者 王林 郝婉婷 《黑龙江科学》 2024年第2期56-59,共4页
近些年来,气象数据规模及复杂性大大增加,这对气象数据的存储、利用及加工分析提出了更高的要求。需采用适当的技术及策略,更好地利用分析气象数据,为天气预报、气候研究及社会公共服务提供更大的价值。通过网络爬虫爬取实时天气数据,... 近些年来,气象数据规模及复杂性大大增加,这对气象数据的存储、利用及加工分析提出了更高的要求。需采用适当的技术及策略,更好地利用分析气象数据,为天气预报、气候研究及社会公共服务提供更大的价值。通过网络爬虫爬取实时天气数据,发送实时数据到Kafka消息系统中,利用Spark技术从消息队列中获取实时数据并进行数据清洗、转换、归一化、聚合、汇总、分组等操作,实现气象数据的多维度分析,利用Spark计算结果将处理后的数据进行可视化,以图表、图形等形式进行展示。 展开更多
关键词 气象数据分析 网络爬虫 消息队列 Spark数据分析
下载PDF
基于ProActive的P-Spider1.0改进
13
作者 张林才 梁正友 王红霞 《计算机工程》 CAS CSCD 北大核心 2010年第17期288-290,共3页
针对带中心节点结构的分布式并行Web Spider的中心节点负担过重、通信负载不均衡、可扩展性差的问题,提出基于Rabin指纹算法的URL去重改进算法和节点对等结构的改进方案,利用ProActive中间件设计开发改进的分布式并行Web Spider。对比... 针对带中心节点结构的分布式并行Web Spider的中心节点负担过重、通信负载不均衡、可扩展性差的问题,提出基于Rabin指纹算法的URL去重改进算法和节点对等结构的改进方案,利用ProActive中间件设计开发改进的分布式并行Web Spider。对比实验表明,改进后的Web Spider采集效率更高,通信负载均衡,无节点瓶颈问题,具有良好的可扩展性。 展开更多
关键词 网络蜘蛛 ProActive中间件 节点对等 分布式 中心节点
下载PDF
Web搜索引擎技术综述 被引量:5
14
作者 宋春阳 金可音 《现代计算机》 2008年第5期82-85,共4页
在现代网络飞速发展的带动下,搜索引擎技术引起了广泛的研究。从Web搜索引擎的背景、定义、分类、工作原理、网页信息采集技术,以及发展趋势方面来做一个简要的综述,来介绍国内外主要的搜索引擎。
关键词 web 搜索引擎 网络蜘蛛
下载PDF
基于WebLech的内容搜索引擎设计
15
作者 戴明星 杜彦辉 《计算机工程》 CAS CSCD 北大核心 2008年第9期278-280,共3页
网络蜘蛛WebLech是一种优秀的Web站点下载开源工具。该文分析WebLech的特点和工作流程,完善WebLech的起始地址设置,并丰富其链接和所获取的网页类型。使用改进后的WebLech设计了一款能在用户设置的IP范围内进行搜索的基于内容的搜索引擎。
关键词 webLech开源软件 网络蜘蛛 搜索引擎
下载PDF
中文WEB文档自动分类系统的设计与实现
16
作者 张小刚 杨凯 冉天保 《微计算机信息》 北大核心 2008年第30期244-246,共3页
中文WEB文档自动分类是中文自动信息检索的核心技术之一。中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索... 中文WEB文档自动分类是中文自动信息检索的核心技术之一。中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题。 展开更多
关键词 网络蜘蛛 中文分词 文档频度 NAIVE 贝叶斯分类器
下载PDF
护士工作评价管理系统的设计与实践
17
作者 高梓毓 霍春颖 曹也丁 《中国卫生信息管理杂志》 2024年第2期257-263,共7页
目的构建护士工作评价管理系统,实现护士长对本病房护士全年工作轨迹和工作状态的动态管理。方法收集病房护士每月工作量和工作能力的数据,赋予权重系数,分别计算总分值、排列秩次,运用“阜外蛛网图”进行两个维度指标的整合;通过“阜... 目的构建护士工作评价管理系统,实现护士长对本病房护士全年工作轨迹和工作状态的动态管理。方法收集病房护士每月工作量和工作能力的数据,赋予权重系数,分别计算总分值、排列秩次,运用“阜外蛛网图”进行两个维度指标的整合;通过“阜外蛛轨图”的连续结果观察,实现对病房护士全年工作状态的动态评价。结果利用“阜外蛛网图”可以完成每个月对病房护士工作状态的综合评价,通过“阜外蛛轨图”的连续动态评价,可展现病房护士在评价期内的持续工作状态和水平,为年终的评优评先、人才培养、末位淘汰以及每月的奖金分配等提供可靠依据。结论“阜外蛛网图与蛛轨图”评价系统可通过多维度指标的合理整合与智能评价,帮助护士长对病房护士进行工作状态的动态管理,也可为决策者实现病房人力资源的合理配置提供多元参考依据。 展开更多
关键词 护士工作评价 管理系统 动态评价 蛛网图 蛛轨图
下载PDF
互联网热点新闻对中国股价的影响研究
18
作者 孙佳音 《南阳理工学院学报》 2024年第1期36-44,共9页
互联网新闻对股价的波动有一定相关性。本文在随机漫步理论的指导下,利用网络爬虫技术采集新闻样本数据,用文本挖掘和文本分类技术将政策类新闻分为支持性新闻和抑制性新闻两类,并用事件研究法实证分析得出不同类型的政策性新闻对股价... 互联网新闻对股价的波动有一定相关性。本文在随机漫步理论的指导下,利用网络爬虫技术采集新闻样本数据,用文本挖掘和文本分类技术将政策类新闻分为支持性新闻和抑制性新闻两类,并用事件研究法实证分析得出不同类型的政策性新闻对股价的影响。结论如下:(1)政策类新闻会对公司个股产生显著影响;支持性政策新闻会对股市产生正向影响,抑制性政策新闻会对股市产生负向影响;(2)支持性政策新闻对股价平均异常收益率的显著性高于抑制性政策新闻对股价的平均异常收益率,但是抑制性政策新闻产生的影响在报道发生后长期存在。 展开更多
关键词 政策类新闻 网络爬虫 文本挖掘 事件研究法 异常收益率
下载PDF
基于Web的专用爬虫的研究
19
作者 夏道勋 谢晓尧 《贵州师范大学学报(自然科学版)》 CAS 2009年第3期92-95,共4页
网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分... 网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分类器、提取器、爬虫的基本功能、数据存储及核心算法。 展开更多
关键词 专用爬虫 web内容挖掘 超文本分类器 提取器
下载PDF
遗传算法在主题Web信息采集中的应用研究 被引量:5
20
作者 唐志 王成良 《计算机科学》 CSCD 北大核心 2006年第7期71-74,共4页
传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,... 传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,利用元搜索技术可进一步提高网络蜘蛛的性能,具有更高的查全率和查准率,能够较好地解决现存问题。 展开更多
关键词 网络蜘蛛 遗传算法 web社区 信息采集
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部