期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
一种主题知识自增长的聚焦网络爬虫 被引量:9
1
作者 李东晖 廖晓兰 +2 位作者 范辅桥 黄九鸣 陈雪刚 《计算机应用与软件》 CSCD 北大核心 2014年第5期29-33,88,共6页
聚焦网络爬虫是各类因特网文本挖掘和信息检索应用必需的处理步骤。现有聚焦网络爬虫面临着知识描述困难、误差易被放大等挑战。发现网页中主题知识存在的若干性质,提出一种主题知识自增长的聚焦网络爬虫KAG-Crawler,在网页爬取过程中... 聚焦网络爬虫是各类因特网文本挖掘和信息检索应用必需的处理步骤。现有聚焦网络爬虫面临着知识描述困难、误差易被放大等挑战。发现网页中主题知识存在的若干性质,提出一种主题知识自增长的聚焦网络爬虫KAG-Crawler,在网页爬取过程中采用一种无监督的学习技术不断扩展主题知识,从而使爬虫在一个简单的初始主题描述条件下,能够以较高正确率爬取大量网页。同时为便于主题知识的扩展,还提出一种新的主题表示模型,并基于该模型构建了新的网页主题和URL主题相关度方法。最后在真实环境下的实验表明,KAG-Crawler的性能显著高于传统基于文本相似度的聚焦网络爬虫。 展开更多
关键词 聚焦网络爬虫 无监督学习 知识扩展 主题相关度
下载PDF
面向P2P搜索的可定制聚焦网络爬虫 被引量:5
2
作者 方启明 杨广文 +2 位作者 武永卫 朱安平 郑纬民 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第S2期148-152,共5页
提出了一种可定制聚焦网络爬虫技术.该技术采用简单的主题描述方法提高网络爬虫的可定制性,利用基于站点页面链接结构的链接导航技术实现对主题信息的高效抓取,通过配置文件实施定制,从而构建一个资源消耗小、数据采集准确性高、可控性... 提出了一种可定制聚焦网络爬虫技术.该技术采用简单的主题描述方法提高网络爬虫的可定制性,利用基于站点页面链接结构的链接导航技术实现对主题信息的高效抓取,通过配置文件实施定制,从而构建一个资源消耗小、数据采集准确性高、可控性强的轻量级聚焦网络爬虫,以满足P2P搜索的需求.文中进一步提出一种增量更新和批量更新相结合的网络爬虫数据更新机制,这种混合更新机制降低了增量更新的实现复杂性,相比批量更新具有更小的资源消耗,实验表明采用这种机制能达到较高的数据新鲜度和召回率. 展开更多
关键词 P2P搜索 聚焦网络爬虫 链接导航 增量更新 批量更新
下载PDF
基于Python的聚焦网络爬虫的设计与实现 被引量:4
3
作者 唐文军 隆承志 《计算机与数字工程》 2023年第4期845-849,共5页
针对如何快速、精准地检索门户网站信息的问题,设计和实现基于Python语言的聚焦网络爬虫。首先分析聚焦网络爬虫的爬取数据流程,明确爬虫的基本原理;在爬取数据流程的基础上,设计聚焦网络爬虫的通用结构模型;最后,利用Python语言库实现... 针对如何快速、精准地检索门户网站信息的问题,设计和实现基于Python语言的聚焦网络爬虫。首先分析聚焦网络爬虫的爬取数据流程,明确爬虫的基本原理;在爬取数据流程的基础上,设计聚焦网络爬虫的通用结构模型;最后,利用Python语言库实现聚焦网络爬虫,并以广东省政府采购网的招标信息的爬取为实例验证该聚焦网络爬虫的可用性。 展开更多
关键词 聚焦网络爬虫 PYTHON语言 门户 广度爬行策略
下载PDF
基于多层聚焦Inception-V3卷积网络的细粒度图像分类 被引量:9
4
作者 王波 黄冕 +2 位作者 刘利军 黄青松 单文琦 《电子学报》 EI CAS CSCD 北大核心 2022年第1期72-78,共7页
细粒度图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,准确地定位与提取判别性局部特征至关重要.本文提出一种多层聚焦卷积网络,通过首层聚焦网络能够准确、有效地聚焦于识别局域并生成定位区域,根据定位区域对原图像分... 细粒度图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,准确地定位与提取判别性局部特征至关重要.本文提出一种多层聚焦卷积网络,通过首层聚焦网络能够准确、有效地聚焦于识别局域并生成定位区域,根据定位区域对原图像分别进行裁剪和遮挡后输入下一层的聚焦网络进行训练分类.其中单层聚焦网络以In⁃ception-V3网络为基础,通过卷积块特征注意力模块和定位区域选择机制来聚焦有效的定位区域;使用双线性注意力最大池化提取各个局部的特征;最后进行分类预测.本文在3个常用的细粒度数据集CUB-2011、FGVC-Aircraft以及Stanford Cars上进行了实验验证,分别获得了89.7%、93.6%和95.1%的Top-1准确率.实验结果表明,本模型的分类准确率高于目前主流方法. 展开更多
关键词 多层聚焦卷积网络 Inception-V3网络 注意力机制 双线性注意力最大池化
下载PDF
从意义建构到共识达成——关于网络集体行动的一个解释模型 被引量:10
5
作者 白淑英 崔静 《兰州大学学报(社会科学版)》 CSSCI 北大核心 2014年第2期10-16,共7页
网络事件的发生与"事件"本身的特征有关,更与行动者对"事件"的选择性建构有关。因此,社会焦点问题并不必然引起网络集体行动,只有当某个"事件"被人们感知并赋予其特定意义时才会引发网络集聚,这需要通过... 网络事件的发生与"事件"本身的特征有关,更与行动者对"事件"的选择性建构有关。因此,社会焦点问题并不必然引起网络集体行动,只有当某个"事件"被人们感知并赋予其特定意义时才会引发网络集聚,这需要通过意义建构将个体性矛盾转化为社会结构紧张。以此为基础,网民还要对"事件"被赋予的多重意义建构进行理性取舍和融通整合,这需要通过"我们化"来达成网络共识。一旦上述过程得以实现,网络集体行动就开始了。 展开更多
关键词 网络集体行动 意义建构 发生机制 网络聚焦 解释模型
下载PDF
基于文本相关性的高校网络舆情监控系统的设计与实现 被引量:5
6
作者 刘丽员 杨昔阳 《泉州师范学院学报》 2016年第2期50-54,共5页
随着互联网的发展,高校大学生通过网络对各个热点问题发表意见和评论,一些负面的舆情信息会对高校造成巨大危害.为了实现校园网的公共安全,利用聚焦网络爬虫技术和聚类技术设计实现了一个基于文本相关性的高校网络舆情监控系统.根据高... 随着互联网的发展,高校大学生通过网络对各个热点问题发表意见和评论,一些负面的舆情信息会对高校造成巨大危害.为了实现校园网的公共安全,利用聚焦网络爬虫技术和聚类技术设计实现了一个基于文本相关性的高校网络舆情监控系统.根据高校网络舆情的特点,对聚焦爬虫和聚类算法进行一些改进,以提高热点话题发现的效率和精确度,从而有效增强对大学生网络舆情的监控. 展开更多
关键词 聚焦网络爬虫 聚类 文本相关性 舆情信息 话题发现
下载PDF
基于T-Graph算法的链接和内容相结合的聚焦爬虫模型
7
作者 周萍 《电子世界》 2016年第6期190-191,共2页
聚焦网络爬虫的两大重要目标就是寻找主题相关的网页,并优先下载主题相关度高的网页。首先,读取并分析网页的有效HTML元素,并根据高准确率来预测和抽取每个未被访问的网页的主题内容。然后,根据T-Graph来计算URLs的主题相关度,并按照相... 聚焦网络爬虫的两大重要目标就是寻找主题相关的网页,并优先下载主题相关度高的网页。首先,读取并分析网页的有效HTML元素,并根据高准确率来预测和抽取每个未被访问的网页的主题内容。然后,根据T-Graph来计算URLs的主题相关度,并按照相关度大小进行排序。本文提出的基于T-Graph的算法综合了多方面的元素,通过实验得到了较高的查准率和查全率,因此,该算法具有重要的意义。 展开更多
关键词 聚焦网络爬虫 T-Graph HTML元素 信息检索 搜索引擎
下载PDF
对网络爬虫技术的研究 被引量:5
8
作者 杨靖韬 陈会果 《科技创业月刊》 2010年第10期170-171,共2页
网络爬虫是一种自动下载网络资源的程序,是搜索引擎的基础构件之一,它的性能直接决定了在庞大的互联网上进行网页信息采集的质量。文章对网络爬虫相关技术以及聚焦网络爬虫的特点进行了分析和探讨。
关键词 网络爬虫 搜索策略 聚焦网络爬虫
下载PDF
基于LIR和GFNet的带钢表面缺陷识别
9
作者 刘双辉 易灿灿 +1 位作者 肖涵 黄涛 《组合机床与自动化加工技术》 北大核心 2024年第1期150-155,共6页
针对深度学习(deep learning,DL)模型处理带钢表面缺陷图像存在计算成本大、实时性差的问题,提出了一种基于可学习的图像调整器(learnable image resizer,LIR)和扫视-聚焦网络(glance and focus network,GFNet)的带钢表面缺陷分类方法... 针对深度学习(deep learning,DL)模型处理带钢表面缺陷图像存在计算成本大、实时性差的问题,提出了一种基于可学习的图像调整器(learnable image resizer,LIR)和扫视-聚焦网络(glance and focus network,GFNet)的带钢表面缺陷分类方法。首先,针对DL模型在处理带钢表面缺陷图像时存在空间冗余的问题,提出GFNet驱动的带钢表面缺陷识别模型,其可以根据不同样本自适应分配计算资源,在模型推理阶段显著减少计算量;其次,提出LIR和GFNet联合训练的方法,调整图像大小的同时实现针对识别模型的特征增强;最后,收集整理了某钢铁企业冷轧薄板厂带钢表面缺陷数据集,利用所提方法进行分析。将残差网络(residual networks,ResNet)的ResNet-50模型作为主干网络,与原始ResNet-50比较,所提方法在不牺牲准确率的情况下,将单张图像的推断时间减少约3.58倍,计算量降低约6.11倍,从而验证了提出方法的有效性。 展开更多
关键词 带钢表面缺陷 图像分类 可学习的图像调整器 动态神经网络 扫视-聚焦网络
下载PDF
基于大数据的小微企业统计信息采集策略 被引量:4
10
作者 张玉明 张远远 《统计与决策》 CSSCI 北大核心 2017年第14期178-181,共4页
小微企业由于信息严重不对称导致融资难、融资贵、贷款难等问题,基于大数据来源之一的互联网社交媒体的小微企业信息采集是获取小微企业信息数据的重要途径。文章面对爆发式增长的互联网信息资源,利用主题聚焦网络爬虫技术、数据库技术... 小微企业由于信息严重不对称导致融资难、融资贵、贷款难等问题,基于大数据来源之一的互联网社交媒体的小微企业信息采集是获取小微企业信息数据的重要途径。文章面对爆发式增长的互联网信息资源,利用主题聚焦网络爬虫技术、数据库技术、Java技术等设计并实现由基于链接结构分析的链接地址URL筛选及采集、基于模板节点匹配的网页正文信息抽取、数据入库三个功能模块组成的小微企业统计信息自动采集系统,采集到的数据以结构化数据的形式存储到My SQL数据库中,为后续数据挖掘与分析提供良好的数据支持。结果表明,文章所提出的信息自动采集系统采集效率较高,能够适应小微企业统计信息采集的需求。 展开更多
关键词 大数据 小微企业信息 信息不对称 WEB信息采集 主题聚焦网络爬虫
下载PDF
基于特征重聚焦网络的多尺度近岸舰船检测 被引量:8
11
作者 刘荻 张焱 +3 位作者 赵琰 石志广 张景华 张宇 《光学学报》 EI CAS CSCD 北大核心 2021年第22期129-141,共13页
针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略。其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融... 针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略。其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息。AFRM基于多分支空洞卷积以及通道与空间注意力机制提升网络对目标非局部信息的表征和对背景干扰的抑制,并构建了用于目标检测的特征重聚焦金字塔。在Seaships7000舰船公开数据集上的实验结果表明,相比其他算法,本算法对监控视频中多尺度近岸舰船的检测效果更好。 展开更多
关键词 机器视觉 卷积神经网络 舰船目标检测 特征重聚焦网络 注意力机制
原文传递
Control of Halo-Chaos in Beam Transport Network via Neural Network Adaptation with Time-Delayed Feedback 被引量:4
12
作者 FANG Jin-Qing LUO Xiao-Shu Guo-Xian 《Communications in Theoretical Physics》 SCIE CAS CSCD 2006年第1期117-120,共4页
Subject of the halo-chaos control in beam transport networks (channels) has become a key concerned issue for many important applications of high-current proton beam since 1990'. In this paper, the magnetic field ad... Subject of the halo-chaos control in beam transport networks (channels) has become a key concerned issue for many important applications of high-current proton beam since 1990'. In this paper, the magnetic field adaptive control based on the neural network with time-delayed feedback is proposed for suppressing beam halo-chaos in the beam transport network with periodic focusing channels. The envelope radius of high-current proton beam is controlled to reach the matched beam radius by suitably selecting the control structure and parameter of the neural network, adjusting the delayed-time and control coefficient of the neural network. 展开更多
关键词 beam transport network periodic focusing channels high-current proton beam HALO-CHAOS neural network adaptation control time-delayed feedback
下载PDF
基于机器学习的海表温度对中国降水的预测研究 被引量:1
13
作者 李良伟 邹斌 +1 位作者 石立坚 刘鹏 《海洋预报》 CSCD 北大核心 2021年第3期29-37,共9页
利用K-means聚类算法将36 a的中国周降水数据聚类为7个区域,其中非季风区的中国西北和青藏高原的大部分地区聚类为两个区域,其余区域聚类为5个区域。将各区域的降水量数据经过指数平滑之后,输入聚焦时延神经网络(FTDNN),求解其与经过主... 利用K-means聚类算法将36 a的中国周降水数据聚类为7个区域,其中非季风区的中国西北和青藏高原的大部分地区聚类为两个区域,其余区域聚类为5个区域。将各区域的降水量数据经过指数平滑之后,输入聚焦时延神经网络(FTDNN),求解其与经过主成分分析降维处理的SST之间的关系。结果表明:季风区的降水量最佳延迟时间比远离海洋的非季风区域的最佳延迟时间大,同时也得到了预测各区域降水的最佳延迟时间。在对各区域的降水量进行短期和中长期的预测中得出,FTDNN神经网络在利用降维后的SST预测降水量上显示出很好的预测效果,尤其是中长期趋势的预测,与传统的小波变换重建原序列以及均生函数方法的预测结果相比,相关系数和均方根误差都有了很大的提高,新疆地区测试结果的相关系数比小波变换结果提高了0.05。 展开更多
关键词 K-MEANS 聚焦时延神经网络 主成分分析 降水 海表温度
下载PDF
基于测绘地理信息技术的山洪质灾害信息动态提取方法研究
14
作者 陈济才 李国明 《西部资源》 2020年第6期118-119,127,共3页
随着网络技术迅速发展,海量数据分布在万维网内,如何从数据中挖掘到特定的需要的数据成为时下研究的热点。网络爬虫是一种按照一定的规则,自动抓取万维网信息的程序或者脚本。本文探讨使用网络爬虫的概念和方法,开发基于互联网的聚焦网... 随着网络技术迅速发展,海量数据分布在万维网内,如何从数据中挖掘到特定的需要的数据成为时下研究的热点。网络爬虫是一种按照一定的规则,自动抓取万维网信息的程序或者脚本。本文探讨使用网络爬虫的概念和方法,开发基于互联网的聚焦网络爬虫软件,迅速通过互联网搜索山洪灾害点相关及时的第一手资料,形成对灾害的第一认识。再经过人工判读,精确动态提取、更新山洪灾害信息专题成果。 展开更多
关键词 万维网 聚焦网络爬虫 山洪灾害 动态提取
下载PDF
Neural circuit and its functional roles in cerebellar cortex 被引量:1
15
作者 汪雷 刘深泉 《Neuroscience Bulletin》 SCIE CAS CSCD 2011年第3期173-184,共12页
Objective To investigate the spike activities of cerebellar cortical cells in a computational network model con- structed based on the anatomical structure of cerebellar cortex. Methods and Results The multicompartmen... Objective To investigate the spike activities of cerebellar cortical cells in a computational network model con- structed based on the anatomical structure of cerebellar cortex. Methods and Results The multicompartment model of neuron and NEURON software were used to study the external influences on cerebellar cortical cells. Various potential spike patterns in these cells were obtained. By analyzing the impacts of different incoming stimuli on the potential spike of Purkinje cell, temporal focusing caused by the granule cell-golgi cell feedback inhibitory loop to Purkinje cell and spa- tial focusing caused by the parallel fiber-basket/stellate cell local inhibitory loop to Purkinje cell were discussed. Finally, the motor learning process of rabbit eye blink conditioned reflex was demonstrated in this model. The simulation results showed that when the afferent from climbing fiber existed, rabbit adaptation to eye blinking gradually became stable under the Spike Timing-Dependent Plasticity (STDP) learning rule. Conclusion The constructed cerebellar cortex network is a reliable and feasible model. The model simulation results confirmed the output signal stability of cerebellar cortex after STDP learning and the network can execute the function of spatial and temporal focusing. 展开更多
关键词 computational network model cerebellar cortex temporal focusing spatial focusing Spike Timing-DependentPlasticity eye blink conditioned reflex
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部