期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于智能化技术的智慧景区应用系统设计与实现
1
作者 宁毅 陈金龙 +1 位作者 金富强 黎炳材 《无线互联科技》 2024年第11期58-62,共5页
针对提升景区的管理效率和游客的体验,文章设计开发了一款智慧景区应用系统平台,为景区管理方提供获取舆情数据功能、景点的管理、智慧景区小程序用户管理、景区订单的管理以及景区门票的管理等功能。智慧景区应用系统在Windows10操作... 针对提升景区的管理效率和游客的体验,文章设计开发了一款智慧景区应用系统平台,为景区管理方提供获取舆情数据功能、景点的管理、智慧景区小程序用户管理、景区订单的管理以及景区门票的管理等功能。智慧景区应用系统在Windows10操作系统下开发完成,以Java1.8.0-281、Python3.7.1和nmp6.14.12为系统开发环境,以Flask用于Web开发框架,使用Ajax作为用于与服务器进行异步数据交互,使用MySQL数据库实现数据持久化,使用Vue+Layui+Uniapp+ElementUI作为软件的前端页面编写,使用网络爬虫来获取数据,能方便地为大数据分析做支撑。系统平台的主要模块包括:爬虫管理模块、智慧景区管理模块、智慧景区小程序模块。经该实践表明,基于智能化技术的智慧景区应用系统能够为景区管理方提供便捷。 展开更多
关键词 爬虫管理 智慧景区管理 智慧景区小程序
下载PDF
电网主备调备份装置的研制
2
作者 程站立 廖兵 代飞 《农村电气化》 2023年第11期65-67,共3页
电网调度是地区电网的指挥中枢,保证电网调度业务的持续性、可靠性是保障电网安全稳定运行的基础。通过研制一种电网主备调备份装置,利用爬虫程序定时对主备调调度业务数据进行备份。在OMS系统出现故障影响调度业务开展时,及时启用主备... 电网调度是地区电网的指挥中枢,保证电网调度业务的持续性、可靠性是保障电网安全稳定运行的基础。通过研制一种电网主备调备份装置,利用爬虫程序定时对主备调调度业务数据进行备份。在OMS系统出现故障影响调度业务开展时,及时启用主备调备份装置,利用故障前的OMS数据保证调度业务的正常有序开展。 展开更多
关键词 电网调度 爬虫程序 OMS系统 备份装置
下载PDF
爬行虫算法设计与程序实现 被引量:14
3
作者 杜亚军 严兵 宋亮 《计算机应用》 CSCD 北大核心 2004年第1期33-35,共3页
爬行虫算法是搜索引擎探讨的热点。通过分析现有爬行虫算法设计和程序实现的主要方式 ,权衡其利弊 ,总结出一个适合于中小型网站网页下载的爬行虫算法。并使用jBuider8.0工具实现了该算法。通过实验分析 ,该程序下载的网页数的速度为 18... 爬行虫算法是搜索引擎探讨的热点。通过分析现有爬行虫算法设计和程序实现的主要方式 ,权衡其利弊 ,总结出一个适合于中小型网站网页下载的爬行虫算法。并使用jBuider8.0工具实现了该算法。通过实验分析 ,该程序下载的网页数的速度为 1882 4 2个网页 /分和 4 1.92 74 .5 9KB/秒。 展开更多
关键词 爬行虫算法 爬行虫程序 搜索引擎
下载PDF
基于文本语义和表情倾向的微博情感分析方法 被引量:23
4
作者 王文 王树锋 李洪华 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第6期733-738,749,共7页
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微... 针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。 展开更多
关键词 文本语义 表情倾向 微博 情感分析 机器学习 微博爬虫 应用程序编程接口 情感词典 语义相似度
下载PDF
基于爬虫技术的网络口碑对汉服女绣花鞋线上销量影响研究 被引量:2
5
作者 石文奇 程凡 +2 位作者 刘静 陈志军 周云鹏 《皮革与化工》 CAS 2020年第4期36-41,共6页
为天猫商家提出提升月销量建议措施,用爬虫程序和软件,针对网络口碑人气量、累积评价、价格、库存量、送积分值、描述分值、服务分值、物流分值8个维度变量的在线采集数据对汉服女绣花鞋月成交量进行一元和多元回归分析。结果表明,人气... 为天猫商家提出提升月销量建议措施,用爬虫程序和软件,针对网络口碑人气量、累积评价、价格、库存量、送积分值、描述分值、服务分值、物流分值8个维度变量的在线采集数据对汉服女绣花鞋月成交量进行一元和多元回归分析。结果表明,人气量、累计评价、价格对其月销量影响显著,且价格、累计评价对月销量呈现负向作用,而其他变量影响不显著。 展开更多
关键词 爬虫技术 网络口碑 汉服女绣花鞋 多元回归
下载PDF
商品评论聚焦爬虫算法设计与实现 被引量:10
6
作者 方美玉 郑小林 +2 位作者 陈德人 华艺 施艳 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第S1期377-381,共5页
从商品评论抽取算法出发,使用开放应用编程接口调用和链接跟踪的方法,分别设计了基于通用爬虫原理和开放应用编程接口(OpenAPI)的商品评论聚焦爬虫算法。在此基础上实现了淘宝网和京东网商品评论收集程序。最后将两者与通用爬虫算法进... 从商品评论抽取算法出发,使用开放应用编程接口调用和链接跟踪的方法,分别设计了基于通用爬虫原理和开放应用编程接口(OpenAPI)的商品评论聚焦爬虫算法。在此基础上实现了淘宝网和京东网商品评论收集程序。最后将两者与通用爬虫算法进行比较,证实了二者的程序设计具有针对性强、数据采集实时性好、易嵌入开发等优点,为实时评论数据采集技术的研究提供了新思路。 展开更多
关键词 计算机软件 商品评论 开放应用编程接口 聚焦爬虫 爬虫算法
下载PDF
基于物理规划的履带起重机变幅系统多目标优化 被引量:3
7
作者 高顺德 陆霞 +1 位作者 周杨 徐金帅 《大连理工大学学报》 EI CAS CSCD 北大核心 2013年第2期207-213,共7页
履带起重机变幅系统具备足够的承载能力实现臂架俯仰,是整机的重要组成部分.通过分析变幅系统构件受力特点,建立了变幅系统力学和多目标优化模型.采用物理规划方法,基于构件极限荷载定义偏好函数,建立了综合优化评价函数.设计多目标混... 履带起重机变幅系统具备足够的承载能力实现臂架俯仰,是整机的重要组成部分.通过分析变幅系统构件受力特点,建立了变幅系统力学和多目标优化模型.采用物理规划方法,基于构件极限荷载定义偏好函数,建立了综合优化评价函数.设计多目标混沌遗传算法求解问题,根据Pareto支配概念和精英策略保留较优解,并采用混沌局部搜索避免了过早收敛.算例分析表明,提出的方法可以优化构件间的几何关系且减小构件受力,对履带起重机总体参数设计具有指导意义. 展开更多
关键词 履带起重机 变幅系统 物理规划 多目标混沌遗传算法
下载PDF
项目驱动的程序设计课程改革与实践 被引量:5
8
作者 曹晓叶 《软件导刊》 2020年第2期180-183,共4页
程序设计类课程是计算机专业基础课程,也是非计算机本科的基础选修课程。通过分析语言教学现状,针对传统程序设计课程中学生参与度不高的问题,提出基于项目驱动的团队协作教学模式。课堂教学以网络爬虫系统设计为模拟项目,通过改变语言... 程序设计类课程是计算机专业基础课程,也是非计算机本科的基础选修课程。通过分析语言教学现状,针对传统程序设计课程中学生参与度不高的问题,提出基于项目驱动的团队协作教学模式。课堂教学以网络爬虫系统设计为模拟项目,通过改变语言教学体系,不仅激发了学生学习兴趣,而且提高了学习效果,有效培养了学生的计算思维与综合协作能力,使学生课堂参与度接近90%。 展开更多
关键词 项目驱动 团队协作 程序设计课程 爬虫系统
下载PDF
基于在线社会网络采集数据的研究 被引量:1
9
作者 黄蓝会 《宝鸡文理学院学报(自然科学版)》 CAS 2014年第3期57-59,共3页
目的研究新浪微博数据采集问题。方法利用新浪微博API接口和本文设计的网络爬虫模型进行数据采集。结果与结论实验证明两种方法都可以在较短时间内收集到较多用户资料,但在过滤去重方面,本文设计的算法在时间上更为高效。
关键词 在线社会网络 新浪微博 应用程序编辑接口 网络爬虫
下载PDF
一种多源统一爬虫框架的设计与实现 被引量:2
10
作者 潘洪涛 《软件工程》 2021年第4期30-33,共4页
面向深层网数据的爬虫技术与反爬虫技术之间的对抗随着网站技术、大数据、异步传输等技术的发展而呈现此消彼长的趋势。综合对比当前主流的爬虫和反爬虫技术,针对高效开发、快速爬取的需求,MUCrawler(多源统一爬虫框架)被设计成一种可... 面向深层网数据的爬虫技术与反爬虫技术之间的对抗随着网站技术、大数据、异步传输等技术的发展而呈现此消彼长的趋势。综合对比当前主流的爬虫和反爬虫技术,针对高效开发、快速爬取的需求,MUCrawler(多源统一爬虫框架)被设计成一种可以面向多个网站数据源,以统一的接口形式提供爬虫开发的Python框架。测试结果显示,该框架不但能够突破不同的反爬虫技术获取网站数据,在开发效率、鲁棒性和爬取效率等方面也体现出较好的运行效果。 展开更多
关键词 Python开发 网络爬虫 浏览器行为 HTTP请求
下载PDF
基于微信小程序的图书荐选程序设计及实现 被引量:9
11
作者 刘禹 《长春工程学院学报(自然科学版)》 2019年第2期59-62,共4页
读者决策采购(PDA)是高校图书馆提高采访速率、增加图书借阅率、优化图书馆服务效益的重要途径。着重分析如何以依托微信庞大用户群体的小程序建立读者决策荐选图书小程序,准确地荐选数据可以调动读者参与采访,对高校图书馆馆藏建设起... 读者决策采购(PDA)是高校图书馆提高采访速率、增加图书借阅率、优化图书馆服务效益的重要途径。着重分析如何以依托微信庞大用户群体的小程序建立读者决策荐选图书小程序,准确地荐选数据可以调动读者参与采访,对高校图书馆馆藏建设起到了积极作用。 展开更多
关键词 高等院校 微信小程序 大数据 网络爬虫 图书荐选
下载PDF
基于Python的新浪微博爬虫分析 被引量:14
12
作者 杜晓旭 贾小云 《软件》 2019年第4期182-185,共4页
在大数据时代下,新浪微博的出现为人们获取和参与信息数据及其传播提供了全新的途径。而面对新浪微博不断增加的信息数据,人们对于提高微博获取的精确性和时效性也提出了更高的要求。在这一背景下,本文将重点围绕基于Python的新浪微博... 在大数据时代下,新浪微博的出现为人们获取和参与信息数据及其传播提供了全新的途径。而面对新浪微博不断增加的信息数据,人们对于提高微博获取的精确性和时效性也提出了更高的要求。在这一背景下,本文将重点围绕基于Python的新浪微博爬虫进行简要分析研究,在对Python与网络爬虫的基本概念进行明确的基础上,尝试设计一种Python的新浪微博爬虫程序,为相关研究人员提供相应理论参考。 展开更多
关键词 PYTHON 新浪微博 网络爬虫 程序设计
下载PDF
一种智能自动获取信息的方法——以获取养老机构信息为例 被引量:2
13
作者 朱梓熙 吴文庆 《科技创新发展战略研究》 2020年第1期47-51,共5页
目前,互联网已成为了人们获取养老机构信息的一个重要来源,但海量的信息让用户需要花费大量的精力对其进行筛选,难以从众多的养老机构信息中获取所需要的内容。通过对网页工作原理的研究,基于Python语言的数据分析包,使用Requests库和r... 目前,互联网已成为了人们获取养老机构信息的一个重要来源,但海量的信息让用户需要花费大量的精力对其进行筛选,难以从众多的养老机构信息中获取所需要的内容。通过对网页工作原理的研究,基于Python语言的数据分析包,使用Requests库和re模块进行程序设计,根据相关的关键词、地区等信息对网上养老机构信息的爬取,以获取不同网站中关于不同养老机构数据信息,并对获取到的数据进行二次处理。最后通过通用网关接口(CGI)编程完成程序与服务器的交互,将处理后的数据通过页面进行可视化操作,为用户提供一种快速、便捷地获取目标养老机构数据的方法。 展开更多
关键词 爬虫 PYTHON 编程 验证码获取 图片识别
下载PDF
基于Webdriver爬虫技术的研究 被引量:1
14
作者 贺杰 《科技广场》 2016年第10期27-31,共5页
本文提出基于Webdriver测试工具的爬虫程序实现,通过实例化一个浏览器再通过代码自动控制其浏览网页实现对网站数据的爬取。通过实现点击事件方法可以很好地解决传统爬虫技术中Ajax网站动态加载引起的数据丢失问题。最后以新闻网站为例... 本文提出基于Webdriver测试工具的爬虫程序实现,通过实例化一个浏览器再通过代码自动控制其浏览网页实现对网站数据的爬取。通过实现点击事件方法可以很好地解决传统爬虫技术中Ajax网站动态加载引起的数据丢失问题。最后以新闻网站为例,实现了本文所设计的爬虫程序。 展开更多
关键词 Webdriver 爬虫 WEB网页
下载PDF
基于jsoup爬取图书网页信息的网络爬虫技术 被引量:11
15
作者 熊艳秋 严碧波 《电脑与信息技术》 2019年第4期61-63,共3页
随着科技飞速的发展,对于从海量数据中快速获取最有效的信息成为了一个难题。Java是主流编程语言,对Java爬虫技术的研究很有必要。本文主要使用基于Java的Http Client,jsoup技术,MySQL数据库,Spring Boot等框架技术对图书网站信息进行... 随着科技飞速的发展,对于从海量数据中快速获取最有效的信息成为了一个难题。Java是主流编程语言,对Java爬虫技术的研究很有必要。本文主要使用基于Java的Http Client,jsoup技术,MySQL数据库,Spring Boot等框架技术对图书网站信息进行网络爬虫。将爬取后的数据存储到后台数据库,以便应用于后续的数据分析。 展开更多
关键词 JAVA编程语言 网络爬虫 MYSQL数据库 图书
下载PDF
基于python的电影评分网页数据爬取 被引量:1
16
作者 王恒 唐孝国 郭俊亮 《黑龙江科学》 2022年第14期48-50,54,共4页
基于python编程语言,运用其附带的各种库完成数据爬取和分析及数据可视化任务,通过构造网页爬取函数askUrl()、数据获取函数getDate()、数据保存函数saveData(),将其嵌套在主函数main()中,共同完成数据的爬取和分析,将得到的数据汇总到E... 基于python编程语言,运用其附带的各种库完成数据爬取和分析及数据可视化任务,通过构造网页爬取函数askUrl()、数据获取函数getDate()、数据保存函数saveData(),将其嵌套在主函数main()中,共同完成数据的爬取和分析,将得到的数据汇总到Excel表格中。结果表明,美国产出的电影占比很大,剧情类电影受到的关注度很高。基于此,给出了有利于国产电影行业发展的建议。 展开更多
关键词 python编程语言 网络爬虫 数据可视化 豆瓣影评Top250
下载PDF
基于Python的新浪微博中爬虫程序维护方法 被引量:1
17
作者 何波 《软件》 2022年第2期52-54,共3页
新浪微博是当下社会使用较广泛的社交平台,为了提高平台的稳定运行能力,给予用户更加良好的社交体验,提出基于Python的新浪微博中爬虫程序维护方法。按照标准的统计方法与机器学习模式,在爬虫程序中建立空间场景,当识别到的爬虫程序信... 新浪微博是当下社会使用较广泛的社交平台,为了提高平台的稳定运行能力,给予用户更加良好的社交体验,提出基于Python的新浪微博中爬虫程序维护方法。按照标准的统计方法与机器学习模式,在爬虫程序中建立空间场景,当识别到的爬虫程序信息与网站域名信息具备一定适配性时,爬虫程序维护信息。同时,抓取爬虫程序中敏感数据,按照网站浏览顺序进行匹配,以此获取的节点数据作为程序维护的依据;并采用建立目标函数的方式,对敏感数据有效性的校验,从维护合理性角度出发,参照域名地址,定位敏感数据发生位置,以此完成对程序的维护。实验结果表明:提出的爬虫程序维护方法,可提高对爬虫程序获取敏感数据定位的准确率,实现对网站爬虫程序的维护。 展开更多
关键词 PYTHON 新浪微博 爬虫程序 维护方法
下载PDF
Selenium框架的反爬虫程序设计与实现 被引量:6
18
作者 许景贤 林锦程 程雨萌 《福建电脑》 2021年第1期26-29,共4页
随着爬虫技术的发展,越来越多的网站加入了反爬虫技术。本文应用Python语言和Selenium框架设计一个爬虫程序,并在文中加入了反爬虫机制。该程序成功爬取了淘宝商品名称和价格等信息,并对所爬取的信息进行存储。结果表明,本文的爬虫程序... 随着爬虫技术的发展,越来越多的网站加入了反爬虫技术。本文应用Python语言和Selenium框架设计一个爬虫程序,并在文中加入了反爬虫机制。该程序成功爬取了淘宝商品名称和价格等信息,并对所爬取的信息进行存储。结果表明,本文的爬虫程序可以绕过淘宝的反爬虫验证,且可以准确地获取所需的商品清单和得到商品的相关信息。 展开更多
关键词 反爬虫 淘宝商品 SELENIUM 反爬虫程序
下载PDF
基于Python的新闻聚合系统网络爬虫研究 被引量:8
19
作者 左卫刚 《长春师范大学学报》 2018年第12期29-33,共5页
本文开发了一套基于Python的网络爬虫,并预留API,从而构建一个新闻聚合系统。新闻聚合系统中的新闻数据需要爬虫来获取,然而不同的网站有不同的页面布局,本研究旨在创建一个能够从不同页面布局中提取数据的开源爬虫,其中包括网络爬虫、... 本文开发了一套基于Python的网络爬虫,并预留API,从而构建一个新闻聚合系统。新闻聚合系统中的新闻数据需要爬虫来获取,然而不同的网站有不同的页面布局,本研究旨在创建一个能够从不同页面布局中提取数据的开源爬虫,其中包括网络爬虫、API、网络爬虫调度器以及Socket服务器的实现等。开发过程中使用Python语言开发网络爬虫,利用Beautiful Soup作为网络爬虫的web提取工具,以Laravel为web应用程序框架,以PHP作为主要后端语言,承载CMS和API。网络爬虫可以通过利用用户创建的配置文件来适应从不同的页面布局中提取数据,并将提取的数据导出到JSON文件或数据库系统中。 展开更多
关键词 网络爬虫 HTML提取 新闻管理系统 应用程序接口
下载PDF
基于网络爬虫的单词翻译器设计与研究
20
作者 周游宇 孙洪波 梅良才 《科技资讯》 2021年第16期4-6,共3页
该文基于机器学习中的网络爬虫技术提出了一种单词翻译器的设计与研究流程。首先,该文对Iciba网站进行爬虫,经过前期url分析,编写定向页面requests爬虫,得到单词释义和例句。其次,通过一个查询单词的通用程序框架,编写request s定向爬虫... 该文基于机器学习中的网络爬虫技术提出了一种单词翻译器的设计与研究流程。首先,该文对Iciba网站进行爬虫,经过前期url分析,编写定向页面requests爬虫,得到单词释义和例句。其次,通过一个查询单词的通用程序框架,编写request s定向爬虫,实时获得最新的词语解释和例句。最后,该文设计了一个GUI窗体界面,用于展示相关结果,具有较好的实用性和有效性。该文提出的研究方法是机器学习相关研究领域的一个扩充,且该研究结果给教育相关领域提供了一个有效的应用产品。 展开更多
关键词 requests框架 网络爬虫 GUI界面编程 PYTHON
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部