期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
Python爬虫技术在学术聚合系统中的应用
1
作者 崔梦银 邓茵 刘满意 《现代信息科技》 2024年第10期68-74,共7页
爬虫技术是搜索引擎和信息网站获取数据的核心技术之一,专用的网络爬虫能够在短时间内从网络上抓取大量有用数据。基于为研究者提供所需学术资源的目的,研究了爬虫技术在爬取学术网站论文数据中的应用。分析了Python爬虫技术在学术聚合... 爬虫技术是搜索引擎和信息网站获取数据的核心技术之一,专用的网络爬虫能够在短时间内从网络上抓取大量有用数据。基于为研究者提供所需学术资源的目的,研究了爬虫技术在爬取学术网站论文数据中的应用。分析了Python爬虫技术在学术聚合系统中的应用,借助大数据技术手段对所爬取的学术数据进行存储、清洗、聚合、消歧和融合。Python爬虫技术在学术聚合系统中起着关键作用,助力研发人员构建强大的数据聚合和分析平台,为学术研究人员提供有价值的信息资源,对学术研究、文献检索和信息发现都具有重要意义。 展开更多
关键词 python爬虫 学术资源 大数据技术 学术聚合系统
下载PDF
基于Python爬虫的太原天气数据分析与可视化研究 被引量:3
2
作者 李红 《信息与电脑》 2023年第4期212-214,共3页
天气一直与人们的生产生活息息相关,山西省太原市作为中国华北地区省会城市,四季分明,人口较多,天气数据的影响更是显著。但是,随着大数据的到来,人们能从网络接收到的天气数据越来越多,这为人们筛选信息带来困难。文章依托Python爬虫技... 天气一直与人们的生产生活息息相关,山西省太原市作为中国华北地区省会城市,四季分明,人口较多,天气数据的影响更是显著。但是,随着大数据的到来,人们能从网络接收到的天气数据越来越多,这为人们筛选信息带来困难。文章依托Python爬虫技术,爬取了2022年太原市天气气温数据,并通过可视化技术将数据以图表的形式进行直观展示,可以直接为人们生活、工农生产进行数据服务。 展开更多
关键词 python爬虫 天气 数据分析 可视化
下载PDF
基于Python爬虫技术的网页内容文本大数据提取方法研究
3
作者 党浩予 《电脑与电信》 2023年第8期90-93,共4页
现如今网站的页面布局较为复杂、展示内容与文本信息较多,在单位时间内提高文本大数据提取数量难度较大,基于此以Python爬虫技术为支撑,开展网页内容文本大数据提取方法的设计研究。首先,对网页内容进行综合解析,获取网页内容文本数据,... 现如今网站的页面布局较为复杂、展示内容与文本信息较多,在单位时间内提高文本大数据提取数量难度较大,基于此以Python爬虫技术为支撑,开展网页内容文本大数据提取方法的设计研究。首先,对网页内容进行综合解析,获取网页内容文本数据,计算网页内容文本复杂度;其次,引进Python爬虫技术,计算特征信息权重,进行文本大数据特征的识别;最后,通过提取的文本大数据特征,构建网页内容文本相空间,采集大数据矢量信息,根据预设的条件,进行大数据关键信息的维度划分及信息提取。通过实验对比,在相同的条件下对比传统方法,本文设计的方法提取文本大数据数量最多、能力最强,可以提取更多的文本大数据信息,即该方法的文本大数据提取能力较强。 展开更多
关键词 python爬虫技术 关联维度信息 提取方法 大数据 文本 网页内容
下载PDF
基于Python爬虫技术的广府文化特色符号的提炼与传播现状分析
4
作者 袁宏舟 郑凤婵 《电脑迷》 2023年第6期49-51,共3页
广府文化特色符号在线下现实世界和线上网络空间均具有特色化、主题化、符号化、情感化和公共性等特性,其传播现状与特点也具有一定的独特性和差异性。利用清博舆情系统进行Python数据爬虫分析,可以较为清晰地看出广府文化中各个特色符... 广府文化特色符号在线下现实世界和线上网络空间均具有特色化、主题化、符号化、情感化和公共性等特性,其传播现状与特点也具有一定的独特性和差异性。利用清博舆情系统进行Python数据爬虫分析,可以较为清晰地看出广府文化中各个特色符号的传播现状、传播特色、传播倾向、传播情绪等,有助于在文化传播的过程中有所倾向地调配资源,助推地方特色文化的传承。 展开更多
关键词 python爬虫 广府文化 提炼过程 传播现状
下载PDF
基于Python爬虫技术的高校教学数据分析与挖掘研究
5
作者 杨静 《中文科技期刊数据库(全文版)教育科学》 2023年第5期31-34,共4页
随着互联网技术的不断发展,高校教学数据得以数字化并存储于网络中。这些数据包括学生选课情况、考试成绩、学籍信息等,具有丰富的挖掘价值。本文基于Python爬虫技术,采集高校教学数据,并利用pandas、numpy、scikit-learn等Python数据... 随着互联网技术的不断发展,高校教学数据得以数字化并存储于网络中。这些数据包括学生选课情况、考试成绩、学籍信息等,具有丰富的挖掘价值。本文基于Python爬虫技术,采集高校教学数据,并利用pandas、numpy、scikit-learn等Python数据分析工具库对数据进行预处理、清洗和分析,最终构建高校教学质量评价模型。实验结果表明,该模型能够有效地预测学生成绩和评价教学质量,为高校提供科学依据。 展开更多
关键词 python爬虫技术 高校教学数据 数据分析 高校教学质量评价
下载PDF
基于Python爬虫技术的游客评论数据可视化分析 被引量:6
6
作者 贾艳平 翟晋刚 《安阳师范学院学报》 2021年第5期51-54,共4页
通过Python爬虫技术对2019年五一假期期间某著名旅游景区网站上游客对该景区酒店评论数据进行爬取,以爬取的数据为分析对象,对酒店的住宿环境、价格、位置与交通以及服务态度等关键信息的游客评论数据进行可视化分析。结果表明,景区游... 通过Python爬虫技术对2019年五一假期期间某著名旅游景区网站上游客对该景区酒店评论数据进行爬取,以爬取的数据为分析对象,对酒店的住宿环境、价格、位置与交通以及服务态度等关键信息的游客评论数据进行可视化分析。结果表明,景区游客更加关注旅游景区的门票、位置、公交车、老板、印象、住宿等关键性要素,同时游客认为酒店服务存在的不足主要有房间隔音差、停车场偏小等。该分析对促进旅游景区健康、可持续发展提供了数据参考和决策依据。 展开更多
关键词 旅游景点 游客 评论数据 可视化 python爬虫技术
下载PDF
基于Python爬虫技术的虚假数据溯源与途中过滤分析 被引量:1
7
作者 王景 《河南科技》 2021年第22期27-30,共4页
面对不同网络系统场景下存在虚假数据溯源精度低、过滤执行范围小等问题,提出利用Python爬虫技术的虚假数据处理方案,将虚假数据覆盖的网络空间划分为多个网格,在网格系统中布置多个节点,利用爬虫管理器、采集器等软件,对网页、应用程... 面对不同网络系统场景下存在虚假数据溯源精度低、过滤执行范围小等问题,提出利用Python爬虫技术的虚假数据处理方案,将虚假数据覆盖的网络空间划分为多个网格,在网格系统中布置多个节点,利用爬虫管理器、采集器等软件,对网页、应用程序界面的数据进行Python爬虫抓取,标记抓取到的数据包,再使用共享密钥对sink网关节点获得的数据包做出其消息认证码(Message Authentication Code,MAC)地址是否合法的判断,若不合法则启动虚假数溯源,过滤掉无用的密钥节点。 展开更多
关键词 python爬虫技术 虚假数据 溯源 途中过滤分析
下载PDF
基于Python爬虫的职位信息数据分析和可视化系统实现 被引量:6
8
作者 刘娟 管希东 《软件工程与应用》 2020年第4期317-325,共9页
为了能更加直观地了解到国内大数据有关的职业对学历和工作经验的具体要求以及不同性质企业地区分布等情况,采用Python的数据分析和处理功能,通过Python爬虫技术爬取前程无忧网大量职位信息。按照删除有空值的信息、与大数据无关的职业... 为了能更加直观地了解到国内大数据有关的职业对学历和工作经验的具体要求以及不同性质企业地区分布等情况,采用Python的数据分析和处理功能,通过Python爬虫技术爬取前程无忧网大量职位信息。按照删除有空值的信息、与大数据无关的职业、信息错位的数据清洗方法,对数据进行预处理,然后将清洗后的数据存入数据库,再利用Pyecharts对数据进行可视化分析,用Flask作为Web框架开发Web应用程序,将可视化的数据展示在网页,提高了用户查询信息的速度,方便求职者找到适合且满意的职位。 展开更多
关键词 python爬虫 职位信息 数据清洗 可视化 FLASK
下载PDF
基于Python爬虫的旅游网站数据分析与可视化 被引量:6
9
作者 赵蔷 《电子设计工程》 2022年第16期152-155,共4页
爬虫是搜索引擎和网站的核心元素,专用的网络爬虫能够在短时间内从网络上抓取大量有用数据。为了爬取旅游网站的旅游数据,分析网站上的旅游热门地区和热门景点,研究了一种基于Scrapy框架的针对旅游网站的聚焦型网络爬虫,对爬取的数据进... 爬虫是搜索引擎和网站的核心元素,专用的网络爬虫能够在短时间内从网络上抓取大量有用数据。为了爬取旅游网站的旅游数据,分析网站上的旅游热门地区和热门景点,研究了一种基于Scrapy框架的针对旅游网站的聚焦型网络爬虫,对爬取的数据进行分析,并通过第三方库Pandas和Matplotlib实现数据可视化。实验结果表明,提出的以旅游网站为主题的聚焦网络爬虫能够提高对旅游数据的检索效率,在旅游网站海量数据里快速找到所需信息,为旅游爱好者出行以及各地区、景点优化服务提供参考。 展开更多
关键词 python爬虫 Scrapy框架 旅游网站 可视化
下载PDF
基于Python爬虫的旅游网站数据分析与可视化设计分析 被引量:1
10
作者 李轩宇 赵颖 +1 位作者 肖忠良 李轩 《电脑知识与技术》 2022年第33期58-60,70,共4页
网站与搜索引擎中爬虫属于核心元素,网络爬虫可以在网络中快速抓取海量有用信息。为了对旅游网站中信息数据展开爬取,对网站中热门景点与热门地区进行分析,研究一种以SCRAPY框架为基础的网络爬虫,分析爬取的数据,借助第三方库对数据信... 网站与搜索引擎中爬虫属于核心元素,网络爬虫可以在网络中快速抓取海量有用信息。为了对旅游网站中信息数据展开爬取,对网站中热门景点与热门地区进行分析,研究一种以SCRAPY框架为基础的网络爬虫,分析爬取的数据,借助第三方库对数据信息进行可视化处理。最终试运行结果显示,该程序可以对微博、马蜂窝与其他数据量密集网站进行有效爬取。 展开更多
关键词 python爬虫 旅游网站 数据分析 可视化设计
下载PDF
Python爬虫技术的网页数据抓取与分析 被引量:11
11
作者 徐志 金伟 《数字技术与应用》 2020年第10期30-32,共3页
随着信息化时代的到来,互联网信息量呈现爆发式的增长,如何在诸多复杂的信息中简单快捷的寻找到有效信息,而网络爬虫的诞生能够有效的解决此类问题,改善了信息检索的现状,本文通过概述网络爬虫的原理,对Python爬虫技术进行分析。
关键词 网页数据 抓取 python爬虫技术 分析
下载PDF
基于Python爬虫技术的网页数据抓取方法 被引量:3
12
作者 刘萍 《信息与电脑》 2022年第14期169-171,共3页
由于对网页数据的爬取存在一定的完整性问题,导致爬取质量和效率较低,为此提出基于Python爬虫技术的网页数据抓取方法。首先,以网页数据的非线性时间序列关键点为节点,构建Python爬虫网络相空间格局;其次,利用Python爬虫技术在划分的网... 由于对网页数据的爬取存在一定的完整性问题,导致爬取质量和效率较低,为此提出基于Python爬虫技术的网页数据抓取方法。首先,以网页数据的非线性时间序列关键点为节点,构建Python爬虫网络相空间格局;其次,利用Python爬虫技术在划分的网络相空间格局内抓取目标数据;最后,Python爬虫以爬取目标为数据特性,以空间划分结果为基础,对库中的页面进行个性化标记,抽取页面包含的所有统一资源定位系统(Uniform Resource Locator,URL)信息,将其与已抓取队列信息进行比较,确定爬取结果的完整性。测试结果表明,设计方法可以适应不同网络环境,实现对网页数据的快速、有效抓取。 展开更多
关键词 python爬虫技术 网页数据抓取 非线性时间序列
下载PDF
基于Python爬虫的多语言社交媒体情感分析研究 被引量:2
13
作者 薛涛 《信阳农林学院学报》 2020年第3期119-123,共5页
针对社交媒体中的多语言情感分析问题,首先基于Python程序设计语言,设计并实现了用于获取数据集和进行预处理的爬虫模块。然后,设计了一种基于无监督学习的多语言情感分析算法以从社交媒体数据中提取情感的模式。最后,利用爬虫模块从社... 针对社交媒体中的多语言情感分析问题,首先基于Python程序设计语言,设计并实现了用于获取数据集和进行预处理的爬虫模块。然后,设计了一种基于无监督学习的多语言情感分析算法以从社交媒体数据中提取情感的模式。最后,利用爬虫模块从社交媒体网站收集数据,并采用所收集的数据来评估本方法的有效性。 展开更多
关键词 python爬虫 多语言情感分析 社交媒体
下载PDF
基于Python爬虫的比赛信息查询交流系统设计 被引量:1
14
作者 杨雄 《无线互联科技》 2020年第9期45-46,共2页
随着就业压力的增加,公司对技术性人才的需求越来越高。随着科技的发展和社会的进步,各个行业快速发展,尤其是计算机和互联网领域的发展极其迅速。很明显,高校毕业生只获得毕业证和学位证是不能满足公司要求的。为了帮助更多同学参加各... 随着就业压力的增加,公司对技术性人才的需求越来越高。随着科技的发展和社会的进步,各个行业快速发展,尤其是计算机和互联网领域的发展极其迅速。很明显,高校毕业生只获得毕业证和学位证是不能满足公司要求的。为了帮助更多同学参加各类比赛,文章依靠Python网络爬虫技术、J2EE技术架构和B/S模式来开发一个系统,将抓取的各种比赛信息统一存放在MySQL数据库中,方便用户查询,抓取的比赛信息比较全面。 展开更多
关键词 J2EE 网络爬虫 python爬虫 组队 信息定制化
下载PDF
基于Python爬虫技术的网络目录更新程序设计 被引量:1
15
作者 宋钰 《现代信息科技》 2020年第18期20-22,共3页
为解决传统网络目录更新程序速率慢的问题,文章设计了基于Python爬虫技术的网络目录更新程序,运用GET方式自动解析预设网络目录参数,删除重复网络目录,转化最新得到的网络目录为EQ3格式,完成网络目录更新,实现EQ3网络目录格式更新程序... 为解决传统网络目录更新程序速率慢的问题,文章设计了基于Python爬虫技术的网络目录更新程序,运用GET方式自动解析预设网络目录参数,删除重复网络目录,转化最新得到的网络目录为EQ3格式,完成网络目录更新,实现EQ3网络目录格式更新程序的设计。通过PyQt编写程序界面得出结论:该程序更新网络目录平均耗时为1.568 s,对照组为4.896 s,该程序更新网络目录平均耗时低于对照组,更新速率更快,可以解决传统网络目录更新程序速率慢的问题。 展开更多
关键词 python爬虫技术 网络目录 更新程序 更新速率
下载PDF
Python爬虫的Cookie反爬应对策略研究 被引量:1
16
作者 陶卫卫 《信息与电脑》 2021年第8期189-192,共4页
爬虫程序可以自动读取并抓取Web应用的数据,大量抓取数据会消耗Web系统资源,因此运用反爬程序可以适当保护资源和减轻Web服务器的负担。笔者以拉勾网为例,使用Python爬虫爬取某个职位的网页信息,研究Cookie如何实现客户信息的保存并变... 爬虫程序可以自动读取并抓取Web应用的数据,大量抓取数据会消耗Web系统资源,因此运用反爬程序可以适当保护资源和减轻Web服务器的负担。笔者以拉勾网为例,使用Python爬虫爬取某个职位的网页信息,研究Cookie如何实现客户信息的保存并变异为反爬,并对本次爬虫所得数据进行筛选、匹配与保存。 展开更多
关键词 python爬虫 Cookie反爬 requests库
下载PDF
基于python爬虫和mysql数据库分析承兑汇票市场
17
作者 杨唯希 《数码设计》 2021年第1期169-170,共2页
票据市场是我国金融市场的重要组成部分。票据作为一种古老而又常新的金融工具,可以用来融资和流通。分析票据市场数据来指导票据使用行为,对于票据市场众多的参与主体——银行,中介,和企业来说,具有现实意义。特别是结合如今的互联网... 票据市场是我国金融市场的重要组成部分。票据作为一种古老而又常新的金融工具,可以用来融资和流通。分析票据市场数据来指导票据使用行为,对于票据市场众多的参与主体——银行,中介,和企业来说,具有现实意义。特别是结合如今的互联网大数据技术,这种迫切的需求能够被高效的实现。 展开更多
关键词 票据 承兑 贴现 python爬虫 MYSQL数据库
下载PDF
基于Python爬虫的数据获取与可视化的教学实践研究
18
作者 陈星 宣震 《中国信息技术教育》 2020年第17期46-51,共6页
2019粤教版信息技术必修1结合《5.2数据的采集》《5.4数据的可视化分析》的内容,采用Python编写网络爬虫与数据可视化工具的案例,并使用程序与人行为的类比逐步深入任务,通过探究学习方式让学生体验爬虫获取网页数据的完整流程,对文本... 2019粤教版信息技术必修1结合《5.2数据的采集》《5.4数据的可视化分析》的内容,采用Python编写网络爬虫与数据可视化工具的案例,并使用程序与人行为的类比逐步深入任务,通过探究学习方式让学生体验爬虫获取网页数据的完整流程,对文本数据可视化分析并得出结论,培养了学生的计算思维,让学生体会到数据保护的意义,提升了学生社会责任感。 展开更多
关键词 python爬虫 数据采集与可视化分析 学科教学
下载PDF
Python爬虫获取豆瓣观众影评数据及可视化分析
19
作者 徐圣方 王金阳 《网络安全技术与应用》 2024年第4期59-62,共4页
本研究主要利用Python编程语言,对豆瓣电影《我不是药神》影评数据进行采集和可视化分析。首先,说明了需要的影评数据;其次,介绍了数据收集方法、数据清洗和数据预处理;最后,通过数据可视化分析方法,对该电影的影评词云图、电影评分分... 本研究主要利用Python编程语言,对豆瓣电影《我不是药神》影评数据进行采集和可视化分析。首先,说明了需要的影评数据;其次,介绍了数据收集方法、数据清洗和数据预处理;最后,通过数据可视化分析方法,对该电影的影评词云图、电影评分分布、评论数量与时间的关系、评论分数与日期的关系、评论数量和城市分布关系、评论分数和城市分布关系等进行探讨。本研究有助于了解《我不是药神》在豆瓣电影上的受欢迎程度,也为制片方和电影市场提供一定的参考意见。 展开更多
关键词 python爬虫 豆瓣影评 数据可视化
原文传递
基于Python的城市天气数据爬虫程序分析 被引量:10
20
作者 于学斗 柏晓钰 《办公自动化》 2022年第7期10-13,9,共5页
目前,我国正在加大环境保护的力度。如何充分利用互联网上的已有的海量数据为低碳环保事业做出贡献,是我们不可推缺的责任。为快速爬取网络上的信息,网络爬虫应运而生。通过使用网络爬虫技术,能在短时内提取有价值的信息数据。得到有价... 目前,我国正在加大环境保护的力度。如何充分利用互联网上的已有的海量数据为低碳环保事业做出贡献,是我们不可推缺的责任。为快速爬取网络上的信息,网络爬虫应运而生。通过使用网络爬虫技术,能在短时内提取有价值的信息数据。得到有价值的数据后,根据数据的形式进行整理,运用HTML、CSS、JavaScript、Flask框架、Echarts、WordCloud等技术对数据进行可视化展现。将数据进行完整地分析,有利于更好地利用数据解决实际问题。本文将对基于Python的聚焦式网络爬虫设计与实现以及分析天气数据并可视化地展现作出简介。 展开更多
关键词 python爬虫 网页设计 Flask框架 信息可视化
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部