期刊文献+
共找到166篇文章
< 1 2 9 >
每页显示 20 50 100
基于主题爬虫的网络舆情系统设计与实现
1
作者 江官星 黄卫 《无线互联科技》 2024年第14期33-35,50,共4页
网络舆情具有快速、广泛传播的特征,发酵扩散时间极短,若未及时发现并妥善处置,可能会引发网络舆情危机,造成严重的危害与影响。为净化网络环境,减少网络舆情爆发所产生的损失,文章以网络爬虫技术为基础,设计了基于主题爬虫的网络舆情... 网络舆情具有快速、广泛传播的特征,发酵扩散时间极短,若未及时发现并妥善处置,可能会引发网络舆情危机,造成严重的危害与影响。为净化网络环境,减少网络舆情爆发所产生的损失,文章以网络爬虫技术为基础,设计了基于主题爬虫的网络舆情监测管理系统。首先,文章阐述了此系统设计思路,分别介绍了系统架构设计、系统功能设计、系统安全设计3个方面内容。最后,文章依次给出了舆情采集、舆情监测、舆情分析、舆情预警、舆情处置5个主要功能的实现方法,旨在为相关部门科学监控与处置网络舆情提供可靠的软件系统。 展开更多
关键词 主题爬虫 网络舆情 系统设计 功能实现
下载PDF
一个P2P IPTV多协议爬行器——TVCrawler 被引量:5
2
作者 姜志宏 王晖 +1 位作者 樊鹏翼 袁雪美 《计算机应用》 CSCD 北大核心 2010年第3期715-718,728,共5页
P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方... P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方式之一。提出了一个P2PIPTV多协议爬行器——TVCrawler,能够对PPLive、PPStream和UUSee三个系统的直播频道进行测量。TVCrawler主要具有三个特点:1)采用基于反馈的引导节点集构造机制;2)采用主从结构,并行爬行获取拓扑数据;3)采用基于拓扑增长系数的自适应爬行时长控制。实验表明,TVCrawler的爬行测量速度达到20~100节点/秒和130~500边/秒。 展开更多
关键词 网络测量 对等网络 网络电视 爬行器 覆盖网络
下载PDF
智能专题化信息搜集Crawler 被引量:4
3
作者 钱榕 徐新华 +1 位作者 郑莹 杨炳儒 《计算机工程》 CAS CSCD 北大核心 2006年第3期57-59,共3页
介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑... 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。 展开更多
关键词 专题化爬行 WEB挖掘 神经网络 加强学习
下载PDF
基于神经网络的增量式crawler重访频率研究 被引量:1
4
作者 周英飚 王军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期32-33,45,共3页
crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有... crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有较好的自适应性 . 展开更多
关键词 搜索引擎 crawler 增量式crawler 神经网络
下载PDF
基于深度学习的商品价格欺诈行为与电子数据取证关联应用
5
作者 陈晓 吴祥林 李新 《中国标准化》 2024年第11期73-79,87,共8页
该研究聚焦电商领域商品价格欺诈行为的智能检测问题,采用深度学习技术结合电子数据取证手段构建商品价格监测系统。研究团队使用爬虫从各大电商平台抓取商品价格数据,并实施严格的数据清洗与质量控制,选取LSTM网络架构,利用其在处理时... 该研究聚焦电商领域商品价格欺诈行为的智能检测问题,采用深度学习技术结合电子数据取证手段构建商品价格监测系统。研究团队使用爬虫从各大电商平台抓取商品价格数据,并实施严格的数据清洗与质量控制,选取LSTM网络架构,利用其在处理时间序列数据的优势,捕捉商品价格变动规律。通过嵌入层对离散特征编码,多层LSTM单元捕获时序特征,全连接层用于输出价格预测。电子数据取证在此过程中起到关键作用,能揭示商品价格欺诈的具体模式,大大提高了欺诈案件的侦破效率。尽管现有模型和方法已取得一定成效,但研究也有局限性,如数据代表性不足、模型泛化能力、标签不平衡问题及模型可解释性差等。 展开更多
关键词 价格欺诈 爬虫 LSTM网络架构 深度学习
下载PDF
济南齐鲁黄河大桥网状吊杆系杆拱桥施工关键技术
6
作者 王伟 唐茂林 +2 位作者 赵世超 李翠娟 崔学涛 《世界桥梁》 北大核心 2024年第4期22-28,共7页
济南齐鲁黄河大桥主桥为(95+280) m+420 m+(280+95) m五跨三连拱下承式网状吊杆系杆拱桥,主梁采用钢-混组合梁,梁宽60.7 m,采用“先梁后拱”的施工工艺。钢箱梁采用“静动结合”的吊装技术,解决了有限作业空间下超重、超宽钢箱梁节段上... 济南齐鲁黄河大桥主桥为(95+280) m+420 m+(280+95) m五跨三连拱下承式网状吊杆系杆拱桥,主梁采用钢-混组合梁,梁宽60.7 m,采用“先梁后拱”的施工工艺。钢箱梁采用“静动结合”的吊装技术,解决了有限作业空间下超重、超宽钢箱梁节段上桥的难题,钢箱梁采用智能化步履式顶推设备与坦克轮相结合的方式顶推施工,提高了顶推过程的可控性、安全性和高效性。3跨拱肋中2个280 m跨采用满堂支架法施工,420 m跨采用“三段法”施工,即通过满堂支架法安装两端60 m边拱肋,300 m中拱段采用在钢箱梁上低位拼装,然后整体提升中拱段,使其与边拱肋配切合龙。对吊杆张拉方案进行对比,基于有限元分析,以吊杆内力控制为原则,最终选择吊杆应力水平更低的从跨中向拱脚对称张拉的吊杆张拉方案,张拉过程中采用接长杆减少张拉工作量,使吊杆张拉更高效、安全。 展开更多
关键词 系杆拱桥 网状吊杆 先梁后拱 步履式顶推 三段法 吊杆张拉 施工技术
下载PDF
网络著作权诉讼的正当性缺失与修正——基于网络爬虫、商业化维权的视角分析
7
作者 马驰升 王楠 《西华师范大学学报(哲学社会科学版)》 2024年第1期78-85,共8页
大数据时代来临,由网络爬虫技术的普及引起的商业化维权现象凸显,现有网络著作诉讼程序在解决网络著作权纠纷时产生了不公正的现象。由于网络爬虫的技术特性以及司法资源有限的情况,著作权人为维护利益往往采用共同诉讼形式。然而鉴于... 大数据时代来临,由网络爬虫技术的普及引起的商业化维权现象凸显,现有网络著作诉讼程序在解决网络著作权纠纷时产生了不公正的现象。由于网络爬虫的技术特性以及司法资源有限的情况,著作权人为维护利益往往采用共同诉讼形式。然而鉴于共同诉讼侵权主体和侵权目的认定困难,再加上网络隐蔽性和电子证据收集和认定的复杂性,著作权人主动或被动地选择商业化维权,加剧了网络著作权诉讼正当性的缺失,其内在表现为著作权人维权理念的失衡、网络爬虫技术使用者的认知偏差和司法审判机制的失效,其成因涉及法社会学、法经济学和法哲学等多个方面。为修正网络著作权诉讼正当性的缺失,平衡著作权人权利保护与作品的创作和传播,应从遵循自由市场规律、改变诉讼效益途径和完善著作权诉讼制度三个维度入手,以适应网络技术的发展与社会公共利益的需求。 展开更多
关键词 网络爬虫 商业化维权 著作权诉讼
下载PDF
基于知识图谱的恶意软件信息检测方法研究
8
作者 桑道松 《九江学院学报(自然科学版)》 CAS 2024年第3期79-84,共6页
互联网的发展导致恶意软件信息类型种类繁多,为检测获取更深层次的恶意软件信息,研究基于知识图谱的恶意软件信息检测方法,提升恶意软件信息检测效果。利用文本挖掘技术中的Python网络爬虫技术,采集软件有效信息;通过信息增益算法,在采... 互联网的发展导致恶意软件信息类型种类繁多,为检测获取更深层次的恶意软件信息,研究基于知识图谱的恶意软件信息检测方法,提升恶意软件信息检测效果。利用文本挖掘技术中的Python网络爬虫技术,采集软件有效信息;通过信息增益算法,在采集的软件有效信息内,提取软件信息特征;在双向长短期记忆神经网络内输入软件信息特征,输出软件信息实体识别结果,并抽取软件信息实体间的关系;依据实体消岐技术,对抽取的软件信息实体关系进行知识融合,得到软件信息知识图谱;利用图推理算法,处理软件信息知识图谱,得到恶意软件信息检测结果。实验证明:该方法可有效采集软件有效信息,并提取软件信息特征,建立软件信息知识图谱;该方法可有效检测恶意软件信息,且检测精度较高。 展开更多
关键词 知识图谱 恶意软件 信息检测 Python网络爬虫 神经网络 图推理算法
下载PDF
BP神经网络PID果园运输车调平系统研究
9
作者 戚得众 闫行行 阮晓松 《机械设计与制造》 北大核心 2024年第8期186-190,共5页
针对丘陵果园坡度较大,运输果箱过程中易发生倾覆的问题,根据运输车行驶过程中不同的倾斜状态,设计出一种基于BP神经网络的PID果箱调平控制方案,通过仿真分析表明:以倾斜角下降到2°以下时为理想状态。路面扰动分别为25°、20&#... 针对丘陵果园坡度较大,运输果箱过程中易发生倾覆的问题,根据运输车行驶过程中不同的倾斜状态,设计出一种基于BP神经网络的PID果箱调平控制方案,通过仿真分析表明:以倾斜角下降到2°以下时为理想状态。路面扰动分别为25°、20°、15°时,BP神经网络PID达到理想状态耗时分别为3.3s、2.8s、2.4s。与传统PID控制算法相比,该控制方案达到理想状态时其效率分别提升13.1%、22.2%、31.4%。峰值分别优化19.43%、14.68%、20.42%。通过试验结果表明:在20°坡面上,达到稳态时误差为1.1°,耗时5.5s;在25°坡面上,达到稳态时误差为1.8°,耗时6.4s。仿真与试验结果说明本文提出的基于BP神经网络的PID果箱调平控制方法具有良好的控制效果和稳定性。对实际生产过程具有指导意义。 展开更多
关键词 丘陵果园 履带式运输车 BP神经网络 PID 果箱调平 倾斜角
下载PDF
BP网络在Web Crawler中的应用
10
作者 张艳艳 《微计算机信息》 北大核心 2008年第27期95-96,119,共3页
本文介绍了Web Crawler和BP网络的基本原理,在此基础上,应用BP网络对网页变化的时间间隔进行建模,通过BP算法训练得到一个预测模型,预测出各网页的变化时间间隔,通过与实际采集的时间间隔相比较判断网页是否发生变化。实验证明,BP网络... 本文介绍了Web Crawler和BP网络的基本原理,在此基础上,应用BP网络对网页变化的时间间隔进行建模,通过BP算法训练得到一个预测模型,预测出各网页的变化时间间隔,通过与实际采集的时间间隔相比较判断网页是否发生变化。实验证明,BP网络能够有效预测网页变化的时间间隔,指导增量更新。 展开更多
关键词 Webcrawler BP网络 预测模型
下载PDF
基于大数据的网络数据采集研究与实践 被引量:2
11
作者 霍英 李小帆 +1 位作者 丘志敏 李彦廷 《软件工程》 2023年第4期28-32,共5页
在微博大数据环境下,文章以舆情数据采集、用户行为分析为应用背景,提出了一种爬虫数据采集系统的设计与实现方案。该方案主要采用的是聚焦爬虫和增量式爬虫相结合,同时基于内容评价的爬行策略,对用户给定的关键词进行搜索,并在其发生... 在微博大数据环境下,文章以舆情数据采集、用户行为分析为应用背景,提出了一种爬虫数据采集系统的设计与实现方案。该方案主要采用的是聚焦爬虫和增量式爬虫相结合,同时基于内容评价的爬行策略,对用户给定的关键词进行搜索,并在其发生变化时对相关内容进行更新,从而实现数据采集的及时性和有效性。通过实际数据采集效果来看,本方案单机日数据采集量约为88万条,实际应用中用户可根据需求自定义爬取数据的速度,也可通过增加分布式爬虫数量提升爬取数据量与速度。 展开更多
关键词 大数据 数据采集 网络爬虫
下载PDF
Python语言在网络爬虫与数据挖掘中的应用 被引量:3
12
作者 陆海鸿 《信息与电脑》 2023年第15期183-186,共4页
网络爬虫和数据挖掘是当今信息时代中重要的技术工具,在各行各业发挥着重要的作用。本论文将重点讨论Python语言在网络爬虫与数据挖掘应用中的优势和实践经验。首先,介绍Python语言的特点和优势,及其在网络爬虫和数据挖掘领域的应用广... 网络爬虫和数据挖掘是当今信息时代中重要的技术工具,在各行各业发挥着重要的作用。本论文将重点讨论Python语言在网络爬虫与数据挖掘应用中的优势和实践经验。首先,介绍Python语言的特点和优势,及其在网络爬虫和数据挖掘领域的应用广泛性。其次,详细探讨了Python语言在网络爬虫过程中的关键技术和常用工具,包括统一资源定位符(Uniform Resource Locator,URL)请求、数据解析、页面抓取和信息提取等方面。再次,重点展示了Python语言在数据挖掘领域的强大功能,包括数据预处理、特征选择、模型建立和结果评估等。最后,通过案例分析,验证了Python语言在网络爬虫与数据挖掘应用中的实际效果和效率提升。 展开更多
关键词 PYTHON语言 网络爬虫 数据挖掘 数据预处理 特征选择 模型建立
下载PDF
智能时代的网络舆情分析技术应用 被引量:1
13
作者 周洪斌 贾苏 许礼捷 《微型电脑应用》 2023年第12期66-68,共3页
网络舆情具有集中式、爆发式的特点,因此对网络舆情进行s及时有效的分析是当今社会治理必须面对的问题。智能技术的发展为网络舆情数据的高效收集、分析提供了全新的方式、方法。采用网络爬虫、中文分词以及文本情感分析技术,实现新闻... 网络舆情具有集中式、爆发式的特点,因此对网络舆情进行s及时有效的分析是当今社会治理必须面对的问题。智能技术的发展为网络舆情数据的高效收集、分析提供了全新的方式、方法。采用网络爬虫、中文分词以及文本情感分析技术,实现新闻评论的自动化采集、可视化分析,为网络舆情分析与引导提供帮助。 展开更多
关键词 网络舆情分析 网络爬虫 中文分词 文本情感分析
下载PDF
Python爬虫技术在高职计算机网络技术专业市场调研中的应用与实现
14
作者 罗卓君 徐宇星 《计算机应用文摘》 2023年第1期16-18,共3页
文章应用Python爬虫技术爬取51job招聘网站上的数据,并进行数据清洗和可视化处理,获得高职计算机网络技术专业相关岗位群在人数需求、薪资、学历三大方面的有效数据和直观图,解决了该专业市场调研数据不完整的问题,对撰写专业市场调研报... 文章应用Python爬虫技术爬取51job招聘网站上的数据,并进行数据清洗和可视化处理,获得高职计算机网络技术专业相关岗位群在人数需求、薪资、学历三大方面的有效数据和直观图,解决了该专业市场调研数据不完整的问题,对撰写专业市场调研报告,选择发展方向,制定人才培养方案有一定的参考价值。 展开更多
关键词 PYTHON 爬虫 高职计算机网络技术专业 市场调研
下载PDF
基于虚拟雷达和两级神经网络的割草机路径跟踪算法 被引量:3
15
作者 赵永春 张庆 +3 位作者 尤泳 黄韶炯 刘文 王德成 《农业机械学报》 EI CAS CSCD 北大核心 2023年第4期222-232,267,共12页
为提高果园内小型双电机驱动履带式割草机恶劣路面下路径跟踪精度,提出了一种基于虚拟雷达路径感知和两级深度神经网络的路径跟踪控制算法。首先搭建了两级串联的人工深度神经网络,一级深度神经网络通过虚拟雷达路径感知算法,计算得到... 为提高果园内小型双电机驱动履带式割草机恶劣路面下路径跟踪精度,提出了一种基于虚拟雷达路径感知和两级深度神经网络的路径跟踪控制算法。首先搭建了两级串联的人工深度神经网络,一级深度神经网络通过虚拟雷达路径感知算法,计算得到履带式割草机与目标路径的相对位置关系。二级深度神经网络根据履带式割草机跟踪偏差、航向角、横向偏差影响因子、折算履带滑转率以及履带式割草机与目标路径的相对位置关系,计算得到两侧驱动电机的控制转速,实现路径跟踪控制。在灌溉翻浆的果园路面,开展了履带式割草机U形路径跟踪实车试验,当车速分别为0.4、0.8 m/s时,该算法路径跟踪的最大横向偏差分别为0.064、0.072 m,平均横向偏差分别为0.026、0.033 m。与传统的纯追踪控制算法相比,最大横向偏差分别减小31.18%、20.88%,平均横向偏差减小35.00%、29.79%。基于虚拟雷达和两级深度神经网络的路径跟踪控制算法可有效提升履带式割草机在恶劣路面下的路径跟踪精度。 展开更多
关键词 履带式割草机 虚拟雷达 深度神经网络 路径跟踪
下载PDF
基于python的分布式网络反爬虫数据有序性研究 被引量:2
16
作者 朱镕申 孙川钘 潘虹 《计算机仿真》 北大核心 2023年第5期426-429,447,共5页
爬虫产生的负面影响导致网站无法正常访问、运行,故反爬虫技术应运而生,针对反爬虫数据存在的无序性问题,提出面向分布式网络反爬虫数据有序性研究,降低数据后续处理难度。基于python语言及其Scrapy结构,架构分步式网络反爬虫模型,采取... 爬虫产生的负面影响导致网站无法正常访问、运行,故反爬虫技术应运而生,针对反爬虫数据存在的无序性问题,提出面向分布式网络反爬虫数据有序性研究,降低数据后续处理难度。基于python语言及其Scrapy结构,架构分步式网络反爬虫模型,采取人为纠错、主成分分析线性降维以及数据转换等预处理手段,获取特征清晰的反爬虫数据集;根据反爬虫数据样本集与训练集的合并集,结合有向图,利用k最邻近分类算法划分反爬虫数据类别,针对分布式网络反爬虫数据的无序性,设计比特序列递推算法,赋予反爬虫数据有序性。仿真阶段中,经对比百度图片与反爬取到的图片顺序,验证所提方法的有效性,通过探索带宽环境对数据有序性的影响可知,其有序性不受带宽环境影响。 展开更多
关键词 分布式网络 反爬虫数据 有序性 分类算法
下载PDF
基于Honeyd的网络恶意软件漏洞动态检测系统 被引量:1
17
作者 王健 毕凯峰 《信息技术》 2023年第11期62-67,共6页
针对目前系统在对网络恶意软件漏洞进行检测时,存在拟合效果和检测效果差的问题,设计基于Honeyd的网络恶意软件漏洞动态检测系统,其系统硬件由网络爬虫、任务管理和相关检测三个模块组成,软件部分由基于Linux的Honeyd实现,通过生成的虚... 针对目前系统在对网络恶意软件漏洞进行检测时,存在拟合效果和检测效果差的问题,设计基于Honeyd的网络恶意软件漏洞动态检测系统,其系统硬件由网络爬虫、任务管理和相关检测三个模块组成,软件部分由基于Linux的Honeyd实现,通过生成的虚拟蜜罐接收全部恶意攻击,对攻击行为进行处理,完成网络恶意软件漏洞的动态检测。实验结果表明,所设计系统能够有效提高拟合效果和检测效果。 展开更多
关键词 HONEYD 网络恶意软件漏洞 动态检测系统 网络爬虫 特征引擎
下载PDF
基于Scrapy-redis的网站敏感信息监测系统设计与实现 被引量:3
18
作者 杨秉杰 薛钰 《无线互联科技》 2023年第11期84-87,共4页
近年来,全球互联网敏感信息泄露事件频发,严重影响了个人、企业和社会的安全和稳定。敏感信息泄露已经成为全球网络安全领域的一大难题,政府部门、企事业单位、个人都成了敏感信息泄露的受害者。敏感信息泄露对信息系统网络安全和个人... 近年来,全球互联网敏感信息泄露事件频发,严重影响了个人、企业和社会的安全和稳定。敏感信息泄露已经成为全球网络安全领域的一大难题,政府部门、企事业单位、个人都成了敏感信息泄露的受害者。敏感信息泄露对信息系统网络安全和个人隐私安全构成了严重威胁。为有效监测和预防敏感信息泄露事件发生,文章提出了一种基于Scrapy-redis的网站敏感信息监测系统设计方案,通过爬虫技术和监测规则主动发现可能存在的网站敏感信息泄露。通过测试实验,文章提出的系统满足性能要求和功能要求,系统具有一定得可扩展性,能够有效帮助单位或用户消除敏感信息泄漏风险。 展开更多
关键词 信息泄露 网络安全 网络爬虫
下载PDF
赌博网站自动识别技术研究 被引量:1
19
作者 杨哲 陈应虎 《信息安全研究》 CSCD 2023年第5期440-445,共6页
网络赌博存在严重的信息安全风险,有效发现判定赌博网站对维护国家金融稳定有着十分重要的意义.针对赌博网站发现困难的问题,提出一种赌博网站自动识别技术方案,该方案根据云平台的AS信息获取其拥有的IP网段,遍历IP反向解析域名后进行... 网络赌博存在严重的信息安全风险,有效发现判定赌博网站对维护国家金融稳定有着十分重要的意义.针对赌博网站发现困难的问题,提出一种赌博网站自动识别技术方案,该方案根据云平台的AS信息获取其拥有的IP网段,遍历IP反向解析域名后进行分布式爬取以获得网站截图.针对赌博网站判定困难的问题(例如有的赌博网站仅是一幅包含赌博APP下载链接的图片),方案利用dHash算法对正样本进行清洗,训练卷积神经网络(CNN)进行网站二分类.实验结果表明方案泛化能力较强、人工参与少,可在一定程度上解决赌博网站发现、识别方面存在的问题. 展开更多
关键词 网络赌博 卷积神经网络(CNN) dHash算法 分布式爬虫 云平台 自动识别
下载PDF
基于BERT的金融文本情感分析与应用 被引量:2
20
作者 季玉文 陈哲 《软件工程》 2023年第11期33-38,共6页
针对金融文本情感倾向模糊问题,设计了一种基于BERT(Bidirectional Encoder Representations from Transformers,基于Transformer的双向编码技术)和Bi-LSTM(Bidirectional Long Short-Term Memory Network,双向长短时记忆网络)的金融文... 针对金融文本情感倾向模糊问题,设计了一种基于BERT(Bidirectional Encoder Representations from Transformers,基于Transformer的双向编码技术)和Bi-LSTM(Bidirectional Long Short-Term Memory Network,双向长短时记忆网络)的金融文本情感分析模型,以BERT模型构建词向量,利用全词掩盖方法,能够更好地表达语义信息。为搭建金融文本数据集,提出一种基于深度学习模型的主题爬虫,利用BERT+Bi-GRU(双门控循环单元)判断网页内文本主题相关性,以文本分类结果计算网页的主题相关度。实验结果表明:本文所设计的情感分析模型在做情感分析任务时取得了87.1%的准确率,能有效分析文本情感倾向。 展开更多
关键词 情感分析 主题爬虫 长短时记忆网络 预训练语言模型
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部