期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Python Scrapy爬取技术、朴素贝叶斯算法的网页链接及文本抓取研究
1
作者
崔馨月
《长江信息通信》
2023年第12期77-79,共3页
针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据...
针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据字符转码、数据对象添加,使用朴素贝叶斯算法对中文语料库内涉及的文本词汇信息、图像信息,作出高效词图扫描、词频特征提取,使用贝叶斯评估模式完成网络新闻数据评论、舆论导向的输出情绪分析,整合为采集数据分析表格,以便于网络自然语言的自动化识别、过滤、提取与存储。
展开更多
关键词
人工智能
自然语言处理
图文识别与爬取
技术研究
下载PDF
职称材料
题名
基于Python Scrapy爬取技术、朴素贝叶斯算法的网页链接及文本抓取研究
1
作者
崔馨月
机构
山西金融职业学院
出处
《长江信息通信》
2023年第12期77-79,共3页
文摘
针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据字符转码、数据对象添加,使用朴素贝叶斯算法对中文语料库内涉及的文本词汇信息、图像信息,作出高效词图扫描、词频特征提取,使用贝叶斯评估模式完成网络新闻数据评论、舆论导向的输出情绪分析,整合为采集数据分析表格,以便于网络自然语言的自动化识别、过滤、提取与存储。
关键词
人工智能
自然语言处理
图文识别与爬取
技术研究
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Python Scrapy爬取技术、朴素贝叶斯算法的网页链接及文本抓取研究
崔馨月
《长江信息通信》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部