期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Python Scrapy爬取技术、朴素贝叶斯算法的网页链接及文本抓取研究
1
作者 崔馨月 《长江信息通信》 2023年第12期77-79,共3页
针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据... 针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据字符转码、数据对象添加,使用朴素贝叶斯算法对中文语料库内涉及的文本词汇信息、图像信息,作出高效词图扫描、词频特征提取,使用贝叶斯评估模式完成网络新闻数据评论、舆论导向的输出情绪分析,整合为采集数据分析表格,以便于网络自然语言的自动化识别、过滤、提取与存储。 展开更多
关键词 人工智能 自然语言处理 图文识别与爬取 技术研究
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部