期刊文献+

基于Python爬虫技术的PDF文件提取与定位系统研究

下载PDF
导出
摘要 PDF文件是大多数信息的标准化载体文件,而相对高效、准确率高的PDF文件批量获取与内容爬取的技术尚欠缺,并且缺乏PDF文件提取与关键词定位等功能有效集成的系统。为此,致力于研究通过Python语言中爬虫技术爬取PDF文件内容的核心方法,分析PDF文件提取的研究背景与意义、国内外研究现状、研究内容和系统构建对策等,探讨基于Python爬虫技术的PDF文件提取与定位系统的构建。
出处 《通讯世界》 2022年第11期193-195,共3页 Telecom World
基金 江苏省大学生创新创业训练计划创新训练省级重点项目“基于Python的PDF文件目标内容爬取技术研究”(202212213037Z)。
  • 相关文献

参考文献9

二级参考文献75

共引文献60

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部