期刊文献+
共找到178篇文章
< 1 2 9 >
每页显示 20 50 100
基于UGC数据爬取的红树林文化服务感知要素
1
作者 魏书精 罗碧珍 +2 位作者 陈玉玲 刘素青 黄剑坚 《中国林业产业》 2024年第1期122-124,共3页
为了合理分析红树林文化服务感知要素,本文基于UGC数据爬取方法开展了研究,结果显示,公众主要感知到福田红树林自然保护区的审美与美学服务、精神满足及教育与知识获取等红树林生态系统文化服务,为红树林生态系统文化服务研究提供了新... 为了合理分析红树林文化服务感知要素,本文基于UGC数据爬取方法开展了研究,结果显示,公众主要感知到福田红树林自然保护区的审美与美学服务、精神满足及教育与知识获取等红树林生态系统文化服务,为红树林生态系统文化服务研究提供了新的参考。红树林文化服务一直是人们重点关注的领域之一。但是,涉及红树林文化服务感知要素目前并不清楚。UGC(User Generated Content)数据内容可以直接反映公众对红树林生态系统文化服务要素的感知情况。我们引入UGC数据挖掘研究方法,爬取福田红树林自然保护区相关网络评价文本,通过数据分析获取公众对红树林生态系统文化服务要素的感知情况。 展开更多
关键词 生态系统文化服务 网络评价 知识获 红树林 数据爬取 自然保护区 数据内容 数据分析
下载PDF
中小企业爬取数据的正当性及规制路径
2
作者 陈淑婷 《华南理工大学学报(社会科学版)》 2024年第4期100-110,共11页
围绕大型互联网平台企业生态圈生存发展的中小企业的数据利益应受到重视。对于中小企业而言,数据爬取是获取数据资源的重要方式。当前,尚无专门规制中小企业爬取数据行为的法律规范,法律缺位将导致数据爬取纠纷层出不穷,也增加司法裁判... 围绕大型互联网平台企业生态圈生存发展的中小企业的数据利益应受到重视。对于中小企业而言,数据爬取是获取数据资源的重要方式。当前,尚无专门规制中小企业爬取数据行为的法律规范,法律缺位将导致数据爬取纠纷层出不穷,也增加司法裁判的难度。因此,有必要对中小企业爬取数据行为进行正当合理的规制,促进数据的利用、共享,助力数字产业创新。中小企业爬取数据正当性不仅需要从私法权益保护路径论证,还需要从竞争法路径论证。中小企业爬取数据行为应遵循爬取的基本原则,并综合考量爬取目的、对象、方式及爬取造成的损害结果,把数据爬取行为限制在合理边界内。规范数据爬取行为的同时,建立数据合规制度、数据合理使用制度及数据信托制等,有利共同完善数据爬取的法律规制。 展开更多
关键词 中小企业数据权益 数据爬取 爬取边界 数据保护 利益衡量
下载PDF
共享视角下数据爬取行为刑法规制理念重塑与路径展开
3
作者 侯跃伟 《江苏社会科学》 北大核心 2024年第2期165-174,共10页
数据爬取行为在数据平台的发展中必不可少。刑法的过多介入导致数据垄断,阻碍了市场竞争,需要对过罪化的趋势加以纠正。在数据共享的视角下,数据不同于个人信息,控制者对其没有决定权,不能仅因为Robots协议或反爬虫措施就认定获取行为... 数据爬取行为在数据平台的发展中必不可少。刑法的过多介入导致数据垄断,阻碍了市场竞争,需要对过罪化的趋势加以纠正。在数据共享的视角下,数据不同于个人信息,控制者对其没有决定权,不能仅因为Robots协议或反爬虫措施就认定获取行为的非法性;亦不能无视数据爬取行为的特性,沿袭司法解释的规定使罪量限制形同无物,对此类行为的规制应由降维转向升维。数据爬取行为促进数据共享,符合社会公共利益。应以以下两点认定相关犯罪:利用刑法加以保护的数据必须具有保护价值,其所蕴含的利益必须受到爬取行为的侵犯进而导致法益的实质减损;坚守形式与实质的双重侧面,只有数据爬取行为同时符合形式判断和实质判断的要求才能成立犯罪。 展开更多
关键词 数据爬取 数据共享 数据垄断 数据法益 网络
下载PDF
竞争法视角下企业数据爬取行为合规研究
4
作者 周佳颖 吴道霞 《山西高等学校社会科学学报》 2024年第3期38-46,共9页
企业在市场竞争中扮演着数据的控制者和爬取者的双重角色。然而,从竞争法的视角来看,企业不当利用数据爬取技术可能引发不正当竞争和数据垄断问题。为了实现企业的可持续发展,必须重新定义大数据环境下企业的实质竞争关系;健全企业数据... 企业在市场竞争中扮演着数据的控制者和爬取者的双重角色。然而,从竞争法的视角来看,企业不当利用数据爬取技术可能引发不正当竞争和数据垄断问题。为了实现企业的可持续发展,必须重新定义大数据环境下企业的实质竞争关系;健全企业数据爬取的正当标准,即设立“善意爬虫”的三重标准,以确保数据爬取范围合法合规;完善企业数据开放义务,即结合企业经营类型,明确数据授权的必要性,改进反爬措施,实现数据的开放共享。只有正确应用数据爬取技术,将其作为推动企业发展的工具,企业才能获得长足的发展。 展开更多
关键词 数据爬取 合规要求 竞争关系 数据开放 信息保护
下载PDF
数据爬取不正当竞争认定的反思及路径重构
5
作者 丁稳 《东华理工大学学报(社会科学版)》 2024年第2期165-174,共10页
数据爬取是近些年才成熟的技术,其天然的技术中立性使得爬取行为亦具有竞争中性之属性。数据爬取以互联网为依托,而互联网领域跨界竞争乃为常态,这便对传统竞争关系认定理念造成冲击。同时,数字科技这一新兴领域的商业道德标准模糊,使... 数据爬取是近些年才成熟的技术,其天然的技术中立性使得爬取行为亦具有竞争中性之属性。数据爬取以互联网为依托,而互联网领域跨界竞争乃为常态,这便对传统竞争关系认定理念造成冲击。同时,数字科技这一新兴领域的商业道德标准模糊,使得正当性认定标准难以统一。司法裁判理念亦未完全革新,涌现出许多类案不同判的现象。基于此,应将“竞争关系”作实质性解读,即只要双方经营者之间的交易机会、竞争优势等存在此强彼弱的关联反应,便可以认定双方存在竞争关系。对于正当性认定,可将多元利益动态衡量作为基础框架,秉持谦抑干预理念,以比例原则作为主要进路,细化商业道德认定标准,分获取、使用两个阶段对行为正当性分别进行评判。只有统一司法认定标准,才能对不正当的数据爬取行为进行精准、有效规制。 展开更多
关键词 数据爬取 不正当竞争 利益衡量 比例原则 正当性认定
下载PDF
数据爬取行为刑事不法认定的应然转向
6
作者 智逸飞 《太原理工大学学报(社会科学版)》 2024年第1期1-11,53,共12页
滥用数据爬取技术有必要动用刑法加以规制,但司法实务及理论界的主要观点皆以爬取行为避开或突破技术保护措施作为判定刑事不法性的依据,导致刑法保护对象发生偏误,也抽空了数据犯罪的法益保护内容,抑制了数据公共价值的释放。以数据分... 滥用数据爬取技术有必要动用刑法加以规制,但司法实务及理论界的主要观点皆以爬取行为避开或突破技术保护措施作为判定刑事不法性的依据,导致刑法保护对象发生偏误,也抽空了数据犯罪的法益保护内容,抑制了数据公共价值的释放。以数据分类分级为基础建构数据安全法益,对数据爬取行为刑事不法的认定要以在客观上侵犯数据安全法益,主观上对行为方式与爬取数据的总量、数据表征的信息内容存在明知的事实上进行。数据爬取行为刑事不法性标准的重塑可作为《刑法》第285条第2款的“违反国家规定”与“情节严重”之间构建适格的构成要件行为的过渡,并可为非法获取数据行为确立值得刑法规制的罪质。 展开更多
关键词 数据爬取 数据安全法益 刑事不法性 非法获计算机信息系统数据罪
下载PDF
基于Selenium的课程评论自动爬取软件设计与实现
7
作者 刘志鹏 陈琦 +2 位作者 许超焕 梅灿 李逸雪 《电脑编程技巧与维护》 2024年第6期19-22,共4页
针对获取网络课程评论文本工作量大、课程评价不够直观的问题,设计了一种能够自动爬取课程评论并生成词云图的软件。该软件基于Selenium框架,使用Wordcloud、PySimpleGUI、OpenCV-Python等第三方库,以“中国大学MOOC”为例,实现了操作... 针对获取网络课程评论文本工作量大、课程评价不够直观的问题,设计了一种能够自动爬取课程评论并生成词云图的软件。该软件基于Selenium框架,使用Wordcloud、PySimpleGUI、OpenCV-Python等第三方库,以“中国大学MOOC”为例,实现了操作界面显示、MOOC课程评论自动爬取、词云图生成、定制词云图背景4项核心功能,课程评论与词云分别以文本、图片的格式保存在用户计算机中。经实践验证,该方案切实可行,对于从事在线学习、教育测量与评价研究的相关人员有一定帮助。 展开更多
关键词 Selenium框架 课程评论 自动爬取 词云
下载PDF
基于Python的招聘数据爬取与数据可视化分析研究
8
作者 郭瑾 《轻工科技》 2024年第2期94-96,99,共4页
随着高校毕业生人数的增加,大学生就业问题日益受到国家和社会的重视。目前的就业现状反映出,大学生对求职的岗位技能要求、学历要求及薪资水平等关键信息掌握不够全面,导致在求职过程中出现信息偏差。本文通过Python语言的标准库和丰... 随着高校毕业生人数的增加,大学生就业问题日益受到国家和社会的重视。目前的就业现状反映出,大学生对求职的岗位技能要求、学历要求及薪资水平等关键信息掌握不够全面,导致在求职过程中出现信息偏差。本文通过Python语言的标准库和丰富的第三方库requests、BeautifulSoup、pandas和jieba等,爬取主流招聘网站的招聘数据并对数据进行有效清洗和分析,最后通过matplotlib库对统计分析后的招聘数据进行可视化展示,以帮助求职者更好地了解就业的关键信息,为毕业生就业及后续的择业提供参考。 展开更多
关键词 数据爬取 数据分析 数据可视化
下载PDF
软件测试中大规模数据爬取和测试方法研究
9
作者 毛怡明 《电脑编程技巧与维护》 2024年第3期94-96,103,共4页
大规模数据测试已成为现代软件开发领域不可或缺的一部分。研究强调了数据爬取技术的关键作用,以获取大规模数据用于测试。首先,选择合适的数据源,然后开发或配置数据爬取工具,以有效地收集数据,最后,进行数据清洗和预处理,包括:去噪、... 大规模数据测试已成为现代软件开发领域不可或缺的一部分。研究强调了数据爬取技术的关键作用,以获取大规模数据用于测试。首先,选择合适的数据源,然后开发或配置数据爬取工具,以有效地收集数据,最后,进行数据清洗和预处理,包括:去噪、数据格式化和标准化,以确保测试数据的质量和一致性。测试数据生成是测试的关键组成部分,可通过随机选择样本或数据驱动方法生成测试用例。在性能测试方面,负载测试和性能分析辅助评估软件在大规模数据集下的性能。安全性测试涵盖恶意数据攻击模拟和漏洞扫描,以确保应用程序的安全性。综合而言,大规模数据测试策略必须综合考虑性能、正确性和安全性,以确保软件在应对大规模数据时的稳定性和可靠性。 展开更多
关键词 大规模数据测试 数据爬取 测试数据生成 性能测试
下载PDF
数据权属的界定——以企业间数据爬取为例
10
作者 李泽 雷菲萍 《知与行》 2023年第5期76-84,共9页
企业间的数据爬取纠纷喷涌而出,相关的司法实践频频引发争议。关于数据权益的保护与分配,有数据赋权模式和行为规制两条进路,前者意在建立具有排他性的数据财产权,后者在合同法、反不正当竞争法、刑法与行政法等现行法律制度之上对行为... 企业间的数据爬取纠纷喷涌而出,相关的司法实践频频引发争议。关于数据权益的保护与分配,有数据赋权模式和行为规制两条进路,前者意在建立具有排他性的数据财产权,后者在合同法、反不正当竞争法、刑法与行政法等现行法律制度之上对行为进行场景化与类型化的正当性判断。数据赋权和行为规制可以在霍菲尔德权利关系理论之下得到统合,此时数据的保护不依赖事先预设的权利类型,而是依个案确定,但是所有规则的设计仍然限于霍菲尔德的权利框架和权力框架,从而能够为数据纠纷提供清晰、稳定的指引,又能将利益衡量的要素填充进权利框架中。企业数据爬取的主体间法律关系需要建立在用户、数据爬取者和数据被爬取者的综合利益衡量上,爬取行为的合法性和正当性判断需要考虑爬取目的、数据使用方式、数据的分级分类、主体的意愿等,但这些因素的价值位阶考量仍然需要建立在一个更为广泛的共识之上。在主体意愿这一要素下展开对主体间法律关系的描述,可以清楚地看到霍菲尔德理论在数据权属界定上的创生性和解释力,叠加其他因素所建构起来的互动关系可以是随机拆解的多次法律关系再组合,这有助于最终形成错综复杂但边界清晰的权利网络。 展开更多
关键词 数据爬取 数据确权 数据权益 霍菲尔德
下载PDF
数据爬取的不正当竞争认定规则研究 被引量:11
11
作者 周樨平 《南大法学》 2023年第2期87-102,共16页
平台对平台内数据享有什么权益是判断数据爬取行为正当性的前提问题。平台对不同形态的数据投入的劳动和资金具有显著的不同,应进行分类保护。用户直接生成展示在网页上的数据,具有原始性和公开性的特征,应采用竞争性权益的保护方式;而... 平台对平台内数据享有什么权益是判断数据爬取行为正当性的前提问题。平台对不同形态的数据投入的劳动和资金具有显著的不同,应进行分类保护。用户直接生成展示在网页上的数据,具有原始性和公开性的特征,应采用竞争性权益的保护方式;而平台进行适度处理可供商业化利用并采用密码等保护措施仅向特定人提供的数据,可采用财产性权益的保护路径,对数据爬取不正当竞争行为的认定应由此而展开。司法实践中形成的“三重授权”规则是财产性权益的保护方式,而“实质性替代”和“破坏性利用”规则是竞争性权益的保护方式,我国在构建数据不正当竞争的法律规则时,应总结司法经验并对其进行优化和完善。 展开更多
关键词 数据爬取 不正当竞争 数据权益
下载PDF
基于Python的网页信息爬取技术分析 被引量:1
12
作者 蔡迪阳 《科技资讯》 2023年第13期31-34,共4页
基于大规模数据下载的需求,针对以往人工下载数据过程中存在的影响效率的问题,结合Python语言提出一种能够用于网页信息数据爬取的技术,用于减少数据下载前期的繁琐工作,提高网络信息系统和技术的开发效率。该文以网页信息爬取技术为主... 基于大规模数据下载的需求,针对以往人工下载数据过程中存在的影响效率的问题,结合Python语言提出一种能够用于网页信息数据爬取的技术,用于减少数据下载前期的繁琐工作,提高网络信息系统和技术的开发效率。该文以网页信息爬取技术为主要研究对象,基于现代化信息数据的应用和发展需求,着重对融合了Python语言的网页信息爬取技术进行研究和分析。 展开更多
关键词 爬取技术 网页信息 PYTHON 技术分析
下载PDF
论企业间数据爬取及其行为边界 被引量:1
13
作者 黎晋宇 《宜宾学院学报》 2023年第9期41-51,共11页
互联网时代,数据爬取纠纷层出不穷,对于数据应当共享还是控制,国内外判例和学说观点莫衷一是。跳出界定数据权利和权属争论的窠臼,从行为规制的角度看,在不侵害国家安全、个人隐私、商业秘密等其他法益,且不会造成消费者误认和被爬取的... 互联网时代,数据爬取纠纷层出不穷,对于数据应当共享还是控制,国内外判例和学说观点莫衷一是。跳出界定数据权利和权属争论的窠臼,从行为规制的角度看,在不侵害国家安全、个人隐私、商业秘密等其他法益,且不会造成消费者误认和被爬取的企业经营困难的情况下,企业间的数据爬取以及反爬取行为不应该被认定为不正当竞争。这样的边界划定有利于企业经营者间的竞争,有利于消费者的选择,也符合社会公共利益。 展开更多
关键词 企业数据 数据爬取 不正当竞争 竞争关系 Robots协议
下载PDF
企业间数据爬取行为的竞争法规制逻辑与完善路径
14
作者 王小源 姚万勤 《长江论坛》 2023年第5期68-78,共11页
作为互联网世界中数据流通的主要路径之一,企业间数据爬取行为无法通过行业自发建构的Robots协议与爬虫识别技术得到充分规制。由于数据权属问题的模糊性,故基于传统民商法权利体系对企业数据权益进行事前定性、明确爬取行为合法性边界... 作为互联网世界中数据流通的主要路径之一,企业间数据爬取行为无法通过行业自发建构的Robots协议与爬虫识别技术得到充分规制。由于数据权属问题的模糊性,故基于传统民商法权利体系对企业数据权益进行事前定性、明确爬取行为合法性边界的进路亦受到阻碍。《反不正当竞争法》作为行为法,力图消解数据权属这一规范难题,跳出“确权→侵权”之传统民事权利保护的桎梏,转而聚焦于个案场景下数据流通的公共利益与企业数据利益保护之间的价值衡量,而这恰与数据作为新型生产要素所蕴藏的价值多重性形成呼应,故理应成为爬取行为合法性判断的实定法依据。从实证研究可以发现:法院多援引该法第2条原则性规定进行裁判的审理理路,蕴藏着不当扩大不正当竞争认定范围的规范风险。为实质激活该法第12条“网络不正当竞争”规定的适用,应推动以司法解释形式对企业数据抓取的合法性边界进行明确,为打破数据壁垒、促进经济社会的数字化转型提供有效的规范支撑。 展开更多
关键词 网络 价值衡量 数据保护 反不正当竞争法 数据爬取
下载PDF
数据爬取行为的司法治理:裁判模式、治理困境与完善路径——基于《反不正当竞争法》第二条的分析 被引量:1
15
作者 宋佳宁 母紫薇 《贵州省党校学报》 2023年第3期118-128,共11页
数据爬取行为是大数据时代下的产物,主要通过网络爬虫技术获取数据资源,它为市场经营者提供便利的同时也存在违法的可能性。反不正当竞争法视角下对数据爬取行为的司法治理因法律规制的空缺陷入多重困境,本文通过对案例的分析阐明司法... 数据爬取行为是大数据时代下的产物,主要通过网络爬虫技术获取数据资源,它为市场经营者提供便利的同时也存在违法的可能性。反不正当竞争法视角下对数据爬取行为的司法治理因法律规制的空缺陷入多重困境,本文通过对案例的分析阐明司法实践中所面临的认定数据爬取行为的标准不明晰、不正当竞争行为的性质分析不全面、司法裁判思路单一等问题,以数据爬取行为不正当性为切入点,结合《反不正当竞争法》第二条,提出细化数据爬取行为的认定标准、全面分析不正当竞争行为的构成要件、优化司法裁判思路等有针对性的解决途径。 展开更多
关键词 数据爬取 反不正当竞争法 司法实践
下载PDF
论数据爬取行为的合法性边界
16
作者 谭昱琪 李佩姿 董旭 《争议解决》 2023年第5期2031-2038,共8页
目前数据爬取行为在我国存在立法规制阙如、司法认定混乱等问题。从司法实践出发,数据爬取行为包括爬取数据和使用数据两种类型。其中爬取数据的行为又包括破坏被爬方信息系统与未经许可擅自爬取两类。为保证数据爬取行为的合法性,爬取... 目前数据爬取行为在我国存在立法规制阙如、司法认定混乱等问题。从司法实践出发,数据爬取行为包括爬取数据和使用数据两种类型。其中爬取数据的行为又包括破坏被爬方信息系统与未经许可擅自爬取两类。为保证数据爬取行为的合法性,爬取方在爬取数据时应认清爬取的对象,避免突破合约授权与技术措施。而在使用数据时应识别数据内容、评估使用后果,准确识别数据类型,包括个人信息、著作权内容以及权利属性不明的公开数据等,判断是否违反前置条件,从而合理设计爬取行为,指引该技术在法治轨道稳步发展,促进数据的高效流通。 展开更多
关键词 数据爬取 数据使用 合法性边界
下载PDF
《反不正当竞争法》一般条款在企业数据爬取行为中的适用
17
作者 陈墨超 《法学(汉斯)》 2023年第6期5006-5013,共8页
企业数据中包含有不同的信息,有些可以通过《民法典》、《个人信息保护法》、《反不正当竞争法》、《刑法》的相关规定进行规制,而有些企业数据并不满足个人信息、商业秘密、专利权、著作权的相关特征,无法在上述法律中找到针对性的适... 企业数据中包含有不同的信息,有些可以通过《民法典》、《个人信息保护法》、《反不正当竞争法》、《刑法》的相关规定进行规制,而有些企业数据并不满足个人信息、商业秘密、专利权、著作权的相关特征,无法在上述法律中找到针对性的适用条款。企业数据爬取行为一方面可以促进数据价值的发挥,另一方面也常常会引发数据主体企业与数据爬取者之间的矛盾。在现有司法实践中,大多是通过《反不正当竞争法》的一般条款来进行规制。一般条款的模糊性使其具有较广的适用范围,但是也因其模糊性,造成司法实践过程中,法官因缺乏明确标准而获得过高的自由裁量权,不论对于数据主体企业权利的保护还是数据流通价值的发挥,都可能具有不同程度的伤害。因此,本文通过对《反不正当竞争法》一般条款相关司法案例的分析,探讨该条款在适用中存在的问题,进而提出完善建议。 展开更多
关键词 企业数据 爬取行为 《反不正当竞争法》一般条款
下载PDF
基于Python的招聘网站数据爬取与分析
18
作者 高凤毅 葛苏慧 +2 位作者 林喜文 任红霞 魏秋怡 《电脑编程技巧与维护》 2023年第9期70-72,共3页
随着高校毕业生人数逐渐增加,从众多招聘信息中准确分析出有用信息,整体了解某个岗位在某个城市当前的就业情况,对于高校毕业生客观了解社会需求具有重要的价值。通过爬取某招聘网站中“爬虫工程师”这一岗位的信息,展示了爬取不同城市... 随着高校毕业生人数逐渐增加,从众多招聘信息中准确分析出有用信息,整体了解某个岗位在某个城市当前的就业情况,对于高校毕业生客观了解社会需求具有重要的价值。通过爬取某招聘网站中“爬虫工程师”这一岗位的信息,展示了爬取不同城市这一岗位信息的过程,对爬取到的岗位信息进行数据规范处理,按城市、学历要求等因素,分别对处理后的数据进行可视化呈现,并对可视化结果进行分析,帮助毕业生了解当前某个岗位对学历的要求,以及不同城市的岗位数量等。 展开更多
关键词 数据 爬取 分析 招聘信息 可视化
下载PDF
基于混沌序列的网页信息关键词爬取方法优化
19
作者 王晓宇 王培 《信息与电脑》 2023年第23期69-71,共3页
常规的网页信息关键词爬取方法通过提取网页信息的统一资源定位器(Uniform Resource Locator,URL)来获得网页信息,提取关键词局限于文本字段,导致爬取准确率较低。对此,提出基于混沌序列的网页信息关键词爬取方法。首先,分析信息爬取流... 常规的网页信息关键词爬取方法通过提取网页信息的统一资源定位器(Uniform Resource Locator,URL)来获得网页信息,提取关键词局限于文本字段,导致爬取准确率较低。对此,提出基于混沌序列的网页信息关键词爬取方法。首先,分析信息爬取流程,提取更加详细的全部信息;其次,根据提取原理的不同,划分网页信息提取板块;最后,分析网页信息混沌序列,提取所需网页信息关键词。实验结果表明,采用所提方法时,爬取准确率约为96.8%,相比传统方法提高了6.92%,相对来说,具有较高的准确性。 展开更多
关键词 PYTHON 网页信息 信息爬取 关键词提炼
下载PDF
基于Python Scrapy爬取技术、朴素贝叶斯算法的网页链接及文本抓取研究
20
作者 崔馨月 《长江信息通信》 2023年第12期77-79,共3页
针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据... 针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据字符转码、数据对象添加,使用朴素贝叶斯算法对中文语料库内涉及的文本词汇信息、图像信息,作出高效词图扫描、词频特征提取,使用贝叶斯评估模式完成网络新闻数据评论、舆论导向的输出情绪分析,整合为采集数据分析表格,以便于网络自然语言的自动化识别、过滤、提取与存储。 展开更多
关键词 人工智能 自然语言处理 图文识别与爬取 技术研究
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部