期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
东盟涉华舆情识别及特征分布研究--以主流英汉媒体为分析对象
被引量:
1
1
作者
王连喜
向杰益
+2 位作者
黄锡轩
蒋盛益
赵瑞
《情报杂志》
CSSCI
北大核心
2022年第8期94-101,共8页
[研究目的]高效识别和挖掘海外媒体的涉华新闻舆情及其特征分布,对于我国全方位、多角度了解国际社会的对华关注点和国际舆情场变化具有重要意义。[研究方法]以“一带一路”倡议开局前五年的东盟主流英汉媒体新闻为分析对象,首先在确定...
[研究目的]高效识别和挖掘海外媒体的涉华新闻舆情及其特征分布,对于我国全方位、多角度了解国际社会的对华关注点和国际舆情场变化具有重要意义。[研究方法]以“一带一路”倡议开局前五年的东盟主流英汉媒体新闻为分析对象,首先在确定新闻媒体列表并进行定制化采集的基础上,通过人工标注形成英汉训练数据集,然后在标注语料上比较10种机器学习模型的性能,随后选择效果最佳的基于BERT的分类算法对采集的语料进行涉华识别,最后对涉华新闻进行定量统计和多角度的舆情分析。[研究结论]汉语媒体是东盟涉华舆情的主要阵地,英汉媒体的重点关注对象分别以政治类和经济类主题为主,但不同国家的对华关注点不尽相同且会产生变迁。
展开更多
关键词
网络舆情
涉华舆情
涉华媒体
涉华新闻识别
BERT
东盟
下载PDF
职称材料
面向跨境电商的网络抓取技术研究
被引量:
1
2
作者
南博成
向杰益
+3 位作者
沈晓红
李邱溢
潘君妮
张斌
《计算机时代》
2018年第8期13-16,共4页
网络爬虫已成为提高跨境电商数据化运营效率的一项热门技术。本文通过叙述商业爬虫软件采集商品页面信息的基本方法,论述了爬虫程序提取商品价格与评价信息的常用算法,分析了抓取Ajax生成的Json信息、实现动态翻页和应对网站的反对爬虫...
网络爬虫已成为提高跨境电商数据化运营效率的一项热门技术。本文通过叙述商业爬虫软件采集商品页面信息的基本方法,论述了爬虫程序提取商品价格与评价信息的常用算法,分析了抓取Ajax生成的Json信息、实现动态翻页和应对网站的反对爬虫的技术和方法。实践证明,由于电商平台反爬虫策略会动态调整,如何利用人工智能技术更好地模仿人类行为来实现有效的信息采集是跨境电商爬虫技术提升的要点。
展开更多
关键词
跨境电商
爬虫
AJAX
JSON
反爬虫
下载PDF
职称材料
题名
东盟涉华舆情识别及特征分布研究--以主流英汉媒体为分析对象
被引量:
1
1
作者
王连喜
向杰益
黄锡轩
蒋盛益
赵瑞
机构
广州市非通用语种智能处理重点实验室
广东外语外贸大学信息科学与技术学院
出处
《情报杂志》
CSSCI
北大核心
2022年第8期94-101,共8页
基金
国家社会科学基金青年项目“东盟涉华舆情的观点挖掘及信息聚合研究”(编号:17CTQ045)研究成果之一。
文摘
[研究目的]高效识别和挖掘海外媒体的涉华新闻舆情及其特征分布,对于我国全方位、多角度了解国际社会的对华关注点和国际舆情场变化具有重要意义。[研究方法]以“一带一路”倡议开局前五年的东盟主流英汉媒体新闻为分析对象,首先在确定新闻媒体列表并进行定制化采集的基础上,通过人工标注形成英汉训练数据集,然后在标注语料上比较10种机器学习模型的性能,随后选择效果最佳的基于BERT的分类算法对采集的语料进行涉华识别,最后对涉华新闻进行定量统计和多角度的舆情分析。[研究结论]汉语媒体是东盟涉华舆情的主要阵地,英汉媒体的重点关注对象分别以政治类和经济类主题为主,但不同国家的对华关注点不尽相同且会产生变迁。
关键词
网络舆情
涉华舆情
涉华媒体
涉华新闻识别
BERT
东盟
Keywords
network public opinion
China-related public opinion
China-related media
recognition of China-related news
BERT
ASEAN
分类号
G251 [文化科学—图书馆学]
G353 [文化科学—情报学]
下载PDF
职称材料
题名
面向跨境电商的网络抓取技术研究
被引量:
1
2
作者
南博成
向杰益
沈晓红
李邱溢
潘君妮
张斌
机构
浙江越秀外国语学院电子商务系
出处
《计算机时代》
2018年第8期13-16,共4页
基金
2017年国家级创业创新训练项目<面向跨境电商的网络抓取技术应用研究>(201712792015)
2016年度浙江越秀外国语学院国际商学院重点课题
文摘
网络爬虫已成为提高跨境电商数据化运营效率的一项热门技术。本文通过叙述商业爬虫软件采集商品页面信息的基本方法,论述了爬虫程序提取商品价格与评价信息的常用算法,分析了抓取Ajax生成的Json信息、实现动态翻页和应对网站的反对爬虫的技术和方法。实践证明,由于电商平台反爬虫策略会动态调整,如何利用人工智能技术更好地模仿人类行为来实现有效的信息采集是跨境电商爬虫技术提升的要点。
关键词
跨境电商
爬虫
AJAX
JSON
反爬虫
Keywords
cross border e-commerce
web crawler
Ajax
Json
anti-crawler
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
东盟涉华舆情识别及特征分布研究--以主流英汉媒体为分析对象
王连喜
向杰益
黄锡轩
蒋盛益
赵瑞
《情报杂志》
CSSCI
北大核心
2022
1
下载PDF
职称材料
2
面向跨境电商的网络抓取技术研究
南博成
向杰益
沈晓红
李邱溢
潘君妮
张斌
《计算机时代》
2018
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部