期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于新浪微博的冰雹实况信息提取方法和实用性研究
被引量:
1
1
作者
张永瑞
张岳军
+1 位作者
田瑞敏
王林
《科技与创新》
2020年第23期18-19,22,共3页
通过网络爬虫提取新浪微博的冰雹信息,比较文档频率(DF)、词频-逆向文件频率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方检验(CHI)、类间词频方差(DAC)在SVM支持向量机、NB朴素贝叶斯分类器、KNN K近邻分类器、DT决策树以及Google公司BER...
通过网络爬虫提取新浪微博的冰雹信息,比较文档频率(DF)、词频-逆向文件频率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方检验(CHI)、类间词频方差(DAC)在SVM支持向量机、NB朴素贝叶斯分类器、KNN K近邻分类器、DT决策树以及Google公司BERT模型分类器的训练测试结果,发现互信息(MI)函数分类排序在朴素贝叶斯(NB)分类器训练的模型在对冰雹降雹事件识别准确率较高,制定了冰雹实况提取规则,并提取出冰雹的时间、地点、大小,与山西109个气象台站2010-02—2020-12的观测资料对比,通过微博提取的冰雹实况信息虽然不能替代气象台站的工作,但是有一定参考性。
展开更多
关键词
网络爬虫
冰雹
实况
文本分类
实况提取
下载PDF
职称材料
题名
基于新浪微博的冰雹实况信息提取方法和实用性研究
被引量:
1
1
作者
张永瑞
张岳军
田瑞敏
王林
机构
山西省气象灾害防御技术中心
山西省气象科学研究所
出处
《科技与创新》
2020年第23期18-19,22,共3页
基金
山西省气象局科学技术青年课题(编号:SXKQNTC20195648)资助。
文摘
通过网络爬虫提取新浪微博的冰雹信息,比较文档频率(DF)、词频-逆向文件频率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方检验(CHI)、类间词频方差(DAC)在SVM支持向量机、NB朴素贝叶斯分类器、KNN K近邻分类器、DT决策树以及Google公司BERT模型分类器的训练测试结果,发现互信息(MI)函数分类排序在朴素贝叶斯(NB)分类器训练的模型在对冰雹降雹事件识别准确率较高,制定了冰雹实况提取规则,并提取出冰雹的时间、地点、大小,与山西109个气象台站2010-02—2020-12的观测资料对比,通过微博提取的冰雹实况信息虽然不能替代气象台站的工作,但是有一定参考性。
关键词
网络爬虫
冰雹
实况
文本分类
实况提取
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于新浪微博的冰雹实况信息提取方法和实用性研究
张永瑞
张岳军
田瑞敏
王林
《科技与创新》
2020
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部