-
题名融合时间序列与多尺度特征的虚假评论识别方法
被引量:3
- 1
-
-
作者
狄瑞彤
王红
房有丽
-
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
山东师范大学生命科学学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期278-285,292,共9页
-
基金
国家自然科学基金(61672329
61373149)
山东省教育科学规划项目(ZK1437B010)
-
文摘
结合时间序列与多尺度特征,提出一种改进的虚假评论识别方法。考虑时间因素对评分及其分布的影响,构建基于多维时间序列的虚假评论识别模型提取异常评论特征,并对异常评论特征进行层次划分,根据多尺度特征思想获取基准尺度特征及细分尺度特征。采用基于密度峰值的聚类算法识别虚假评论,并提高虚假评论识别模型的抗噪能力。实验结果表明,与基于基准尺度特征和多尺度特征的密度峰值聚类虚假评论识别方法相比,该方法的AUC值达到92%,虚假评论识别正确率更高。
-
关键词
虚假评论
时间序列
多尺度
主成分分析
聚类
-
Keywords
fake review
time series
multi-scale
Principal Component Analysis(PCA)
clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名济宁市能见度变化特征及影响因素分析
被引量:1
- 2
-
-
作者
狄瑞彤
王希凯
孟宪栋
赵京峰
侯红运
-
机构
济宁市气象局
-
出处
《河南科技》
2022年第16期109-112,共4页
-
基金
济宁市气象局科学技术研究项目(2022JNZL07)。
-
文摘
本研究利用2016—2021年济宁市地面观测资料和空气质量数据资料,对数据进行预处理后,利用统计分析方法,研究济宁市能见度的日变化和年变化特征与气象因子、大气污染物之间的相关性,以及与24 h能见度滞后项之间的相关性。结果表明,一天中,能见度的最低值出现在6时至8时之间,最高值出现在15时至18时之间,能见度呈现先下降后上升再下降的趋势;6年来济宁市能见度呈现明显上升趋势,且低能见度天气减少;在气象因素中,相对湿度与能见度相关性最大,且呈负相关,在大气污染物中,CO浓度与能见度相关性最大,且呈负相关,在24 h滞后项中,与24 h、25 h、26 h、27 h和28 h能见度滞后项相关性较大。
-
关键词
能见度
Pearson相关系数
气象因素
大气污染物
-
Keywords
visibility
Pearson correlation coefficient
meteorological factors
atmospheric pollutant
-
分类号
P427.2
[天文地球—大气科学及气象学]
X513
[环境科学与工程—环境工程]
-
-
题名多源特征融合的能见度预测方法研究
- 3
-
-
作者
狄瑞彤
王希凯
孟宪栋
赵京峰
侯红运
-
机构
山东省济宁市气象局
-
出处
《中国新技术新产品》
2022年第11期13-16,共4页
-
文摘
为了提高能见度预测的准确性,该文提出了基于逐步回归和有序逻辑回归的能见度预测模型。首先,基于气象要素数据、环境因子数据以及24 h滞后项能见度数据构建了多源数据融合的数据集。其次,利用逐步回归方法对获取的气象因子、环境因子以及24 h滞后项数据进行特征提取,构建多源特征融合的数据集。最后,构建基于有序逻辑回归的能见度预测模型,利用累积概率函数得到每个样本隶属于每个等级的概率。通过在有序逻辑回归模型上预测不同类别特征,把构建模型与多项逻辑回归、线性回归模型进行对比,从而验证了该文构建的多源特征融合数据集的有效性以及所构建模型的有效性。
-
关键词
多源特征融合
逐步回归
有序逻辑回归
能见度预测
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名COPD多维特征提取与集成诊断方法
被引量:5
- 4
-
-
作者
房有丽
王红
狄瑞彤
王露潼
宋永强
-
机构
山东师范大学信息科学与工程学院
山东师范大学生命科学学院
山东省分布式计算软件新技术重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第10期2925-2929,共5页
-
基金
国家自然科学基金资助项目(61672329,61373149,61472233,61572300,81273704)
山东省科技计划资助项目(2014GGX101026)
+2 种基金
山东省教育科学规划资助项目(ZK1437B010)
山东省泰山学者基金资助项目(TSHW201502038,20110819)
山东省精品课程资助项目(2012BK294,2013BK399,2013BK402)
-
文摘
目前对慢性阻塞性肺疾病(COPD)的研究存在局限性,一方面,研究成果只利用数据分析单一特征对疾病的影响;另一方面,研究成果仅通过简单算法模型对病例数据验证,因此提出了COPD多维特征提取与集成诊断方法。首先,提出最大依赖度MDF-RS算法,提取多维特征的最优组合;其次,提出DSA-SVM集成模型,构建分类器进行诊断及预测;最后,利用交叉验证方法验证准确率等各项性能指标。通过实验对比验证了提出算法的有效性。
-
关键词
慢性阻塞性肺疾病
多维特征
集成方法
交叉验证
-
Keywords
COPD(chronic obstructive pulmonary disease)
multidimensional features
integration method
cross validation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名鲁西南地区低能见度天气特征分析及对农业的影响
- 5
-
-
作者
狄瑞彤
-
机构
济宁市气象局
-
出处
《农村科学实验》
2022年第17期246-248,共3页
-
文摘
利用2016-2021年鲁西南地区三个国家气象观测站的气象资料,利用统计分析的方法,研究了鲁西南地区低能见度天气的时间分布特征和不同级别低能见度天气的时间分布特征,并且分析了相对湿度、风速等气象要素与低能见度天气之间的相关性及其低能见度天气对农业的影响。
-
关键词
低能见度
时间变化特征
相关性分析
-
分类号
X51
[环境科学与工程—环境工程]
-