期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于PU学习算法的虚假评论识别研究 被引量:30
1
作者 任亚峰 姬东鸿 +1 位作者 张红斌 尹兰 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期639-648,共10页
识别虚假评论有着重要的理论意义与现实价值.先前工作集中于启发式策略和传统的全监督学习算法.最近研究表明:人类无法通过先验知识有效识别虚假评论,手工标注的数据集必定存在一定数量的误例,因此简单使用传统的全监督学习算法识别虚... 识别虚假评论有着重要的理论意义与现实价值.先前工作集中于启发式策略和传统的全监督学习算法.最近研究表明:人类无法通过先验知识有效识别虚假评论,手工标注的数据集必定存在一定数量的误例,因此简单使用传统的全监督学习算法识别虚假评论并不合理.容易被错误标注的样例称为间谍样例,如何确定这些样例的类别标签将直接影响分类器的性能.基于少量的真实评论和大量的未标注评论,提出一种创新的PU(positive and unlabeled)学习框架来识别虚假评论.首先,从无标注数据集中识别出少量可信度较高的负例.其次,通过整合LDA(latent Dirichlet allocation)和K-means,分别计算出多个代表性的正例和负例.接着,基于狄利克雷过程混合模型(Dirichlet process mixture model,DPMM),对所有间谍样例进行聚类,混合种群性和个体性策略来确定间谍样例的类别标签.最后,多核学习算法被用来训练最终的分类器.数值实验证实了所提算法的有效性,超过当前的基准. 展开更多
关键词 虚假评论 全监督学习 PU学习 狄利克雷过程混合模型 多核学习
下载PDF
基于PUL算法及高分辨率WorldView影像的城市不透水面提取 被引量:6
2
作者 刘冉 李文楷 +2 位作者 刘小平 陈逸敏 刘珍环 《地理与地理信息科学》 CSCD 北大核心 2018年第1期40-46,130,共8页
准确提取城市不透水面对生态环境、水热循环及热岛效应等研究具有重要意义。该文利用WorldView高分辨遥感影像,提出基于PUL(Positive and Unlabeled Learning)算法的高分辨率影像城市不透水面提取方法,该方法不需要负样本数据,只需少量... 准确提取城市不透水面对生态环境、水热循环及热岛效应等研究具有重要意义。该文利用WorldView高分辨遥感影像,提出基于PUL(Positive and Unlabeled Learning)算法的高分辨率影像城市不透水面提取方法,该方法不需要负样本数据,只需少量的正样本和未标记样本即可训练分类模型。结果显示,PUL算法的提取结果优于一类支持向量机(OCSVM)以及最大熵(MAXENT)模型。使用不同正样本量时,PUL的提取结果总体精度和kappa系数均优于OCSVM和MAXENT,最高总体精度为91.27%,最高kappa系数可达0.8255,可快速、有效地从高分辨率遥感影像中提取不透水面。 展开更多
关键词 城市不透水面 positive and unlabeled Learning(PUL) 一类支持向量机(OCSVM) 最大熵(MAXENT)模型
下载PDF
机器学习在物联网虚假用户识别中的运用 被引量:12
3
作者 张溶芳 许丹丹 +2 位作者 王元光 潘思宇 李正茂 《电信科学》 2019年第7期136-144,共9页
随着通信技术的发展,物联网卡和5G技术将得到大规模应用,但存在个别企业利用物联网卡资费便宜、没有实名制等特点从中非法牟利、破坏社会稳定的问题,不利于行业健康发展。因此如何识别虚假用户成为物联网行业研究的重要课题。主要研究... 随着通信技术的发展,物联网卡和5G技术将得到大规模应用,但存在个别企业利用物联网卡资费便宜、没有实名制等特点从中非法牟利、破坏社会稳定的问题,不利于行业健康发展。因此如何识别虚假用户成为物联网行业研究的重要课题。主要研究了在实时海量的物联网终端数据中,如何运用机器学习模型高效地识别疑似虚假用户。具体来看,通过研究相关数据的特征,采用基于正样本和未标记样本的半监督式学习模型建立实时监控异常行为的模型,达到识别物联网行业中潜在虚假用户的目的。本研究成果体现在节约大量人力物力的同时,可以帮助相关部门、人员及时发现用户的异常行为,采取相应的措施避免产生较大损失,具有广泛的行业应用前景。 展开更多
关键词 物联网 半监督式学习模型 朴素贝叶斯分类器 随机森林 支持向量机 SPY分类器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部