-
题名随机森林改进算法在LBS用户社会关系推断中的应用
被引量:5
- 1
-
-
作者
马春来
单洪
马涛
史英春
-
机构
电子工程学院
通信信息控制和安全技术重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第12期2708-2712,共5页
-
基金
国防重点实验室基金项目(9140C130104)资助
-
文摘
根据LBS用户位置信息对用户社会关系进行推断,是基于位置大数据的情报挖掘领域中的一个新兴问题,可为群体发现及社团划分提供信息支撑.本文以时空共现理论为依据,对时空共现区的4类特征进行了选择、归纳及优化.针对随机森林难以对高维且含有冗余特征的数据进行分类的问题,提出一种基于特征空间分区采样策略的随机森林算法.该算法以Fisher比对特征的重要程度进行度量,并以此为依据对特征子空间分区,然后按比例进行采样,最后构造随机森林.这一改进有效避免了随机采样法构造特征子空间时容易引入噪声的问题.实验结果表明,相比于标准的随机森林算法,改进算法在对具有高维、冗余特征的数据分类中更为有效,更加适合应用于对LBS用户社会关系的推断.
-
关键词
基于位置的服务
时空共现
随机森林
分区采样
社会关系推断
-
Keywords
LBS
spatio-temporal co-occurrences
random forests
stratified sampling
social ties inferring
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于随机森林的LBS用户社会关系判断方法
被引量:8
- 2
-
-
作者
马春来
单洪
马涛
顾正海
-
机构
电子工程学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第12期218-222,共5页
-
基金
国防重点实验室基金资助
-
文摘
根据LBS用户位置信息对用户之间是否存在社会关系进行判断,是基于位置大数据的情报挖掘领域中的一个新兴问题,可为群体发现及社团划分提供信息支撑。以时空共现理论为依据,将时空共现区特征归纳为4类,提出了一种基于随机森林的用户社会关系判断方法。该方法包括特征选择和训练分类环节。首先,针对特征空间存在不相关和冗余特征而影响判断性能的问题,提出一种基于Fisher准则和χ2检验的特征选择算法,对无关、冗余特征进行剔除;然后采用随机森林进行分类判断,克服了现有方法训练速度慢、容易过拟合的问题。以LBSN用户Check-in数据为例进行的实验结果表明,该方法能够以较低的计算代价和较高的准确率实现社会关系的判断。
-
关键词
基于位置的服务
时空共现
随机森林
社会关系推断
-
Keywords
LBS, Spatio-temporal co-occurrences,Random forests, Social ties inferring
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-