期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于逻辑回归的微博用户可信度建模 被引量:8
1
作者 徐建民 粟武林 +1 位作者 吴树芳 武晓波 《计算机工程与设计》 北大核心 2015年第3期772-777,共6页
针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模... 针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模型能够对传统的虚假用户"僵尸粉"进行识别,对新型虚假用户有较高的识别率,可以根据置信值的大小对用户进行大致分类,实用性较强。 展开更多
关键词 微博 逻辑回归 可信度 虚假用户 僵尸粉
下载PDF
基于WB-MMSB模型的微博网络社区发现 被引量:1
2
作者 徐建民 武晓波 +1 位作者 吴树芳 粟武林 《计算机科学》 CSCD 北大核心 2015年第3期65-70,共6页
提出了一个用于微博网络社区发现的模型WB-MMSB,该模型考虑了微博网络中节点存在的单向关系,节点的社区隶属度从链入主题隶属度和链出主题隶属度两个方面表示。用指数族分布和平均场变分推理方法推导了模型中各变量的表示,并用SVI算法... 提出了一个用于微博网络社区发现的模型WB-MMSB,该模型考虑了微博网络中节点存在的单向关系,节点的社区隶属度从链入主题隶属度和链出主题隶属度两个方面表示。用指数族分布和平均场变分推理方法推导了模型中各变量的表示,并用SVI算法计算模型涉及的参数。实验在新浪微博数据集上进行,采用归一化互信息和困惑度进行评估,结果表明,WB-MMSB模型的社区发现能力优于aMMSB模型,并且其收敛速度快于aMMSB模型。 展开更多
关键词 微博网络 社区发现 混合隶属度随机块模型 重叠社区
下载PDF
一种基于词义降维的主题特征选择算法 被引量:1
3
作者 肖雷 王旭 粟武林 《计算机应用与软件》 CSCD 2016年第3期244-247,263,共5页
在文本特征选择中,由于词语概率空间和词义概率空间的差异,完全基于词语概率的主题特征往往不能很好地表达文章的思想,也不利于文本的分类。为达到主题特征更能反映文章思想这一目的,提取出一种基于词义降维的主题特征选择算法。该算法... 在文本特征选择中,由于词语概率空间和词义概率空间的差异,完全基于词语概率的主题特征往往不能很好地表达文章的思想,也不利于文本的分类。为达到主题特征更能反映文章思想这一目的,提取出一种基于词义降维的主题特征选择算法。该算法通过在词林基础上构建"同义词表",作为词到词义的映射矩阵,构造一个基于词义之上的概率分布,通过LDA提取文本特征用于分类,分类准确率得到了明显提高。实验表明,基于此种方法所建立的主题模型将有更强的主题表示维度,通过该算法基本解决文本特征提取中词语概率和词义概率之间差异的问题。 展开更多
关键词 LDA 主题模型 主题表示维度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部