为了精准地获取微博领域权威性用户排序列表,在现有研究成果的基础上以新浪微博为研究对象,手动构建领域词典,面向微博领域提出了领域微博权威性用户度量模型(domains-microblog authoritative user ranking model,DMAURank)。该模型使...为了精准地获取微博领域权威性用户排序列表,在现有研究成果的基础上以新浪微博为研究对象,手动构建领域词典,面向微博领域提出了领域微博权威性用户度量模型(domains-microblog authoritative user ranking model,DMAURank)。该模型使用基于PageRank与用户行为权值相结合的评价方法。将实验结果与用户平均转发数排名和粉丝数排名进行对比,发现基于PageRank与用户行为权值相结合的用户被关注度有效降低了粉丝数目的过大影响。展开更多
针对微博用户兴趣属性缺失问题,提出一种基于发文内容分析的微博用户兴趣挖掘方法。利用基于短语的主题模型和自动构建的用户兴趣知识库,能够有效地从发文内容中挖掘出高质量的用户兴趣短语并标志其类别,从而实现对微博用户的兴趣挖掘。...针对微博用户兴趣属性缺失问题,提出一种基于发文内容分析的微博用户兴趣挖掘方法。利用基于短语的主题模型和自动构建的用户兴趣知识库,能够有效地从发文内容中挖掘出高质量的用户兴趣短语并标志其类别,从而实现对微博用户的兴趣挖掘。在SMP CUP 2016数据集上的实验结果表明,主题短语模型在困惑度和短语质量上取得的效果均优于传统的主题模型,用户兴趣挖掘的准确率和召回率最高可达到78%和82%。展开更多
文摘为了精准地获取微博领域权威性用户排序列表,在现有研究成果的基础上以新浪微博为研究对象,手动构建领域词典,面向微博领域提出了领域微博权威性用户度量模型(domains-microblog authoritative user ranking model,DMAURank)。该模型使用基于PageRank与用户行为权值相结合的评价方法。将实验结果与用户平均转发数排名和粉丝数排名进行对比,发现基于PageRank与用户行为权值相结合的用户被关注度有效降低了粉丝数目的过大影响。
文摘针对微博用户兴趣属性缺失问题,提出一种基于发文内容分析的微博用户兴趣挖掘方法。利用基于短语的主题模型和自动构建的用户兴趣知识库,能够有效地从发文内容中挖掘出高质量的用户兴趣短语并标志其类别,从而实现对微博用户的兴趣挖掘。在SMP CUP 2016数据集上的实验结果表明,主题短语模型在困惑度和短语质量上取得的效果均优于传统的主题模型,用户兴趣挖掘的准确率和召回率最高可达到78%和82%。