期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
异构社交网络用户兴趣挖掘方法 被引量:4
1
作者 屠守中 闫洲 +1 位作者 卫玲蔚 朱小燕 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期83-88,共6页
由于当前各类主流网络平台的发展呈现出"社交平台内容化、内容平台社交化"的趋势,用户分化也日趋明显,出现了拥有大规模粉丝的超级节点,因此,提出了一种基于社交关系的兴趣挖掘模型。结合矩阵分解和标签传播算法,将用户分为... 由于当前各类主流网络平台的发展呈现出"社交平台内容化、内容平台社交化"的趋势,用户分化也日趋明显,出现了拥有大规模粉丝的超级节点,因此,提出了一种基于社交关系的兴趣挖掘模型。结合矩阵分解和标签传播算法,将用户分为内容发布者和普通用户两类,并分别提取和计算兴趣话题,实现了在大规模异构网络中发现、挖掘用户兴趣。基于知乎数据集上设计的对比实验,验证了模型的有效性以及算法的性能优势。与基线方法相比,这种算法在查全率上最大提升约42%,F1值最大提升约33%。 展开更多
关键词 异构网络 社交网络 兴趣模型 非负矩阵分解 标签传播
下载PDF
半监督的微博话题噪声过滤方法 被引量:2
2
作者 屠守中 杨婧 +1 位作者 赵林 朱小燕 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第3期178-185,共8页
社交网络中存在大量营销、招聘等垃圾信息以及无实质内容的短文,为话题建模工作带来很多干扰,更严重影响社交网络方面的学术研究及商业应用。因此,该文提出了一种结合支持向量机与k近邻模型(pSVM-kNN)的半监督话题噪声过滤方法。该方法... 社交网络中存在大量营销、招聘等垃圾信息以及无实质内容的短文,为话题建模工作带来很多干扰,更严重影响社交网络方面的学术研究及商业应用。因此,该文提出了一种结合支持向量机与k近邻模型(pSVM-kNN)的半监督话题噪声过滤方法。该方法融合了SVM和kNN算法,在SVM计算得到超平面的基础上使用kNN算法在局部范围内迭代寻找分类超平面的最优解;同时为减少误分类发生,分别在SVM和kNN阶段引入惩罚代价和比例权重,以提高噪声过滤的效果。通过选取新浪微博中不同大小的数据集进行实验与其他方法进行比较,结果表明:该方法只利用了少量的标注样本进行训练,在准确率、召回率和F值方面均优于其他的对比方法。 展开更多
关键词 社交网络 支持向量机 K近邻 噪声过滤 惩罚代价
原文传递
Mining microblog user interests based on TextRank with TF-IDF factor 被引量:19
3
作者 tu shouzhong Huang Minlie 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2016年第5期40-46,共7页
It is of great value and significance to model the interests of microblog user in terms of business and sociology. This paper presents a framework for mining and analyzing personal interests from microblog text with a... It is of great value and significance to model the interests of microblog user in terms of business and sociology. This paper presents a framework for mining and analyzing personal interests from microblog text with a new algorithm which integrates term frequency-inverse document frequency (TF-IDF) with TextRank. Firstly, we build a three-tier category system of user interest based on Wikipedia. In order to obtain the keywords of interest, we preprocess the posts, comments and reposts in different categories to select the keywords which appear both in the category system and microblogs. We then assign weight to each category and calculate the weight of keyword to get TF-IDF factors. Finally we score the ranking of each keyword by the TextRank algorithm with TF-IDF factors. Experiments on real Sina microblog data demonstrate that the precision of our approach significantly outperforms other existing methods. 展开更多
关键词 microblog interest feature TF-IDF interest mining TextRank
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部