基于Clauset和PageRank的社交网络族群兴趣发现研究被引量：3

Study on Groups Interest in Social Network Service Based on Clauset and PageRank

下载PDF

导出

摘要传统的话题识别方法实现对新闻媒体信息流中新话题的自动识别,主要针对长文本信息,不适用于数据稀疏的微博客。为此,本文提出一种以用户语言为基础的话题词库,构建主题词共现图进行微博客话题识别。在此基础上,分别用Clauset算法及PageRank算法进行了模块化的聚类。前者从内容视角发现了不同的兴趣簇群,其社区结构较为扁平化;后者从人的视角发现了不同的兴趣簇群,群意见领袖均为现实社会的权威人物,其社区结构呈现较明显的层级性。 The traditional topic detection method can realize the automatic identification of the new topic in the news media information flow, which is mainly aimed at the long text information and is not suitable for data sparse microblogs. Therefore, this paper proposes a user-language-based topic thesaurus to build the keywords co-occurrence diagrams of microblog topic identification. On this basis, the Clauset algorithm and PageRank algorithm are used to carry out the modular clustering. Concerning the Clauset, different interest groups are identified from the perspective of the content, and their community structure is relatively flat; As for the PageRank, different interest clusters are found from the perspective of people, the opinion leaders of the clusters are the authority figures of social reality, and their community stnlcture show a more significant level of resistance.

作者王仁武袁毅翟伯荫

机构地区华东师范大学商学院信息学系

出处《情报杂志》 CSSCI 北大核心 2015年第11期183-187,共5页 Journal of Intelligence

关键词词共现图族群兴趣 Clauset PAGERANK word co-occurrence diagram group interest Clausct PageRank

分类号 G202 [文化科学—传播学]

引文网络
相关文献

参考文献12

1张志安,贾佳.中国政务微博研究报告[J].新闻记者,2011(6):34-39. 被引量：129
2陈明亮,邱婷婷,谢莹.微博主影响力评价指标体系的科学构建[J].浙江大学学报（人文社会科学版）,2014,44(2):53-63. 被引量：39
3唐晓波,向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作,2014,58(5):58-63. 被引量：62
4高琪,张永平.超链接导向搜索算法中主题漂移的研究[J].计算机应用,2009,29(11):3100-3102. 被引量：5
5许波,张结魁,周军.基于行为分析的用户兴趣建模[J].情报杂志,2009,28(6):166-169. 被引量：19
6龚卫华,杨良怀,金蓉,丁维龙.基于主题的用户兴趣域算法[J].通信学报,2011,32(1):72-78. 被引量：5
7石伟杰,徐雅斌.微博用户兴趣发现研究[J].现代图书情报技术,2015(1):52-58. 被引量：8
8邱云飞,王琳颍,邵良杉,郭红梅.基于微博短文本的用户兴趣建模方法[J].计算机工程,2014,40(2):275-279. 被引量：21
9赵文清,侯小可.基于词共现图的中文微博新闻话题识别[J].智能系统学报,2012,7(5):444-449. 被引量：30
10CLAUSET A, Finding Community S ,tructure in Very Large Net- works [ J ]. Physical Review E, 200. j, 72 ( 2 ) :026132.

二级参考文献111

1张海涛,靖继鹏.根据用户的浏览行为确定网页页面等级的方法[J].情报学报,2004,23(3):303-306. 被引量：5
2邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
3何光辉,魏曙光,王蔚韬.改进的聚类邻居协同过滤推荐算法[J].计算机科学,2004,31(11):147-149. 被引量：6
4范柏乃,朱华.我国地方政府绩效评价体系的构建和实际测度[J].政治学研究,2005(1):84-95. 被引量：117
5黄小原,田澎,肖四汉.基于神经网络的证券选择决策工具[J].系统工程理论方法应用,1995,4(2):60-65. 被引量：4
6罗欣,夏德麟,晏蒲柳.基于词频差异的特征选取及改进的TF-IDF公式[J].计算机应用,2005,25(9):2031-2033. 被引量：55
7赵淑兰.党报影响力及其市场因素的理论分析[J].新闻战线,2005(11):56-59. 被引量：11
8耿焕同,蔡庆生,赵鹏,于琨.一种基于词共现图的文档自动摘要研究[J].情报学报,2005,24(6):651-656. 被引量：15
9王继民,彭波.搜索引擎用户点击行为分析[J].情报学报,2006,25(2):154-162. 被引量：45
10陈健,印鉴.基于影响集的协作过滤推荐算法[J].软件学报,2007,18(7):1685-1694. 被引量：59

共引文献321

1李沿江,赵红霞,苏玲霞.新冠肺炎疫情期间微博话题“中医新冠肺炎”的关注热点分析——基于LDA模型的微博主题挖掘[J].亚太传统医药,2020,16(11):15-17. 被引量：3
2许睿,龙丹,刘佳,刘畅.基于LDA模型的电力投诉文本热点话题识别[J].云南大学学报（自然科学版）,2020,42(S02):26-31. 被引量：3
3赵越,刘子平,朱琳.社交媒体中的西安城市形象——基于跨平台数据的研究[J].新闻知识,2023(1):30-42.
4梁艳平,安璐,刘静.同类突发公共卫生事件微博话题共振研究[J].数据分析与知识发现,2020,4(2):122-133. 被引量：12
5王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
6袁娴.亲民式平台:广州政府机构微博发展现状的实证研究[J].四川行政学院学报,2013(1):50-55.
7耿国阶,张晓杰,孙萍.政务微博的发展对中国治理转型的影响[J].东北大学学报（社会科学版）,2012,14(5):427-431. 被引量：9
8董彦君.网络舆情视角下社会化媒体的公共性[J].新闻爱好者,2012(5):15-16. 被引量：1
9朱琳.上海政务微博“上海发布”的发展研究[J].电子政务,2012(11):13-22. 被引量：5
10吴俣丹.我国政务微博的实施效益分析及对策研究[J].中山大学研究生学刊（社会科学版）,2013,34(2):126-139.

同被引文献22

1中国科技论文在线.基于权威度的指导者挖掘与个性化推荐方法[EB/OL].http://www.paper.edu.cn.
2HIRSCH J E. An index to quantify an individual's scientific re- search output[C]. Proceedings of Natl Acad Sci USA 102 (PNAS' 05) ,2005:16569-16572.
3LIU XIAOMING,BOLLEN J, NELSON M L. Co-authorship net- works in the digital library research community[J]. Information Processing & Management,2005,41(6):681-682.
4邹博伟,张宇,范基礼,郑伟,刘挺.基于改进TextTiling方法的用户新兴趣发现的研究[J].计算机研究与发展,2009,46(9):1594-1600. 被引量：5
5王勇,徐永红,姚萍.科研评价指标——h指数研究综述[J].情报杂志,2011,30(B06):41-44. 被引量：15
6张海粟,陈桂生,马于涛,刘玉超.基于在线百科全书的群体兴趣及其关联性挖掘[J].计算机学报,2011,34(11):2234-2242. 被引量：10
7陈文涛,张小明,李舟军.构建微博用户兴趣模型的主题模型的分析[J].计算机科学,2013,40(4):127-130. 被引量：30
8蒋勋,刘喜文.大数据环境下面向知识服务的数据清洗研究[J].图书与情报,2013(5):16-21. 被引量：47
9王实,高文,李锦涛,黄铁军.基于隐马尔可夫模型的兴趣迁移模式发现[J].计算机学报,2001,24(2):152-157. 被引量：22
10唐晓波,向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作,2014,58(5):58-63. 被引量：62

引证文献3

1赵华,张玉强,程成,左健健.一种简单高效的科研兴趣自动发现与多视角检索方法[J].软件导刊,2016,15(8):134-137.
2陈臣,李强.基于小数据决策的读者兴趣发现与预测[J].情报科学,2017,35(5):75-80. 被引量：4
3金丽华.如何运用版面策划新概念提高读者的阅读兴趣[J].新闻传播,2018(14):97-98.

二级引证文献4

1张莉曼,张向先,吴雅威,郭顺利.基于小数据的社交类学术App用户动态画像模型构建研究[J].图书情报工作,2020,64(5):50-59. 被引量：23
2曹霞.国内图书馆界小数据研究进展[J].图书情报工作,2020,64(14):145-151. 被引量：8
3潘煦.小数据视域下图书馆个性化服务研究述评[J].西南民族大学学报（人文社会科学版）,2022,43(12):228-232.
4柏忠贤,季诚钧.小数据视角下知识服务的体系建构与伦理反思[J].编辑之友,2024(7):45-52.

1谷玉华,文娟.专利地图研究文献计量分析[J].现代情报,2012,32(9):102-106. 被引量：3
2任红娟,张志强.基于文献计量的科学知识图谱发展研究[J].情报杂志,2009,28(12):86-90. 被引量：129
3浦墨,郑彦宁,赵筱媛,刘志辉.基于词共现关系强度和关键词词频的叙词选词方法探究[J].图书情报工作,2013,57(15):121-125. 被引量：15
4文娟,彭洁.国内信息自由研究现状分析[J].新世纪图书馆,2013(6):15-18. 被引量：2
5李维,杨思洛.近十年我国高校图书馆与公共图书馆研究主题比较分析[J].图书馆,2015(8):49-52. 被引量：7
6梁立栋.网络媒介对当代大学生影响刍议[J].科教导刊,2011(34):7-8.
7刘红霞.体育科技期刊传播效果调查与分析[J].编辑学报,2007,19(5):391-394. 被引量：6
8王兴旺,宓一鸣,尚建翠,李方.基于共词分析的我国图书馆馆藏评价研究热点分析[J].现代情报,2014,34(7):27-31. 被引量：8
9林之达,郭晴.论传播效果的层级性[J].成都大学学报（社会科学版）,2004(4):46-48. 被引量：12
10张学福.基于词共现的可视化概念空间研究[J].情报学报,2008,27(2):205-211. 被引量：12

情报杂志

2015年第11期

浏览历史

内容加载中请稍等...

基于Clauset和PageRank的社交网络族群兴趣发现研究被引量：3

参考文献12

二级参考文献111

共引文献321

同被引文献22

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Clauset和PageRank的社交网络族群兴趣发现研究 被引量：3

参考文献12

二级参考文献111

共引文献321

同被引文献22

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Clauset和PageRank的社交网络族群兴趣发现研究被引量：3