基于多模数据的微博用户兴趣识别研究被引量：10

Research on User Interest Recognition Based on Multi-mode Data

导出

摘要【目的/意义】通过社交媒体用户分享的图像、博文及用户标签进行数据挖掘,来判断和预测用户的真实兴趣,从而更好地为用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用机器学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于三类特征使用SVM训练得到分类器进行用户兴趣类别预测,主要比较单模数据和多模数据的分类指标,探讨多模数据在有监督学习下的发多分类问题。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户兴趣进行分类识别,F值达到77%,比最好的单模数据提升10%。实验结论证实,多模(图像、博文和标签)数据与单模数据相比,提升了分类效果,同时为多模数据应用研究提供了一定的理论和技术基础。 [Purpose/significance] By analyzing and fusing micro-blog image, post information and user tag, mining and predicting users＇ real interests, in order to do a better and more precision personalized recommendation services. [Method/ process ] Firstly, a micro-blog user oriented spider is implemented to crawl image, text and tag data. After that, three user interest feature sets were constructed by using CNN,Word2vec and BOW, based on which we used SVM to train classifier and predict users＇ interest on these data respectively, we aimed at comparing the classification indicators between single mode data and multi-mode data, and exploring multi-classification problem on multi-mode data under supervised learning method. [ Result/conclusion] Our experiment results show that user interest identification integrating images, texts and tags achieved 77% on F1 score, which achieved 10% improve on F1 score compared to the ever best single mode data. The pro- posed method can effectively predict user interest, which provides a theoretical and technical basis for the application of multi-mode data.

作者曾金陆伟陈海华贺国秀

机构地区武汉大学信息管理学院武汉大学信息检索与知识挖掘研究所

出处《情报科学》 CSSCI 北大核心 2018年第1期124-129,共6页 Information Science

基金国家自然科学基金面上项目(71473183)

关键词社交网络数据挖掘兴趣识别多模数据用户兴趣分类 social network data mining user interest identification multi-mode data user interest classification

分类号 G252.0 [文化科学—图书馆学]

引文网络
相关文献

参考文献6

1赵岩露,王晶,沈奇威.基于特征分析的微博用户兴趣发现算法[J].电信工程技术与标准化,2012,25(11):79-83. 被引量：8
2宋巍,张宇,谢毓彬,刘挺,李生,都云程.基于微博分类的用户兴趣识别[J].智能计算机与应用,2013,3(4):80-83. 被引量：12
3邱云飞,王琳颍,邵良杉,郭红梅.基于微博短文本的用户兴趣建模方法[J].计算机工程,2014,40(2):275-279. 被引量：21
4陈渊,林磊,孙承杰,刘秉权.一种面向微博用户的标签推荐方法[J].智能计算机与应用,2011,1(3):21-26. 被引量：14
5焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：369
6朱玲,薛春香,章成志,傅柱.微博用户标签与博文内容相关度研究[J].现代图书情报技术,2016(3):18-24. 被引量：2

二级参考文献45

1周继恩,刘贵全,张春阳,蔡庆生.基于内部信念状态POMDP模型在用户兴趣获取中的应用[J].小型微型计算机系统,2004,25(11):1979-1983. 被引量：5
2王守觉,曹文明.半导体神经计算机的硬件实现及其在连续语音识别中的应用[J].电子学报,2006,34(2):267-271. 被引量：3
3彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量：44
4林霜梅,汪更生,陈弈秋.个性化推荐系统中的用户建模及特征选择[J].计算机工程,2007,33(17):196-198. 被引量：45
5ZHAO WSYNE Xin,JIANG Jing,WENG Jianshu. Comparing Twitter and traditional media using topic models[A].2011.338-349.
6HONG L,DAVISON B D. Empirical study of topic modeling in Twitter[A].2010.
7ABELF,GAOQI,JANG. Sematic Enrichment of Twitter Posts for User Profile Construction on the Social Web[A].2011.
8RAMAGE D,DUMAIS S T LIEBLINGOL. Liebling.Characterizing Microblogs with Topic Models[A].2010.
9ABELF,GAO QI,JANG. Analyzing User Modeling on Twitter For Personalized News Recommendations[A].2011.
10ABELF,GAO QI,JANG. TUMS:Twitter-based User Modeling Service[A].2011.

共引文献416

1朱新乐.基于BP神经网络的绿色供应链优化研究[J].运输经理世界,2023(11):156-158.
2邢毅雪,朱永华,高海燕,周金,张克.基于注意力机制的远程监督实体关系抽取[J].上海大学学报（自然科学版）,2021,27(5):983-992. 被引量：5
3冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
4张珂,王军政,丁嘉豪,彭析竹.恶劣气候背景下基于CNN的毫米波近程测距技术研究[J].微电子学,2023,53(6):1053-1058.
5徐美,刘春腊.湖南省资源环境承载力预警评价与警情趋势分析[J].经济地理,2020,40(1):187-196. 被引量：18
6何海洋,路玉,乔保军.一种改进Octave神经网络的图像识别模型[J].河南大学学报（自然科学版）,2020(6):700-706.
7南敬昌,孙雯雯,杜有益,王明寰.一维卷积神经网络超宽带天线建模方法[J].电子测量与仪器学报,2023,37(2):204-210. 被引量：1
8杨晶,杨长春,丁虹.一种改进的新浪微博好友推荐算法[J].常州大学学报（自然科学版）,2013,25(3):66-70. 被引量：3
9王震华,刘晓东.采用TD循环的核电与燃气轮机联合循环[J].吉林电力技术,2000,12(1):18-20.
10马立人,蒋中华.生产生物芯片及相关设备的厂商及服务及内容[J].现代科学仪器,2000,17(1):12-18. 被引量：6

同被引文献128

1郭雪梅.基于社会化标签的用户标注行为和时间因素的个性化推荐方法研究[J].情报科学,2020,0(2):68-74. 被引量：10
2王上飞,薛佳,王煦法.基于内容的情感图像获取模型[J].计算机科学,2004,31(9):186-190. 被引量：6
3黄崑,赖茂生.以用户情感为线索的图像检索研究[J].情报科学,2006,24(9):1395-1399. 被引量：7
4王志平,周生宝,郭俊芳,王众托.基于变分不等式的网络广告资源分配的超网络模型[J].大连海事大学学报,2007,33(4):69-72. 被引量：18
5王众托,王志平.超网络初探[J].管理学报,2008,5(1):1-8. 被引量：102
6席运江,党延忠,廖开际.组织知识系统的知识超网络模型及应用[J].管理科学学报,2009,12(3):12-21. 被引量：78
7成琳,陈俊杰,相洁.图像颜色征提取技术的研究与应用[J].计算机工程与设计,2009,30(14):3451-3454. 被引量：13
8刘永利,欧阳元新,闻佳,熊璋.基于概念聚类的用户兴趣建模方法[J].北京航空航天大学学报,2010,36(2):188-192. 被引量：8
9黄崑,骆方,游祎.图像情感特征及其检索应用[J].情报科学,2010,28(4):602-606. 被引量：8
10马凌云,康红.Web2.0环境下图书馆用户参与的分析与评价[J].图书馆理论与实践,2010(4):15-17. 被引量：10

引证文献10

1李志义,许洪凯,段斌.基于深度学习CNN模型的图像情感特征抽取研究[J].图书情报工作,2019,63(11):96-107. 被引量：23
2廖晓,叶广宇,李伟婵,席运江.基于内容与行为数据集成建模的企业微博粉丝兴趣挖掘方法[J].系统工程,2019,37(2):139-149. 被引量：7
3周海晨,李永明.用户参与视角下微博用户兴趣差异识别[J].情报工程,2019,5(3):4-12. 被引量：1
4张华,魏大威.面向“国图公开课”的数字图书馆个性化信息推荐服务研究[J].图书馆学研究,2019,0(17):54-61. 被引量：6
5成保梅,韩景灵.融合情境因素的电子商务用户兴趣挖掘仿真[J].计算机仿真,2020,37(4):326-329. 被引量：1
6陈小永.基于最优学习的社交网络JPEG图像敏感数据挖掘方法[J].佳木斯大学学报（自然科学版）,2020,38(6):134-137. 被引量：3
7邵忻.基于用户兴趣挖掘技术的微博信息推送应用研究[J].电脑编程技巧与维护,2021(6):152-153. 被引量：1
8郁友琴,李弼程.基于多粒度文本特征表示的微博用户兴趣识别[J].计算机科学,2021,48(12):219-225. 被引量：6
9吴树芳,高梦蛟,朱杰.基于兴趣主题稳定度和多维相似度的社交用户兴趣挖掘[J].情报理论与实践,2022,45(12):186-194. 被引量：2
10冯楠,曹弘毅,李妮.利用AFW BPNN模型实现微博真伪信息识别[J].西安工业大学学报,2023,43(6):605-613.

二级引证文献50

1尹朝.基于内容生成与特征提取的图像情感识别模型研究[J].系统仿真技术,2023,19(2):141-147.
2杨松,刘佳欣,吴桐.基于深度特征和注意力机制的艺术图像情感分类研究[J].智能计算机与应用,2022,12(2):126-132. 被引量：1
3杨松,刘佳欣,潘建达.基于融合特征和迁移学习的艺术图像情感识别研究[J].智能计算机与应用,2022,12(1):146-154.
4贾建瑞,徐恩元,姚向阳.“双一流”高校图书馆微博信息服务特征分析[J].四川图书馆学报,2020(3):67-73. 被引量：3
5钟欢,马秀峰.知识流视角下数字图书馆智慧型服务平台设计[J].软件导刊,2020,19(8):126-129. 被引量：1
6席运江,杜蝶蝶,廖晓,仉学红.基于超网络的企业微博用户聚类研究及特征分析[J].数据分析与知识发现,2020,4(8):107-118. 被引量：5
7范梦余,张辉,陈怡宁.内蒙古视觉旅游形象的时空感知研究——基于DeepSentiBank的地理标记照片分析[J].干旱区资源与环境,2020,34(10):194-200. 被引量：21
8吴天强,王义贺.基于改进深度学习自编码的图像边沿畸变校正算法研究[J].光电子．激光,2021,32(2):149-156. 被引量：2
9徐维晨.基于小数据的档案馆潜在用户信息推荐服务研究[J].档案天地,2021(3):30-33. 被引量：1
10邹振宇,王鹏涛.价值共创视角下公益性数字图书馆运作模式与路径创新研究[J].图书馆学研究,2021(2):48-57. 被引量：6

1杜雨萌,张伟男,刘挺.基于主题增强卷积神经网络的用户兴趣识别[J].计算机研究与发展,2018,55(1):188-197. 被引量：8
2裴国才.基于用户画像的电信精准营销模型研究[J].信息通信,2017,30(12):240-241. 被引量：6
3倪志峰,周梁琴.实验教学中调整思维跨度的实践与思考[J].中学物理（初中版）,2017,35(12):28-29.
4张红昀.探讨初中生物实验教学中学生观察能力的培养[J].考试周刊,2018,0(13):177-177. 被引量：2
5余福茂,胡亚兰,林娜.基于邻域用户模型的主题推荐研究[J].生产力研究,2017(11):108-111.
6朱柏树.创新实验,自主建构,突破电容教学难点[J].中学物理,2017,35(12):12-15. 被引量：1
7安雪飞.1-α-羟基苯乙酸拆分工艺研究[J].石化技术,2017,24(12):16-16.
8吴龙涛,王铁宁,朱域.基于改进灰色聚类的装备器材库存分类方法[J].火力与指挥控制,2017,42(12):76-80. 被引量：5
9崔强,李迎龙,李志红.基于改进鱼群算法和支持向量机的变压器故障诊断[J].电气自动化,2017,39(6):63-66. 被引量：2
10李航,王进,赵蕊.基于Spark的多标签超网络集成学习[J].智能系统学报,2017,12(5):624-639. 被引量：1

情报科学

2018年第1期

浏览历史

内容加载中请稍等...

基于多模数据的微博用户兴趣识别研究被引量：10

参考文献6

二级参考文献45

共引文献416

同被引文献128

引证文献10

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于多模数据的微博用户兴趣识别研究 被引量：10

参考文献6

二级参考文献45

共引文献416

同被引文献128

引证文献10

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于多模数据的微博用户兴趣识别研究被引量：10