-
题名基于微博短文本的用户兴趣建模方法
被引量:21
- 1
-
-
作者
邱云飞
王琳颍
邵良杉
郭红梅
-
机构
辽宁工程技术大学软件学院
辽宁工程技术大学系统工程研究所
阜新市实验高中
-
出处
《计算机工程》
CAS
CSCD
2014年第2期275-279,共5页
-
基金
国家自然科学基金资助项目(70971059)
辽宁省创新团队基金资助项目(2009T045)
辽宁省高等学校杰出青年学者成长计划基金资助项目(JQ2012027)
-
文摘
针对微博用户兴趣建模问题,提出一种在微博短文本数据集上建立用户兴趣模型的方法。为缓解短文本造成的数据稀疏性问题,在分析微博短文本结构和内容的基础上,给出微博短文本重构概念,根据微博相关的其他微博短文本和文本中包含的3种特殊符号,进行文本内容的扩展,从而扩充原始微博的特征信息。利用HowNet2000概念词典将重构后文本的特征词集映射到概念集。以抽象到概念层的文本向量为基础进行聚类,划分用户的兴趣集合,并给出用户兴趣模型的表示机制。实验结果表明,短文本重构和概念映射提高了聚类效果,与基于协同过滤的微博用户兴趣建模方法相比,平衡均值提高29.1%,表明构建的微博用户兴趣模型具有较好的性能。
-
关键词
微博
短文本重构
概念映射
短文本聚类
用户兴趣模型
-
Keywords
micro-blog
short-text reconstruction
concept mapping
short-text clustering
user interest model
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-