期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于地理标签的推文话题时空演变的可视分析方法 被引量:3
1
作者 孙国道 周志秀 +2 位作者 李思 刘义鹏 梁荣华 《计算机科学》 CSCD 北大核心 2019年第8期42-49,共8页
社交媒体中,用户所发布的推文内容记录了与用户相关的各种信息。文字信息中涵盖了推文中包含的各种话题,以及时间和空间信息,从这些信息中分析出话题的时空演变情况具有十分重要的研究意义。针对推文数据,设计了一套可视分析流程来挖掘... 社交媒体中,用户所发布的推文内容记录了与用户相关的各种信息。文字信息中涵盖了推文中包含的各种话题,以及时间和空间信息,从这些信息中分析出话题的时空演变情况具有十分重要的研究意义。针对推文数据,设计了一套可视分析流程来挖掘推文信息,通过用户交互的方式多角度地展示了推文话题的时空演变过程。首先,基于部分历史推文数据,通过DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,结合泰森多边形对全球地理空间进行区域划分;然后,针对用户查询搜索的兴趣话题,索引找到所有相关的推文内容,并将信息与聚类中心绑定;最后,通过设计的多个结合时序聚类算法和自适应算法的可视化视图来展示话题的时空演变过程。通过推特官网提供的API抓取存储的推文数据,并进行实验和分析,结果表明:改进的可视化视图自适应布局算法有效地解决了图形遮挡问题,完整展现了推文的时空演变模式;地理区域的划分以及可视化组件能够有效帮助研究人员分析推文的时空演变以及全球关注的热点话题分布。 展开更多
关键词 推文话题 可视化分析流程 自适应布局算法 聚类 时空演变
下载PDF
基于改进CURE算法的微博热点话题发现 被引量:12
2
作者 杨长春 周猛 +1 位作者 叶施仁 徐小松 《计算机仿真》 CSCD 北大核心 2013年第11期383-387,共5页
由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计... 由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计算的精度和速度。从选取CURE层次聚类的代表点出发,将代表点转换为博文种子集,同时调节收缩因子,加大排除博文的异常点,利用CURE层次聚类算法的思想设计了改进的CURE算法来发现微博热点话题,通过实验发现改进CURE层次聚类算法能够将数据集中的74.65%作为孤立点,更好的提高了算法的精度,同时准确地抓住长尾效应的"头部",能够更加直观的发现微博热点话题。 展开更多
关键词 稀疏矩阵 热点话题 层次聚类算法 博文种子集 改进层次聚类算法
下载PDF
基于内容的微博兴趣度分析 被引量:1
3
作者 陈磊 肖基毅 刘志明 《电脑知识与技术》 2016年第3期154-157,共4页
微博用户可以将他们接收到的信息传递给他们所有的粉丝,这被称为转发。当用户发现特别有趣并且值得分享的消息时便会进行转发动作。因此,转发反映出在微博社区中人们关心的内容,并且我们可以把它作为兴趣度的一个函数。在本工作中,我们... 微博用户可以将他们接收到的信息传递给他们所有的粉丝,这被称为转发。当用户发现特别有趣并且值得分享的消息时便会进行转发动作。因此,转发反映出在微博社区中人们关心的内容,并且我们可以把它作为兴趣度的一个函数。在本工作中,我们分析了几个大型微博消息集的基于内容的特征,并训练了一个预测模型,对给定的微博消息,基于内容预测它被转发的可能性。从模型学习到的参数中,我们推断出有可能引起转发的内容特征。因此我们可以了解到哪些内容特征可以使消息变得有趣和值得转发。 展开更多
关键词 微博 转发 主题模型 内容特征 兴趣度
下载PDF
主题模型在基于社交媒体的灾害分类中的应用及比较 被引量:14
4
作者 苏凯 程昌秀 +1 位作者 Nikita Murzintcev 张婷 《地球信息科学学报》 CSCD 北大核心 2019年第8期1152-1160,共9页
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语... “一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明:①在区分主题近似的短文本时,BTM总体精度为0.598.LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;②BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。 展开更多
关键词 主题模型 BTM LDA 推文 主题分类 自然灾害 应急管理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部