期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向微博热点话题发现的改进BBTM模型研究 被引量:4
1
作者 黄畅 郭文忠 郭昆 《计算机科学与探索》 CSCD 北大核心 2019年第7期1102-1113,共12页
针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM... 针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率。最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。 展开更多
关键词 热点话题发现 微博 突发词对主题模型(bbtm) 主题模型
下载PDF
短文本流突发性话题发现:BBTM改进算法 被引量:1
2
作者 林特 《电脑知识与技术》 2017年第1期248-250,共3页
BBTM模型克服了数据稀疏性和冗余性,是短文本流突发性话题发现的有效方法。然而,BBTM模型量化词对突发概率方法比较简陋且存在不合理性,对周期性话题关联词对的突发概率估计有偏差,故提出了一种结合基于自动状态机的枚举突发词对和正态... BBTM模型克服了数据稀疏性和冗余性,是短文本流突发性话题发现的有效方法。然而,BBTM模型量化词对突发概率方法比较简陋且存在不合理性,对周期性话题关联词对的突发概率估计有偏差,故提出了一种结合基于自动状态机的枚举突发词对和正态分布的改进方法。实验证明,该方法能够为模型建模提供更准确的先验知识,从而提高模型对突发话题的敏感度和话题抽取的准确度。 展开更多
关键词 短文本 突发性 bbtm 枚举突发 正态分布
下载PDF
基于突发词对主题模型改进算法的微博热点话题发现研究 被引量:5
3
作者 向卓元 吴玉 +1 位作者 陈浩 张芙玮 《情报杂志》 CSSCI 北大核心 2022年第1期104-112,共9页
[研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果。[研究方法]首先,通过引入微博传播值、词项H指... [研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果。[研究方法]首先,通过引入微博传播值、词项H指数和词对突发概率,从文档层面和词语层面进行特征选择,解决数据稀疏和高维度的问题。其次,通过双向长短期记忆(BiLSTM)训练词语之间的关系,结合词语的逆文档频率作为词对的先验知识,考虑了词之间的关系,解决忽略词之间关系的问题。再次,利用基于密度的方法自适应选择BBTM的最优话题数目,解决了传统的主题模型需要人工指定话题数目的问题。最后,利用真实微博数据集在热点话题发现准确度、话题质量、一致性三个方面进行验证。[研究结论]实验表明,BiLSTM-HBBTM在多种评价指标上都优于对比模型,实验结果验证了所提模型的有效性及可行性。 展开更多
关键词 热点话题发现 主题模型 微博 短文本 BiLSTM bbtm Word2Vec
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部