期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于GRU+LDA的群聊主题挖掘 被引量:1
1
作者 汤鲲 陈思思 《计算机与现代化》 2018年第12期72-76,共5页
社交网络发展迅速,即时消息系统已成为人们日常生活中必不可少的沟通交流工具。在线群聊能使人们迅速交流生活、技术及工作等信息,但是由于群聊信息更新较快,大量的信息导致跟进群聊话题是困难的。传统的主题挖掘模型不能很好地适用于... 社交网络发展迅速,即时消息系统已成为人们日常生活中必不可少的沟通交流工具。在线群聊能使人们迅速交流生活、技术及工作等信息,但是由于群聊信息更新较快,大量的信息导致跟进群聊话题是困难的。传统的主题挖掘模型不能很好地适用于群聊文本的挖掘。通过对群聊文本的特征进行分析,提出一种基于GRU和LDA的群聊会话主题挖掘(GLB-GCTM,GRU and LDA Based Group Chat Topic Mining)模型,解决了传统主题模型不能解决的词语顺序问题。首先,假定每个文档有一个基于高斯分布的主题向量,然后根据GRU原理产生每个词的隐含状态,根据当前词的隐含状态的伯努利分布确定当前词是否为停用词,以决定所使用的语言模型。该方法使用笔者加入的10个QQ群最近3个月的群聊数据集进行试验验证,结合对比实验评估标准,该模型能够有效识别出群聊文本中的主题。 展开更多
关键词 主题挖掘 群聊文本 深度学习 GRU LDA
下载PDF
基于候选主题词与话题分类的人物行为研究
2
作者 刘晓芳 欧荣安 +4 位作者 罗欢 刘芳婷 张辉极 韩冰 赵建强 《计算机技术与发展》 2022年第4期44-50,共7页
如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一。传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题。为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candid... 如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一。传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题。为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candidate topic words)。该算法使用LDA主题模型抽取聊天文本中的关键词,使用预训练词向量得到显著的语义特征,同时为增强特征,将字符特征与获取的词汇特征进行融合。传统方法同时还存在只关注话题无法更精确地刻画人物行为的问题。针对该问题,该文提出了同时获取聊天话题和人物行为的方案:针对已归类的话题,该方案使用群成员互动强度、群成员活跃度作为人物行为网络中的权值,构建话题参与人的行为网络图;最后通过成员在群中的备注给人物赋予不同的社会标签,以丰富人物行为。实验表明,提出的话题分类算法,在实际搜集的数据集上比基线模型拥有更佳的性能,在获取群聊话题的同时得到了更丰富的人物行为描述。 展开更多
关键词 聊天主题 候选主题词 话题分类 人物行为 互动强度 群成员活跃度 社会标签
下载PDF
基于多策略的群聊话题检测技术 被引量:2
3
作者 吴旭 陈春旭 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第5期1-9,共9页
【目的】更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测。【方法】提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属... 【目的】更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测。【方法】提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属性提升聚类效果。【结果】本方法处理三份群聊记录样本的纯文本数据时的F值较对比算法分别提升2.9%、6.1%和3.0%,速度分别提高约27.6%、32.1%和47.1%。本方法还能处理传统算法无法应对的混合类型数据,且比处理对应的纯文本数据时的性能分别提升约29.4%、27.1%和22.5%。【局限】对群聊消息文本特征的利用率不足,算法所设阈值过多。【结论】本文方法能够在一定程度上提高群聊话题检测效果,并扩大了话题检测所能应对的消息类型的广度,提升了舆情分析效率。 展开更多
关键词 群聊消息 话题检测 短文本
原文传递
基于LDA的群组聊天行为研究
4
作者 底晓强 邱金 +4 位作者 李锦青 毕琳 杨华民 赵建平 张凤荣 《情报科学》 CSSCI 北大核心 2017年第12期45-49,共5页
【目的/意义】随着社交网络的普及与快速发展,人们越来越多地依赖于网络聊天工具进行交流,针对QQ群组聊天信息过载用户无法从聊天记录中快速获取所需信息的问题,本文开展了聊天热点主题提取和QQ群组用户聊天行为分析的研究。【方法/过... 【目的/意义】随着社交网络的普及与快速发展,人们越来越多地依赖于网络聊天工具进行交流,针对QQ群组聊天信息过载用户无法从聊天记录中快速获取所需信息的问题,本文开展了聊天热点主题提取和QQ群组用户聊天行为分析的研究。【方法/过程】采集了一个技术类QQ群的聊天数据,利用Gibbs算法和LDA模型提取群组聊天数据中的主题并对其进行分析。【结果/结论】发现群组的主题可以分为三类:技术类、生活类和综合类。其中,技术类话题讨论的高峰集中在工作时间,没有继承性;大家普遍关心生活类话题,该话题有继承性。由于群组聊天的即时性、交互性和网络领袖的影响,一个时间段内群中只有一个热点主题。该研究结果可为群组聊天行为和热点分析提供参考。 展开更多
关键词 LDA模型 主题提取 群组聊天 主题演化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部