期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
网络舆情话题情感演化研究 被引量:34
1
作者 黄卫东 陈凌云 吴美蓉 《情报杂志》 CSSCI 北大核心 2014年第1期102-107,共6页
针对现有的关于网络舆情内容进行情感分析的研究不能满足舆情情感深度挖掘的需求,提出一种基于概率潜在语义分析(PLSA)的网络舆情话题情感分析方法,利用PLSA模型对不同时间段上的网络舆情话题进行子话题提取和情感词表构建,综合考虑修... 针对现有的关于网络舆情内容进行情感分析的研究不能满足舆情情感深度挖掘的需求,提出一种基于概率潜在语义分析(PLSA)的网络舆情话题情感分析方法,利用PLSA模型对不同时间段上的网络舆情话题进行子话题提取和情感词表构建,综合考虑修饰词对情感词的影响以及情感词对子话题的贡献程度,最终得到一个时间序列上各个子话题的情感倾向值以及整个话题的情感变化趋势。实验结果证明该方法不仅可以描述同一个子话题随时间的情感演化过程,还可以描述话题情感随子话题维度和内容的演变情况。 展开更多
关键词 网络舆情 PLSA模型 情感演化 话题抽取 情感分析 情感词表
下载PDF
藏汉跨语言话题模型构建及对齐方法研究 被引量:1
2
作者 孙媛 赵倩 《中文信息学报》 CSCD 北大核心 2017年第1期102-111,共10页
如何获取藏文话题在其他语种中的相关信息,对于促进少数民族地区的社会管理科学化水平、维护民族团结和国家统一、构建和谐社会具有重要意义。目前大多数研究集中在英汉跨语言信息处理方面,针对藏汉跨语言研究较少。如何根据藏语、汉语... 如何获取藏文话题在其他语种中的相关信息,对于促进少数民族地区的社会管理科学化水平、维护民族团结和国家统一、构建和谐社会具有重要意义。目前大多数研究集中在英汉跨语言信息处理方面,针对藏汉跨语言研究较少。如何根据藏语、汉语的特点,并结合目前藏语信息处理的研究现状,实现藏汉多角度的社会网络关系关联,同步发现关注话题并进行数据比较,是迫切需要解决的问题。该文在藏汉可比语料的基础上,利用词向量对文本词语进行语义扩展,进而构建LDA话题模型,并利用Gibbs sampling进行模型参数的估计,抽取出藏语和汉语话题。在LDA话题模型生成的文档-话题分布的基础上,提出一种基于余弦相似度、欧氏距离、Hellinger距离和KL距离四种相似度算法的投票方法,来实现藏汉话题的对齐。 展开更多
关键词 藏汉跨语言 话题抽取 LDA 话题对齐
下载PDF
网络新闻话题语义信息提取
3
作者 赵旭剑 黄发发 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《电脑知识与技术(过刊)》 2015年第5X期176-178,共3页
新闻话题抽取对于话题模型构建以及新闻话题挖掘具有重要的研究意义和应用价值。传统的方法仅仅通过提取关键词包来表示话题,缺乏完整的话题语义信息描述。针对该问题,本文从话题事件要素入手,建立话题语义模型,利用浅层语法特征抽取话... 新闻话题抽取对于话题模型构建以及新闻话题挖掘具有重要的研究意义和应用价值。传统的方法仅仅通过提取关键词包来表示话题,缺乏完整的话题语义信息描述。针对该问题,本文从话题事件要素入手,建立话题语义模型,利用浅层语法特征抽取话题语义信息。实验结果表明,本文算法能有效提取新闻话题要素,抽取结果具有一定的语义表达能力。 展开更多
关键词 话题语义信息 话题抽取 事件要素 Text Rank
下载PDF
面向微博热点事件的话题检测及表述方法研究 被引量:15
4
作者 周炜翔 张仰森 张良 《计算机应用研究》 CSCD 北大核心 2019年第12期3565-3569,3578,共6页
针对微博文本数据稀疏导致热点话题难以检测的问题,提出了一种基于IDLDA-ITextRank的话题检测模型。首先,通过引入微博时间序列特征和词频特征,构建了IDLDA话题文本聚类模型,利用该模型将同一话题的文本聚到一个文本集合TS;然后,通过采... 针对微博文本数据稀疏导致热点话题难以检测的问题,提出了一种基于IDLDA-ITextRank的话题检测模型。首先,通过引入微博时间序列特征和词频特征,构建了IDLDA话题文本聚类模型,利用该模型将同一话题的文本聚到一个文本集合TS;然后,通过采用编辑距离和字向量相结合的相似度计算方法,构建了ITextRank文本摘要和关键词抽取模型,对文本集合TS抽取摘要及其关键词;最后,利用词语互信息和左右信息熵将所抽取的关键词转换成关键主题短语,再将关键主题短语和摘要相结合对话题内容进行表述。通过实验表明,IDLDA模型相较于传统的BTM和LDA模型对话题文本的聚类效果更好,利用关键主题短语和摘要对微博的话题进行表述,比直接利用主题词进行话题表述具有更好的可理解性。 展开更多
关键词 文本聚类 IDLDA-ITextRank模型 话题抽取 话题表述
下载PDF
基于用户影响力的热点话题检测方法研究 被引量:5
5
作者 裘江南 谷文静 翟劼 《情报杂志》 CSSCI 北大核心 2017年第4期156-161,共6页
[目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直... [目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直观性较差。针对此问题,提出了基于用户影响力的热点话题检测方法。[方法/过程]首先识别用户特征要素,构建用户影响力模型,计算用户影响力;然后,综合考虑主题词影响力、影响力增长速度和增长斜率,提出基于用户影响力的微博热点话题主题词抽取方法,抽取主题词簇;之后,识别核心主题词并进行热点话题关键词抽取。最后,通过实验验证方法的有效性。[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题;该方法能有效提升实证性热点话题识别效率,减少娱乐性热点话题的识别;通过对不同时间窗口内同一话题的关键词抽取,可以实现对相应话题的热点跟踪。 展开更多
关键词 抽取.最后 通过实验验证方法的有效性.[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题 该方法能有效提升实证性热点话题识别效率 减少娱乐性热点话题的识别 通过对不同时间窗口内同一话题的关键词抽取 可以实现对相应话题的热点跟踪.
下载PDF
中国政府网“一带一路”新闻话题挖掘分析 被引量:4
6
作者 秦玥 吴亚平 王继民 《图书情报工作》 CSSCI 北大核心 2019年第15期103-110,共8页
[目的/意义]探究中国政府网"一带一路"相关新闻的话题内容及热度变化,呈现"一带一路"倡议主题及动态,明确不同时期的倡议重点,为相关研究提供参考。[方法/过程]构建基于LDA模型的新闻话题内容的基本框架,限定2015-2... [目的/意义]探究中国政府网"一带一路"相关新闻的话题内容及热度变化,呈现"一带一路"倡议主题及动态,明确不同时期的倡议重点,为相关研究提供参考。[方法/过程]构建基于LDA模型的新闻话题内容的基本框架,限定2015-2017年"一带一路"相关新闻数据,利用LDA模型进行话题抽取,根据文档与话题的概率分布计算,分析各主题在不同时间段的热度演化。[结果/结论]抽取得出30个细分话题,归纳为政策沟通、设施联通、贸易畅通、资金融通、民心相通、"一带一路"对我国经济的影响和政府工作7大类。其中,政策沟通类在全时间段上热度最高,贸易畅通和"一带一路"对我国经济的影响两类话题紧随其后。"进出口"等细分话题的热度不断上升,"改革与转型"等细分话题的热度则有下降,体现了官方媒体新闻内容及其关注度随时间而变化的特点。 展开更多
关键词 “一带一路” LDA模型 话题抽取 热度演化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部