期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于HDP模型的领域微博主题演化研究 被引量:2
1
作者 高永兵 杨利莹 +1 位作者 胡文江 马占飞 《计算机工程》 CAS CSCD 北大核心 2018年第2期1-8,共8页
领域微博中包含较多的专业领域信息,并且随时间表现出较强的演化性。为分析领域的主题演化情况,构建一个基于分层Dirichlet过程(HDP)的DM-HDP模型。以用户为单位抽取领域相关的微博,利用微博的领域特征和时间特征,提取领域相关带有明显... 领域微博中包含较多的专业领域信息,并且随时间表现出较强的演化性。为分析领域的主题演化情况,构建一个基于分层Dirichlet过程(HDP)的DM-HDP模型。以用户为单位抽取领域相关的微博,利用微博的领域特征和时间特征,提取领域相关带有明显时间特征的微博并自动挖掘其主题分布,最终构建领域主题演化分析过程。实验结果表明,基于DM-HDP模型的分析方法能够表现领域微博主题的演化过程,与基于LDA和HDP模型的方法相比,在内容困惑度和模型复杂度等方面均具有明显优势。 展开更多
关键词 领域微博 主题挖掘 分层Dirichlet模型 DM-hdp模型 GIBBS采样 主题演化
下载PDF
基于PSP_HDP主题模型的非结构化经济指标挖掘 被引量:5
2
作者 张奕韬 万常选 +3 位作者 刘喜平 江腾蛟 刘德喜 廖国琼 《软件学报》 EI CSCD 北大核心 2020年第3期845-865,共21页
随着经济活动数据的不断丰富,互联网平台上产生了大量的财经文本,其中蕴含了经济领域发展状况的影响因素.如何从这些财经文本中有效地挖掘与经济有关的经济要素,是实现非结构化数据在经济研究中应用的关键.根据人工构建非结构化经济指... 随着经济活动数据的不断丰富,互联网平台上产生了大量的财经文本,其中蕴含了经济领域发展状况的影响因素.如何从这些财经文本中有效地挖掘与经济有关的经济要素,是实现非结构化数据在经济研究中应用的关键.根据人工构建非结构化经济指标的局限性,以及主题模型在非结构化经济指标挖掘中存在的问题,结合已有经济领域分类标准、词语之间的语义关系和词语对主题的代表性,定义了文档的领域隶属度、词语与主题的语义相关度和词语对主题的贡献度,用于分别描述CRF(Chinese restaurant franchise)中餐厅的菜肴风格、顾客之间对菜肴要求的一致程度和顾客对菜肴的专一程度;结合文档领域属性、词语语义和词语在主题中的出现情况,提出了PSP_HDP(combining documents’domain properties,word semantics and words’presences in topics with HDP)主题模型.由于PSP_HDP主题模型改进了文档-主题与主题-词语的分配过程,从而提高了经济主题的区分度和辨识度,可以更有效地挖掘与经济有关的经济主题和经济要素词.实验结果表明:提出的PSP_HDP主题模型不仅在主题多样性、内容困惑度和模型复杂度等评价指标方面的整体性能优于HDP主题模型,而且在非结构化经济指标挖掘和经济要素词抽取方面能够得到区分度更好、辨识度更高的结果. 展开更多
关键词 hdp主题模型 经济领域分类标准 语义关系 非结构化经济指标 经济要素词
下载PDF
基于HDP的主题词向量构造——以柬语为例
3
作者 李超 严馨 +3 位作者 谢俊 徐广义 周枫 莫源源 《计算机工程与科学》 CSCD 北大核心 2020年第6期1111-1119,共9页
针对单一词向量中存在的一词多义和一义多词的问题,以柬语为例提出了一种基于HDP主题模型的主题词向量的构造方法。在单一词向量基础上融入了主题信息,首先通过HDP主题模型得到单词主题标签,然后将其视为伪单词与单词一起输入Skip-Gram... 针对单一词向量中存在的一词多义和一义多词的问题,以柬语为例提出了一种基于HDP主题模型的主题词向量的构造方法。在单一词向量基础上融入了主题信息,首先通过HDP主题模型得到单词主题标签,然后将其视为伪单词与单词一起输入Skip-Gram模型,同时训练出主题向量和词向量,最后将文本主题信息的主题向量与单词训练后得到的词向量进行级联,获得文本中每个词的主题词向量。与未融入主题信息的词向量模型相比,该方法在单词相似度和文本分类方面均取得了更好的效果,获取的主题词向量具有更多的语义信息。 展开更多
关键词 hdp主题模型 主题词向量 Skip-Gram模型
下载PDF
基于标签的半监督HDP文本分类主题模型 被引量:4
4
作者 李永忠 郑滔 《模式识别与人工智能》 EI CSCD 北大核心 2017年第12期1138-1148,共11页
分层狄利克雷过程(HDP)主题模型从数据中自动学习结构最优的主题集,但往往不满足实际语义要求,而现有的一些带标签的主题模型又需要设定很难界定的参数.因此,文中在已知部分语义标签和标签确定度的基础上,分别提出半监督HDP主题模型(SLH... 分层狄利克雷过程(HDP)主题模型从数据中自动学习结构最优的主题集,但往往不满足实际语义要求,而现有的一些带标签的主题模型又需要设定很难界定的参数.因此,文中在已知部分语义标签和标签确定度的基础上,分别提出半监督HDP主题模型(SLHDP)和随机簇的准确度评价指标.该模型为已知的语义标签赋予较高权重,结合狄利克雷过程有限空间无线划分的特性,并通过中国餐馆过程建模生成.在多个中英文数据集中的实验表明,在大规模数据集的文本分类中,SLHDP模型能够使主题集的构成更合理. 展开更多
关键词 标签 半监督 分层狄利克雷过程(hdp) 主题模型 随机簇
下载PDF
基于主题模型的新疆暴恐舆情分析 被引量:7
5
作者 张绍武 邵华 +1 位作者 林鸿飞 杨亮 《中文信息学报》 CSCD 北大核心 2018年第5期105-113,共9页
随着互联网的飞速发展,网络舆情引发的问题也越发突出。尤其是近年来发生的新疆暴恐事件,已成为公众关注的焦点。主题演化是网络舆情分析的重要内容之一,为了把握关于新疆的舆情动态,该文从主题热度变化、内容变化及关键词等多方面进行... 随着互联网的飞速发展,网络舆情引发的问题也越发突出。尤其是近年来发生的新疆暴恐事件,已成为公众关注的焦点。主题演化是网络舆情分析的重要内容之一,为了把握关于新疆的舆情动态,该文从主题热度变化、内容变化及关键词等多方面进行了研究。该文首先抓取了2013年1月到2015年12月互联网中关于新疆暴恐事件的新闻,并以此作为数据集建立了动态主题模型,实现对新闻的主题演化分析。该模型采用两次非负矩阵分解来生成主题,以层级式狄利克雷过程为对比实验,通过可视化分析与比较,总结出新疆暴恐事件的一些规律。 展开更多
关键词 动态主题模型 层级式狄利克雷过程 主题模型 可视化
下载PDF
概率主题模型在复杂视频监控场景中的应用
6
作者 樊亚文 周全 朱卫平 《电视技术》 2018年第2期94-100,120,共8页
视频监控是计算机视觉研究最热门的应用领域之一,其中复杂监控场景的行为分析是一项基本任务。复杂监控场景是指运动目标多且密度高的公共场所,这些场所包含多种并发的行为,且易发生群体性事件如果不能及时处理,会产生严重的影响。概率... 视频监控是计算机视觉研究最热门的应用领域之一,其中复杂监控场景的行为分析是一项基本任务。复杂监控场景是指运动目标多且密度高的公共场所,这些场所包含多种并发的行为,且易发生群体性事件如果不能及时处理,会产生严重的影响。概率主题模型基于词袋表示方法,根据单词的共生来捕捉行为,对复杂监控场景提取的视频特征中不可避免的噪声表现出优越的鲁棒性。因此近年来广泛应用于此类场景的行为分析。本研究对其中最基本的两类主题模型Latent Dirichlet Allocation(LDA)和Hierarchical Dirichlet Processes(HDP)从理论和实验两方面进行分析对比,为以后的研究中模型选取提供依据。 展开更多
关键词 视频监控 行为分析 概率主题模型 LATENT DIRICHLET Allocation(LDA) HIERARCHICAL DIRICHLET Processes(hdp)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部