期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于GMM-HMM的话题生命周期状态识别及趋势预测方法 被引量:1
1
作者 朱恒民 蔡婷婷 魏静 《现代情报》 CSSCI 2023年第3期26-32,41,共8页
[目的/意义]本研究对正处于演化过程中的话题进行状态识别及趋势预测,为相关部门了解话题现状,对话题进行有效监管提供科学依据。[方法/过程]首先,考虑网民情感,结合话题的新颖度和关注度,构建话题生命周期状态观测指标;其次,基于隐马... [目的/意义]本研究对正处于演化过程中的话题进行状态识别及趋势预测,为相关部门了解话题现状,对话题进行有效监管提供科学依据。[方法/过程]首先,考虑网民情感,结合话题的新颖度和关注度,构建话题生命周期状态观测指标;其次,基于隐马尔可夫模型(HMM)和高斯混合模型(GMM)的原理,提出话题生命周期状态识别及趋势预测方法;最后,选用微博话题构建数据集,设计对比实验,验证方法的有效性。[结果/结论]基于GMM-HMM的话题状态识别及趋势预测方法的F1值和准确率均高于87%,MAPE低于3.5%,相较于GaussianHMM和BP神经网络具有较大优势。 展开更多
关键词 话题生命周期状态 话题状态识别 话题趋势预测 高斯混合隐马尔可夫模型
下载PDF
基于HMM的话题风险状态预测方法研究
2
作者 蔡婷婷 朱恒民 魏静 《计算机技术与发展》 2023年第5期29-34,共6页
如何在互联网海量信息中预测话题风险性和演化趋势,是舆情监管部门的工作重点。针对话题演化趋势预测研究中存在的不足:话题状态划分方法单一、话题状态演化预测研究缺乏等,从话题预警的视角,提出话题风险状态预测方法,为舆情监管部门... 如何在互联网海量信息中预测话题风险性和演化趋势,是舆情监管部门的工作重点。针对话题演化趋势预测研究中存在的不足:话题状态划分方法单一、话题状态演化预测研究缺乏等,从话题预警的视角,提出话题风险状态预测方法,为舆情监管部门提供预警依据。首先,基于向心度和密度指标划分不同等级的话题风险状态,直观地刻画话题引发舆论危机的风险程度;其次,基于HMM(Hidden Markov Model,隐马尔可夫模型)对各话题风险状态构建模型,并将各风险状态下所对应的观测序列数据作为训练集训练模型;最后,根据极大相似准则选用最佳模型预测话题观测值,进而借助平面坐标映射法得到话题在未来时刻的风险状态。以新冠肺炎疫情事件为研究样本话题,验证基于HMM的话题风险状态预测方法的有效性,交叉检验的平均预测准确率达到90%以上,相比于BP神经网络、LSTM以及RNN时间序列预测模型,该方法的预测误差更小。 展开更多
关键词 隐马尔可夫模型 话题状态 话题演化 趋势预测 风险预警
下载PDF
私播课论坛中学习者会话行为建模研究 被引量:3
3
作者 张思 高倩倩 +2 位作者 马鑫倩 魏艳涛 杨海茹 《电化教育研究》 CSSCI 北大核心 2021年第11期63-68,106,共7页
私播课(Small Private Online Course,SPOC)论坛中的非结构性文本蕴含学习者认知和内部心理加工过程,对其分析有助于理解和解释学习结果的成因。以64名学生在SPOC论坛中的会话文本为对象进行数据挖掘,结合LDA主题建模和隐马尔可夫模型... 私播课(Small Private Online Course,SPOC)论坛中的非结构性文本蕴含学习者认知和内部心理加工过程,对其分析有助于理解和解释学习结果的成因。以64名学生在SPOC论坛中的会话文本为对象进行数据挖掘,结合LDA主题建模和隐马尔可夫模型对学习者会话行为进行实体建模,并比较高低绩效组会话行为差异,最后运用回归分析和卡方检验探索了影响学习绩效的行为模式。结论表明高低绩效组的学习行为转移存在明显差异,高绩效组的行为转移具有渐进性和平滑性,倾向于序次解决问题,而低绩效组的行为转移则更倾向于浅层回溯。信息查阅、信息加工、信息发布、协作交互、问题解决和信息评价行为均与学习成绩有关,但信息查阅行为对学习成绩有着显著正向影响,且较多的协作交互和信息评价行为能够触发学习者的高阶认知。通过教育文本数据挖掘,教师能够发现不同群体的行为特征,从而进行适应性指导和精准教学,促进学习者高阶思维发展。 展开更多
关键词 LDA主题模型 隐马可夫模型 学习行为 学习绩效
下载PDF
基于用户潜在时效偏好的推荐算法 被引量:2
4
作者 邓星 邓珍荣 +1 位作者 许亮 朱益立 《计算机应用研究》 CSCD 北大核心 2016年第9期2664-2668,共5页
针对推荐系统中用户兴趣的潜在性以及高时效性业务场景下用户兴趣的不稳定性和时间迁移性进行研究,提出一种基于用户潜在时效偏好的推荐方法。通过深入分析用户的历史行为与用户潜在兴趣的关系,提出基于概率主题模型的用户兴趣挖掘方法... 针对推荐系统中用户兴趣的潜在性以及高时效性业务场景下用户兴趣的不稳定性和时间迁移性进行研究,提出一种基于用户潜在时效偏好的推荐方法。通过深入分析用户的历史行为与用户潜在兴趣的关系,提出基于概率主题模型的用户兴趣挖掘方法,避免了传统推荐方式对用户兴趣潜在性的忽略;同时,基于高时效业务对时间敏感性的考虑,结合隐马尔可夫模型对用户兴趣进行实时捕获,发现用户的兴趣迁移序列,并以此提出基于用户时效偏好的推荐方法。最后通过相关实验验证了该方法的可行性。 展开更多
关键词 推荐系统 时效偏好 概率主题模型 隐马尔可夫模型
下载PDF
基于半CRF模型的百科全书文本段落划分 被引量:2
5
作者 许勇 宋柔 《北京工业大学学报》 CAS CSCD 北大核心 2008年第2期204-210,共7页
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语... 介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语义本体知识库的段落开始特征以及针对特定段落类型的提示性特征来进一步适应目标文本的特点.实验结果表明,该划分方法可以综合利用各种不同类型的信息,比较适合百科全书文本的段落结构,可以取得比单纯的HMM模型和CRF模型更好的性能. 展开更多
关键词 自然语言处理 机器学习 隐马尔科夫模型 文本段落划分 半条件随机域模型
下载PDF
基于CRF的百科全书文本段落划分 被引量:3
6
作者 许勇 宋柔 《计算机工程》 CAS CSCD 北大核心 2007年第10期16-18,共3页
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法... CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果。 展开更多
关键词 文本段落划分 条件随机域模型 隐马尔科夫模型
下载PDF
基于HMM的主题爬虫研究 被引量:1
7
作者 谢治军 杨武 +1 位作者 李稚楹 宋静静 《重庆工商大学学报(自然科学版)》 2012年第2期66-72,共7页
主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的... 主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的链接距离作为隐含状态,然后通过HMM模型学习用户的主题浏览模式并利用它采集更多的主题网页;实验结果表明:方法能采集大量与指定主题相关的高质量网页,主题爬行效率优于Best-First主题爬虫。 展开更多
关键词 主题爬虫 隐马尔科夫模型 向量空间模型 主题相关度 垂直搜索引擎
下载PDF
基于隐主题马尔科夫模型的多特征自动文摘 被引量:4
8
作者 刘江鸣 徐金安 张玉洁 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期187-193,共7页
基于隐主题马尔科夫模型,消除LDA主题模型的主题独立假设,使得文摘生成过程中充分利用文章的结构信息,并结合基于内容的多特征方法提高文摘质量。提出在不破坏文章结构的前提下,从单文档扩展到多文档的自动文摘策略,最终搭建完善的自动... 基于隐主题马尔科夫模型,消除LDA主题模型的主题独立假设,使得文摘生成过程中充分利用文章的结构信息,并结合基于内容的多特征方法提高文摘质量。提出在不破坏文章结构的前提下,从单文档扩展到多文档的自动文摘策略,最终搭建完善的自动文摘系统。在DUC2007标准数据集上的实验证明了隐主题马尔科夫模型和文档特征的优越性,所实现的自动文摘系统ROUGE值有明显提高。 展开更多
关键词 隐主题马尔科夫模型 多特征 多文档自动文摘
下载PDF
结合DCTM与HMM的音乐分类方法 被引量:4
9
作者 徐桂彬 邓伟 《计算机工程与设计》 CSCD 北大核心 2012年第11期4245-4249,4332,共6页
改进相关主题模型(correlated topic model,CTM)使其具有动态性,提出了动态相关主题模型(dynamic correla-ted topic model,DCTM),使用变分卡尔曼滤波推断模型的隐含主题参数。将DCTM作为降维模型与隐马尔克夫模型(hidden Markov model,... 改进相关主题模型(correlated topic model,CTM)使其具有动态性,提出了动态相关主题模型(dynamic correla-ted topic model,DCTM),使用变分卡尔曼滤波推断模型的隐含主题参数。将DCTM作为降维模型与隐马尔克夫模型(hidden Markov model,HMM)相结合对音乐分类。这一方法将音乐片段分割为等长的小片段,将小片段的声学特征向量通过相似性比较转化为单词序列,通过DCTM将单词序列转换为主题向量。将主题向量输入HMM得出分类结果。由于DCTM的动态建模,更好地提取对分类有用的信息,因此增强了方法的分类能力。实验验证了方法的有效性。 展开更多
关键词 音乐分类 相关主题模型 动态相关主题模型 变分卡尔曼滤波 隐马尔克夫模型
下载PDF
基于轨迹分析的行人异常行为识别 被引量:8
10
作者 胡瑗 夏利民 王嘉 《计算机工程与科学》 CSCD 北大核心 2017年第11期2054-2059,共6页
提出一种基于轨迹分段主题模型的异常行为检测方法。为了解决跟踪偏差引起的轨迹不连续问题,首先使用模糊聚类算法对所有的轨迹进行全局聚类,然后对每一类轨迹采用分段采样的方式对段内轨迹点使用主题模型LDA进行局部聚类;以最大概率的... 提出一种基于轨迹分段主题模型的异常行为检测方法。为了解决跟踪偏差引起的轨迹不连续问题,首先使用模糊聚类算法对所有的轨迹进行全局聚类,然后对每一类轨迹采用分段采样的方式对段内轨迹点使用主题模型LDA进行局部聚类;以最大概率的轨迹点作为视觉单词,每类轨迹表示成一系列视觉单词的集合,在此基础上建立局部隐马尔科夫模型HMM;最后通过轨迹匹配的方法进行异常轨迹识别。在CAVIAR数据库上的实验结果表明,该算法能识别多种异常行为,提高了异常行为检测的准确率。 展开更多
关键词 模糊聚类 主题模型LDA 局部隐马尔科夫模型 异常轨迹
下载PDF
基于LSA-HMM的新闻主题分割
11
作者 史倩 《计算机与现代化》 2012年第5期27-30,34,共5页
主题分割技术是快速并有效地对新闻故事节目进行检索和管理的基础。传统的基于隐马尔可夫模型(HiddenMarkov Model,HMM)的主题分割技术仅使用主题和主题之间的转移寻找主题边界进行新闻分割,并未考虑各主题中词与词之间存在的潜在语义... 主题分割技术是快速并有效地对新闻故事节目进行检索和管理的基础。传统的基于隐马尔可夫模型(HiddenMarkov Model,HMM)的主题分割技术仅使用主题和主题之间的转移寻找主题边界进行新闻分割,并未考虑各主题中词与词之间存在的潜在语义关系。本文提出一种基于隐马尔科夫模型的改进算法。该算法使用潜在语义分析(Latent Se-mantic Analysis,LSA)对词频向量进行特征提取和降维,考虑了词与词之间的上下文关系,通过聚类得到文档类别信息,以LSA特征和主题类别作为HMM的观测和隐状态,这样同时考虑了主题之间的关系,最终实现对文本主题分割。数据实验表明,该算法具有较好的分割性能。 展开更多
关键词 主题分割 隐马尔可夫模型 主题模型 潜在语义分析
下载PDF
基于LDA-HMM的知识流动模式发现研究 被引量:5
12
作者 张瑞 董庆兴 《情报科学》 CSSCI 北大核心 2020年第6期67-75,共9页
【目的/意义】知识流动模式能够动态反映知识形态在知识流动中发生的变化,体现学科系统中不同知识体系的发展规律,因此从科学文献角度出发研究知识流动模式的发现具有重要意义。【方法/过程】以图书情报学领域为例,设计一种组合方法,首... 【目的/意义】知识流动模式能够动态反映知识形态在知识流动中发生的变化,体现学科系统中不同知识体系的发展规律,因此从科学文献角度出发研究知识流动模式的发现具有重要意义。【方法/过程】以图书情报学领域为例,设计一种组合方法,首先采用LDA(latent Dirichlet allocation,隐狄里克雷分布)主题模型进行领域内文献的主题聚类,然后提取引用和被引用数据构成主题知识流入、流出特征,并作为HMM(Hidden Markov Model,隐马尔可夫模型)训练模型的观测值序列,识别不同的隐藏状态,进一步对模型的拟合效果进行评估,最后通过聚类分析将隐藏状态序列与知识流动模式一一对应,揭示图书情报学领域存在不同知识流动模式的差异性。【结果/结论】实验结果显示,不同类型的知识流动模式具有不同的表现形式,反映了领域内部主题研究的演变历程,为理解和认识科学发展趋势具有一定价值。 展开更多
关键词 知识流动 LDA主题模型 隐马尔可夫模型 聚类 图书情报学
原文传递
知识主题演化预测研究 被引量:2
13
作者 田亚丹 《情报科学》 CSSCI 北大核心 2021年第6期123-133,共11页
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利用马尔可夫和隐马尔可夫构... 【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主题间的对比。 展开更多
关键词 知识主题 演化预测 云计算 马尔可夫模型 隐马尔可夫模型
原文传递
Human behavior clustering for anomaly detection
14
作者 Xudong ZHU Zhijing LIU 《Frontiers of Materials Science》 SCIE CSCD 2011年第3期279-289,共11页
This paper aims to address the problem of modeling human behavior patterns captured in surveil- lance videos for the application of online normal behavior recognition and anomaly detection. A novel framework is develo... This paper aims to address the problem of modeling human behavior patterns captured in surveil- lance videos for the application of online normal behavior recognition and anomaly detection. A novel framework is developed for automatic behavior modeling and online anomaly detection without the need for manual labeling of the training data set. The framework consists of the following key components. 1) A compact and effective behavior representation method is developed based on spatial-temporal interest point detection. 2) The natural grouping of behavior patterns is determined through a novel clustering algorithm, topic hidden Markov model (THMM) built upon the existing hidden Markov model (HMM) and latent Dirichlet allocation (LDA), which overcomes the current limitations in accuracy, robustness, and computational efficiency. The new model is a four- level hierarchical Bayesian model, in which each video is modeled as a Markov chain of behavior patterns where each behavior pattern is a distribution over some segments of the video. Each of these segments in the video can be modeled as a mixture of actions where each action is a distribution over spatial-temporal words. 3) An online anomaly measure is introduced to detect abnormal behavior, whereas normal behavior is recognized by runtime accumulative visual evidence using the likelihood ratio test (LRT) method. Experimental results demonstrate the effectiveness and robustness of our approach using noisy and sparse data sets collected from a real surveillance scenario. 展开更多
关键词 computer vision unsupervised anomalydetection Bayesian topic models hidden markov model(HMM) spatiotemporal interest points
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部