期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于分层狄利克雷过程模型的文本分割 被引量:2
1
作者 李天彩 王波 +1 位作者 席耀一 张佳明 《数据采集与处理》 CSCD 北大核心 2017年第2期408-416,共9页
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process... 文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process,HDP)模型的文本分割方法。首先使用HDP模型获取文本在主题空间的向量表示,然后将主题向量用于C99分割算法实现文本分割,最后使用两种优化策略对结果进行优化。实验结果表明,基于HDP模型的方法能够摆脱对人工设置主题个数的依赖,有效提高了文本分割的性能。 展开更多
关键词 主题模型 文本分割 分层狄利克雷过程 CRF构造
下载PDF
基于DMC-HMM模型的视频异常行为检测 被引量:2
2
作者 岳猛 郭春生 《杭州电子科技大学学报(自然科学版)》 2014年第3期21-24,共4页
针对视频检测算法中选取合适的图像语义特征提取算法的困难和检测计算效率不高的问题,该文提出了一种基于狄利克雷多项式共轭隐马尔科夫模型的视频异常行为检测算法,首先提出了狄利克雷多项式共轭模型用于抽取视频的底层特征的语义特征... 针对视频检测算法中选取合适的图像语义特征提取算法的困难和检测计算效率不高的问题,该文提出了一种基于狄利克雷多项式共轭隐马尔科夫模型的视频异常行为检测算法,首先提出了狄利克雷多项式共轭模型用于抽取视频的底层特征的语义特征,接着将该模型与隐马尔可夫模型相结合进行视频异常行为的检测。通过校园人群流动和交通灯车辆流动实验证明,该方法具有较高的计算效率和检测性能。 展开更多
关键词 异常行为检测 光流语义特征抽取 狄利克雷多项式共轭模型 狄利克雷多项式共轭隐马尔科夫模型
下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:1
3
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
下载PDF
液体火箭发动机的分层贝叶斯变分推理故障诊断方法 被引量:1
4
作者 刘久富 丁晓彬 +4 位作者 汪恒宇 王彪 刘海阳 杨忠 王志胜 《北京理工大学学报》 EI CAS CSCD 北大核心 2022年第3期289-296,共8页
针对稀疏数据场景下,传统的多项式-狄利克雷模型存在一定的分类精度问题,提出一种基于变分推理的分层贝叶斯网络的参数估计方法.通过在传统的多项式-狄利克雷模型中引入超先验,构建出的分层多项式-狄利克雷模型可用于贝叶斯网络中的条... 针对稀疏数据场景下,传统的多项式-狄利克雷模型存在一定的分类精度问题,提出一种基于变分推理的分层贝叶斯网络的参数估计方法.通过在传统的多项式-狄利克雷模型中引入超先验,构建出的分层多项式-狄利克雷模型可用于贝叶斯网络中的条件分布估计.对分层多项式-狄利克雷模型的先验依赖结构进行分析研究,提出一种快速准确的自组织变分推理算法.与传统的分类模型相比,本文提出的分层多项式-狄利克雷模型在处理小数据集液体火箭发动机的故障分类中有显著的性能提高. 展开更多
关键词 贝叶斯网络 液体火箭发动机 分层多项式-狄利克雷模型 变分推理算法
下载PDF
基于HDP-CHMM的机械设备性能退化评估 被引量:6
5
作者 王恒 季云 +1 位作者 朱龙彪 刘肖 《振动.测试与诊断》 EI CSCD 北大核心 2018年第4期733-737,共5页
针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能... 针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能退化评估方法。该方法利用分层狄利克雷模型的分层聚类原理,在狄利克雷过程(Dirichlet process,简称DP)模型的基础上进行扩展,利用多组关联数据实现了模型结构根据观测数据的自适应变化和动态调整,获得设备运行过程中的最优退化状态数,并结合连续隐马尔可夫模型(continuous hidden Markov model,简称CHMM)良好的分析和建模能力,获得设备退化状态转移路径,实现机械设备运行过程中的退化状态识别和性能评估。利用滚动轴承全寿命数据的多组特征值进行了应用研究,并与基于K-S检验算法的机械设备零部件性能退化评估方法进行了比较。结果表明,HDP-CHMM模型可以对轴承实际运行状态转移过程进行建模,有效识别轴承运行中的不同退化状态,为基于状态的设备维修提供了理论指导。 展开更多
关键词 分层狄利克雷模型 连续隐马尔可夫模型 性能退化评估 滚动轴承
下载PDF
基于HDP-HMM的机械设备故障预测方法研究 被引量:6
6
作者 王恒 周易文 +1 位作者 瞿家明 季云 《振动与冲击》 EI CSCD 北大核心 2019年第8期173-179,共7页
针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,... 针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,获得设备运行过程中的隐状态数;基于HDP-HMM所建立的退化状态动态转移关系,确定设备早期故障点和功能故障点,实现设备的健康等级评估和故障预测。利用美国USFI/UCR智能维护系统中心提供的滚动轴承全寿命数据进行了应用研究。结果表明,针对多观测序列,HDP-HMM能有效实现组合聚类,识别结果不依赖于算法初始参数的选择,具有较强的鲁棒性;与基于K-S检验的退化评估算法比较表明,HDP-HMM更能有效描述设备实际退化过程。 展开更多
关键词 分层狄利克雷过程-隐马尔科夫模型(HDP-HMM) 退化状态 故障预测
下载PDF
一种基于标签的改进主题演化模型
7
作者 姚立 张曦煌 《计算机工程》 CAS CSCD 北大核心 2019年第4期205-210,216,共7页
传统主题演化(ToT)模型通常忽略原始数据中的标签元信息。为此,建立一种基于标签的改进ToT模型。针对传统权重算法忽略词汇在文档集类别间和类别内的分布对权重产生影响的问题,结合文档标题特征,使用改进词频-反重力距算法进行权重分析... 传统主题演化(ToT)模型通常忽略原始数据中的标签元信息。为此,建立一种基于标签的改进ToT模型。针对传统权重算法忽略词汇在文档集类别间和类别内的分布对权重产生影响的问题,结合文档标题特征,使用改进词频-反重力距算法进行权重分析,以扩展模型的生成过程。在ToT模型的基础上引入原始文档的标签属性,构建改进模型并使用吉布斯采样算法估计其参数。实验结果表明,与ToT模型相比,该模型具有较高的泛化能力。 展开更多
关键词 标签 主题演化模型 狄利克雷分配 词频-反重力距算法 吉布斯采样
下载PDF
面向产品属性的用户情感模型 被引量:4
8
作者 贾闻俊 张晖 +2 位作者 杨春明 赵旭剑 李波 《计算机应用》 CSCD 北大核心 2016年第1期175-180,共6页
传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过... 传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过程(HDP)将名词实体聚类形成产品属性并自动获取其数量;然后,结合产品属性中名词实体的权重和评价短语以及情感词典作为先验,利用潜在狄利克雷分布(LDA)对产品属性进行情感分类。实验结果表明,该模型具有较高的情感分类准确率,情感分类平均准确率达87%。该模型与传统的情感模型相比在抽取产品属性和评价短语的情感分类上具有较高的准确率。 展开更多
关键词 情感模型 细粒度 产品属性 分层狄利克雷过程 潜在狄利克雷分布
下载PDF
基于标签的半监督HDP文本分类主题模型 被引量:4
9
作者 李永忠 郑滔 《模式识别与人工智能》 EI CSCD 北大核心 2017年第12期1138-1148,共11页
分层狄利克雷过程(HDP)主题模型从数据中自动学习结构最优的主题集,但往往不满足实际语义要求,而现有的一些带标签的主题模型又需要设定很难界定的参数.因此,文中在已知部分语义标签和标签确定度的基础上,分别提出半监督HDP主题模型(SLH... 分层狄利克雷过程(HDP)主题模型从数据中自动学习结构最优的主题集,但往往不满足实际语义要求,而现有的一些带标签的主题模型又需要设定很难界定的参数.因此,文中在已知部分语义标签和标签确定度的基础上,分别提出半监督HDP主题模型(SLHDP)和随机簇的准确度评价指标.该模型为已知的语义标签赋予较高权重,结合狄利克雷过程有限空间无线划分的特性,并通过中国餐馆过程建模生成.在多个中英文数据集中的实验表明,在大规模数据集的文本分类中,SLHDP模型能够使主题集的构成更合理. 展开更多
关键词 标签 半监督 分层狄利克雷过程(HDP) 主题模型 随机簇
下载PDF
兴趣点数据的城市功能区识别方法对比
10
作者 崔方迪 袁璞 《北京测绘》 2024年第12期1652-1658,共7页
城市功能区作为社会经济活动载体,对城市资源配置及规划管理具有重要意义。传统城市功能区识别方法存在主观性强、效率低、识别精度低等缺陷。鉴于此,本研究引入自然语言处理(NLP)技术中的潜在狄利克雷分布(LDA)模型和词频-逆文档频率(T... 城市功能区作为社会经济活动载体,对城市资源配置及规划管理具有重要意义。传统城市功能区识别方法存在主观性强、效率低、识别精度低等缺陷。鉴于此,本研究引入自然语言处理(NLP)技术中的潜在狄利克雷分布(LDA)模型和词频-逆文档频率(TF-IDF)模型,挖掘城市兴趣点(POI)数据语义信息,揭示区域性潜在的功能利用模式。首先,城市空间被分割为500 m×500 m粒度的格网,将POI数据映射到对应的地理网格单元,并基于词袋模型构建语料库。随后,分别采用LDA模型和TF-IDF模型计算格网单元和POI数据之间的分布模式来识别城市功能区。最后,将城市功能区识别结果与百度电子地图及街景影像进行比对来评估精度。实验结果表明,LDA模型算法精度达78%,优于精度为63%的TF-IDF模型。LDA算法能更加准确地识别城市功能区的功能利用类型,且能够在TF-IDF模型较难区分的功能区上取得较好识别效果。本研究揭示了POI数据与城市功能区之间的潜在语义关系,可作为城市功能区研究的参考和补充,可辅助城市规划者动态监测城市结构,对未来城市更新与发展进行布局引导。 展开更多
关键词 城市功能区 兴趣点(POI) 自然语言处理(NLP) 词频-逆文档频率模型(TF-IDF) 潜在狄利克雷分布(LDA)
下载PDF
面向微博文本流的负面情感突发话题检测 被引量:5
11
作者 李艳红 赵宏伟 +1 位作者 王素格 李德玉 《计算机应用》 CSCD 北大核心 2020年第12期3458-3464,共7页
如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话... 如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话题检测(NE-BTD)算法。首先,将微博中的主题词对的加速度和负面情感强度变化率作为负面情感突发话题的判定依据;然后,利用突发词对的速度确定负面情感突发话题的窗口范围;最后,使用一种基于吉布斯采样的狄利克雷多项式混合模型(GSDMM)聚类算法得到窗口中负面情感突发话题的主题结构。在实验中将所提出的NE-BTD算法与已有的一种基于情感方法的话题检测(EBM-TD)算法进行对比,结果表明所提出的NE-BTD算法相较EBM-TD算法准确率和召回率至少提高了20%,并且可以至少提前40 min检出负面情感突发话题。 展开更多
关键词 微博 文本流 突发话题 负面情感 狄利克雷多项式混合模型
下载PDF
HDP采样消息传递算法 被引量:1
12
作者 王杰 严建峰 +1 位作者 刘晓升 杨璐 《计算机应用研究》 CSCD 北大核心 2016年第7期1994-1998,共5页
分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法... 分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法与LDA以及HDP算法在混淆度方面进行对比。实验结果表明,该算法相比HDP采样算法收敛较快,最终也能收敛到LDA模型最优主题数目下的混淆度。 展开更多
关键词 消息传递算法 分层狄利克雷过程 采样 无参主题模型
下载PDF
HDP消息传递算法
13
作者 王杰 严建峰 +1 位作者 刘晓升 杨璐 《微电子学与计算机》 CSCD 北大核心 2016年第3期142-146,151,共6页
分层狄利克雷过程(HDP)可以视为潜在狄利克雷分配(LDA)主题模型在无参方面的扩展,解决了传统主题模型中选择主题数目的问题.消息传递算法则是从消息因子图模型的角度出发进而解决贝叶斯后验概率推断问题.提出将消息传递算法应用到分层... 分层狄利克雷过程(HDP)可以视为潜在狄利克雷分配(LDA)主题模型在无参方面的扩展,解决了传统主题模型中选择主题数目的问题.消息传递算法则是从消息因子图模型的角度出发进而解决贝叶斯后验概率推断问题.提出将消息传递算法应用到分层狄利克雷过程模型上的方案,并从最大期望算法的角度来证明该算法的收敛性,最终从混淆度的角度将该算法与传统算法进行对比.实验结果表明消息传递算法在混淆度方面相比其他算法有明显的优势,且收敛速度较快. 展开更多
关键词 分层狄利克雷过程 消息传递算法 无参数主题模型 最大期望算法
下载PDF
基于非参数贝叶斯谐波阻抗估计的谐波责任区分 被引量:2
14
作者 江友华 刘子瑜 +2 位作者 张煜 杨兴武 吴卫民 《浙江电力》 2021年第3期59-65,共7页
线性回归法在背景谐波电压波动的情况下估计谐波阻抗有较大误差,其诸多改进方法又普遍具有局限性。为此,基于非参数贝叶斯估计提出一种普适性方法。将背景谐波电压视为隐变量,用GMM(高斯混合模型)建模,并指出GMM的参数在实际工程背景下... 线性回归法在背景谐波电压波动的情况下估计谐波阻抗有较大误差,其诸多改进方法又普遍具有局限性。为此,基于非参数贝叶斯估计提出一种普适性方法。将背景谐波电压视为隐变量,用GMM(高斯混合模型)建模,并指出GMM的参数在实际工程背景下的意义;将GMM参数、线性模型参数建模为狄利克雷过程混合模型,并推导出其后验分布;利用马尔科夫链-蒙特卡洛采样方法从后验分布中抽取样本,基于样本进行贝叶斯估计,求解谐波阻抗和背景谐波电压工况数,进而对谐波责任进行评估。将IEEE 14节点测试系统与实测案例结合进行仿真,通过非参数贝叶斯估计法与线性回归法仿真结果的对比,验证了非参数贝叶斯估计法的有效性。 展开更多
关键词 隐变量 高斯混合模型 狄利克雷过程混合模型 马尔科夫链-蒙特卡洛采样 背景谐波电压工况 谐波责任区分
下载PDF
面向短文本情感分析的词扩充LDA模型 被引量:3
15
作者 沈冀 马志强 +1 位作者 李图雅 张力 《山东大学学报(工学版)》 CAS 北大核心 2018年第3期120-126,共7页
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation,LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强... 针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation,LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。 展开更多
关键词 短文本 词扩充 情感分析 隐含狄利克雷分配 文档-主题生成模型 无监督学习
原文传递
基于数据驱动可调鲁棒的冷-热-电联供综合能源系统日前调度优化 被引量:8
16
作者 陈晓东 马越 +1 位作者 陈贤邦 刘洋 《电力建设》 CSCD 北大核心 2021年第1期28-40,共13页
冷-热-电联供综合能源系统(integrated energy system with combined cool,heat and power system,IES-CCHP)能够就地消纳分布式风电、光伏,也能够同时满足系统内电动汽车用户的充电需求。然而,电动汽车充电需求、风电出力、光伏出力的... 冷-热-电联供综合能源系统(integrated energy system with combined cool,heat and power system,IES-CCHP)能够就地消纳分布式风电、光伏,也能够同时满足系统内电动汽车用户的充电需求。然而,电动汽车充电需求、风电出力、光伏出力的随机性严重影响了IES-CCHP运行的经济性。因此,采用两阶段可调鲁棒优化为IES-CCHP制定日前调度策略以提升系统运行经济性。日前阶段在观测到随机变量前制定能够应对最恶劣运行场景的日前调度策略;实时阶段在确认随机变量实际值后决策实时调度计划修正日前调度策略。优化目标为运行两阶段运行总成本最小,模型采用非精确狄利克雷模型挖掘历史数据构建不确定集描述随机变量,并进一步采用对偶理论、大M法、列与约束生成(columnand-constraint generation,C&CG)等方法,迭代求解上述两阶段模型。最后,通过算例分析证明了所提模型与方法的有效性。 展开更多
关键词 --电联供综合能源系统(IES-CCHP) 可调鲁棒优化 数据驱动 非精确狄利克雷模型 分布式能源
原文传递
基于多示例学习的异常行为检测方法 被引量:11
17
作者 崔永艳 高阳 《模式识别与人工智能》 EI CSCD 北大核心 2011年第6期862-868,共7页
在基于轨迹分析的异常行为检测方法中,被标记为异常的轨迹往往仅在整条轨迹的某个局部存在异常,轨迹的其余部分都是正常行为.然而,传统的基于整条轨迹建模的方法很难检测轨迹的局部异常.针对上述问题,提出一种在多示例学习框架下基于轨... 在基于轨迹分析的异常行为检测方法中,被标记为异常的轨迹往往仅在整条轨迹的某个局部存在异常,轨迹的其余部分都是正常行为.然而,传统的基于整条轨迹建模的方法很难检测轨迹的局部异常.针对上述问题,提出一种在多示例学习框架下基于轨迹分段的异常行为检测方法.该方法首先根据轨迹的曲率,将轨迹分割成若干相互独立的子段.然后采用层次狄利克雷过程-隐马尔科夫模型对每个子段建模.最后在多示例学习框架下,以整条轨迹为包,正常轨迹为负包,异常轨迹为正包,轨迹子段为包的示例进行学习.通过实验验证,该方法在准确率和召回率上都优于传统的基于轨迹建模的方法. 展开更多
关键词 异常行为检测 轨迹分段 层次狄利克雷过程-隐马尔科夫模型(HDP—HMM) 多示例学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部