期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于概率隐含语义分析模型的人脸识别算法 被引量:3
1
作者 邹修明 孙怀江 杨赛 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第5期594-598,共5页
该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进... 该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进行识别。Multi-PIE和人脸识别竞赛(FRGC)数据库上的实验结果表明,该文方法的性能优于目前多个人脸识别方法。 展开更多
关键词 人脸识别 概率隐含语义分析 词袋模型
下载PDF
概率隐含语义分析模型在行为识别中的编码与归一化方法研究 被引量:1
2
作者 徐勤军 周同驰 +1 位作者 周琳 吴镇扬 《信号处理》 CSCD 北大核心 2018年第7期766-775,共10页
在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较... 在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较多噪声成分的情况下性能甚至会有所提升。在KTH和UT-interaction数据库上的实验表明,编码和归一化方法的适当组合可以显著提高模型的性能。在UT-interaction数据库的两个子集上识别精度分别达到了当前最好的结果 96.44%、95%,其中在数据集1上采用稀疏的时空兴趣点特征,得到了94.24%的识别精度。 展开更多
关键词 行为识别 主题模型 概率隐含语义分析 局域软分配
下载PDF
基于概率潜语义分析模型的高光谱影像层次聚类分析 被引量:5
3
作者 易文斌 慎利 +1 位作者 齐银凤 唐宏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第9期2471-2475,共5页
将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模... 将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模型的文档;再次,利用多种最佳聚类类别数估计方法确定PLSA模型的潜语义主题的个数;进而估计PLSA模型的参数,获得概率主题内视觉词的概率分布和每个分割体中各概率主题的混合比例;最后利用统计模式识别方法获取每个影像文档中各个视觉词对应的潜语义主题的类型,从而实现影像的层次聚类分析。相关实验结果表明,本文的层次聚类结果较K-MEANS算法、ISODATA算法聚类结果的面向对象特性更明显,其与真实地物的空间分布更接近。 展开更多
关键词 概率语义分析模型 高光谱影像 层次聚类 语义信息
下载PDF
目标语义概率模型在类目标识别和地物场景分析中的算法研究
4
作者 刘玮 陈新武 田金文 《计算机科学》 CSCD 北大核心 2009年第7期273-277,共5页
基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通... 基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通过计算后验概率可以实现目标语义类别的识别。目标概率模型通过EM算法获得模型估计参数。实验结果显示,在识别复杂背景中的目标达到了很好的效果。场景分析中根据图像中各局部区域与目标语义的概率分布可以实现场景中感兴趣区域的标注,实验结果说明此方法有可行性。 展开更多
关键词 类目标识别 场景分析 语义概率模型 模型
下载PDF
基于隐含语义分析的微博话题发现方法 被引量:36
5
作者 马雯雯 魏文晗 邓一贵 《计算机工程与应用》 CSCD 2014年第1期96-100,共5页
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话... 随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。 展开更多
关键词 隐含语义分析 向量空间模型 话题发现 微博 两阶段聚类 LATENT SEMANTIC Analysis(LSA) Vector Space Model(VSM)
下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
6
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率潜在语义分析模型 话题挖掘 情绪演进 情绪分析
下载PDF
基于隐含主题模型的异常行为分析
7
作者 赵龙 郭立 +2 位作者 谢锦生 刘皓 陆海先 《中国科学院研究生院学报》 CAS CSCD 北大核心 2013年第3期387-393,共7页
针对目前多数异常行为分析方法没有考虑场景,提出一种基于隐含主题模型的异常行为分析方法.提取场景的颜色和纹理特征,利用K-means对特征聚类,形成视觉单词,利用pLSA模型将视觉单词分为若干语义主题区域,生成场景描述.组合轨迹特征与场... 针对目前多数异常行为分析方法没有考虑场景,提出一种基于隐含主题模型的异常行为分析方法.提取场景的颜色和纹理特征,利用K-means对特征聚类,形成视觉单词,利用pLSA模型将视觉单词分为若干语义主题区域,生成场景描述.组合轨迹特征与场景语描述,生成组合特征向量,再利用CRF对组合特征向量建模,通过训练估计模型参数,利用模型推断,分析异常行为.实验表明,本文方法对特定场景的异常行为可以较为准确地分析. 展开更多
关键词 隐含主题模型 异常行为分析 plsa CRF 全局行为
下载PDF
基于因子分析和概率神经网络的情感语义提取
8
作者 杨强 马森 《四川理工学院学报(自然科学版)》 CAS 2009年第4期62-64,共3页
文章首先对当前的情感语义提取技术进行了综合分析,并用颜色及形状特征作为情感特征参数,采用因子分析法建立情感空间模型,再用概率神经网络法实现特征空间到情感空间的映射,最后通过已建立好的情感语义知识库获取视频的情感语义文本描述。
关键词 因子分析 概率神经网络 情感语义 情感模型
下载PDF
基于概率潜在语义分析的Blog个性化查询扩展研究
9
作者 崔琳 谈成访 吴孝银 《安阳师范学院学报》 2013年第2期39-42,共4页
随着Web2.0技术的日益成熟和Blog技术的发展,Blog页面的数量呈指数级上升,只靠基于关键字匹配的Blog搜索引擎已满足不了用户的需要。传统Blog搜索引擎的搜索效率达不到用户个性化要求,受概率潜在语义分析技术研究的启发,将概率潜在语义... 随着Web2.0技术的日益成熟和Blog技术的发展,Blog页面的数量呈指数级上升,只靠基于关键字匹配的Blog搜索引擎已满足不了用户的需要。传统Blog搜索引擎的搜索效率达不到用户个性化要求,受概率潜在语义分析技术研究的启发,将概率潜在语义分析模型用于Blog日志查询,根据用户的兴趣和个性化特点进行检索,返回与用户需求相关的查询结果。实验结果表明,相对于传统的向量空间模型和潜在语义分析模型,基于概率潜在语义分析模型的Blog日志查询在平均精度和召回率上得到了显著提高。 展开更多
关键词 概率潜在语义分析 博客 查询扩展 向量空间模型 潜在语义分析
下载PDF
基于隐含语义分析的在线新闻话题发现方法 被引量:1
10
作者 武高敏 张宇晨 韩京宇 《计算机技术与发展》 2016年第9期1-7,共7页
互联网的飞速发展和海量数据的不断增长,使得如何快速、有效地识别当前新闻热点信息成为迫切需求。在线新闻话题发现已成为当前研究热点。对于在线环境下的新闻文本特征表示,传统向量空间模型随着数据的增长向量维度不断增长,使得数据... 互联网的飞速发展和海量数据的不断增长,使得如何快速、有效地识别当前新闻热点信息成为迫切需求。在线新闻话题发现已成为当前研究热点。对于在线环境下的新闻文本特征表示,传统向量空间模型随着数据的增长向量维度不断增长,使得数据稀疏和同名异议问题愈加明显,导致文本相似度难以准确度量。使用基于特征加权的隐含语义分析将高维、稀疏的词-文档矩阵映射到隐藏的k维语义空间,充分挖掘词、文档之间的语义信息,以提高同主题文档间的语义相似度,克服在线环境下文本稀疏性和同名异议问题。此外,对于不断增长的大规模新闻数据,传统聚类算法存在时间复杂度过高或者输入依赖等问题,难以快速、有效地得到理想结果。基于新闻报道在时间上的顺序性和相关性,提出改进的Single-pass在线增量聚类算法检测话题类,并引入话题热度值的概念来筛选当前关注度较高的热点话题。实验结果表明,该方法能够有效提高话题检测的准确率,实现基于真实新闻数据集的在线话题捕捉。 展开更多
关键词 话题发现 向量空间模型 隐含语义分析 文本聚类 奇异值分解
下载PDF
基于概率潜在语义分析和Adaboost算法的文本分类技术研究
11
作者 刘苗 谢邦昌 《统计与决策》 CSSCI 北大核心 2010年第19期21-23,共3页
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的... 文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。 展开更多
关键词 文本自动分类 概率潜在语义分析(plsa) ADABOOST TEM迭代
下载PDF
基于概率潜在语义分析优化拼音汉字转换 被引量:1
12
作者 郑叶清 刘功申 《信息技术》 2016年第11期33-37,41,共6页
文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强... 文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强模型性能,优化了拼音汉字转换模型应用效果。 展开更多
关键词 概率潜在语义分析 拼音汉字转换 统计语言模型
下载PDF
语义分析与词频统计相结合的中文文本相似度量方法研究 被引量:42
13
作者 华秀丽 朱巧明 李培峰 《计算机应用研究》 CSCD 北大核心 2012年第3期833-836,共4页
基于统计的文本相似度量方法大多先采用TF-IDF方法将文本表示为词频向量,然后利用余弦计算文本之间的相似度。此类方法由于忽略文本中词项的语义信息,不能很好地反映文本之间的相似度。基于语义的方法虽然能够较好地弥补这一缺陷,但需... 基于统计的文本相似度量方法大多先采用TF-IDF方法将文本表示为词频向量,然后利用余弦计算文本之间的相似度。此类方法由于忽略文本中词项的语义信息,不能很好地反映文本之间的相似度。基于语义的方法虽然能够较好地弥补这一缺陷,但需要知识库来构建词语之间的语义关系。研究了以上两类文本相似度计算方法的优缺点,提出了一种新颖的文本相似度量方法,该方法首先对文本进行预处理,然后挑选TF-IDF值较高的词项作为特征项,再借助HowNet语义词典和TF-IDF方法对特征项进行语义分析和词频统计相结合的文本相似度计算,最后利用文本相似度在基准文本数据集合上进行聚类实验。实验结果表明,采用提出的方法得到的F-度量值明显优于只采用TF-IDF方法或词语语义的方法,从而证明了提出的文本相似度计算方法的有效性。 展开更多
关键词 向量空间模型 语义分析 词频 概率分布 文本相似度
下载PDF
基于PLSA-BOW模型的医学影像分类算法的研究 被引量:2
14
作者 曹春红 赵大哲 +1 位作者 张斌 刘岳 《计算机应用与软件》 CSCD 北大核心 2012年第12期103-107,共5页
随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模... 随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模型中的语义问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。实验结果表明,PLSA-BOW模型用于医学影像分类,具有较高的分类精度。 展开更多
关键词 医学影像分类 词袋模型 概率潜在语义分析算法
下载PDF
基于标准化高斯pLSA协同过滤的用电量预测模型 被引量:3
15
作者 刘粤钳 姚红玉 《控制理论与应用》 EI CAS CSCD 北大核心 2008年第5期929-932,937,共5页
现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内... 现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内容的协同过滤技术去建立用电量预测模型,从而利用统计学习的方法避开了对影响系统输出的隐含变元的寻找与刻画.采用MATLAB进行数值仿真实验的结果表明该算法相比于神经网络和灰色预测在准确度方面具有优势. 展开更多
关键词 概率潜在语义分析 协同过滤 示象模型 用电量预测模型
下载PDF
推荐系统中的隐语义模型研究 被引量:6
16
作者 李琳娜 江雪琴 《情报工程》 2016年第4期30-39,共10页
隐语义模型是一种有效的隐含语义分析技术,其核心思想是通过潜在特征联系用户和物品。本文从理论方法的角度,详细介绍了隐语义模型的工作原理、模型表示、学习方法和评价指标等,并通过具体实验分别讨论几种典型隐语义模型算法的推荐效果... 隐语义模型是一种有效的隐含语义分析技术,其核心思想是通过潜在特征联系用户和物品。本文从理论方法的角度,详细介绍了隐语义模型的工作原理、模型表示、学习方法和评价指标等,并通过具体实验分别讨论几种典型隐语义模型算法的推荐效果,以全面认识和理解该模型在推荐系统中的应用特点。 展开更多
关键词 语义模型 推荐系统 隐含语义分析 评价指标
下载PDF
基于文本挖掘与语义识别的用户消费行为分析 被引量:2
17
作者 周化 张沁蕙 袁志 《企业技术开发》 2016年第7期7-10,共4页
如何更好地利用来源错综复杂的数据,给企业带来相应效益是各企业亟待解决的问题。文章以京东商城空调类家电产品的用户评论数据为主要分析源,对用户行为数据进行文本挖掘找出用户的真实需求。对抓取的用户评论数据进行语义识别和词频统... 如何更好地利用来源错综复杂的数据,给企业带来相应效益是各企业亟待解决的问题。文章以京东商城空调类家电产品的用户评论数据为主要分析源,对用户行为数据进行文本挖掘找出用户的真实需求。对抓取的用户评论数据进行语义识别和词频统计,完成原始数据的去噪、降维等数据清理;建立商品目标集的特征属性表和概率模型,对待研数据进行聚类分析;最后,对聚类的结果进行时间序列分析,从而获得较有价值的结论,形成基于用户评论数据的建议、推断和决策。 展开更多
关键词 数据挖掘 语义识别 词频统计 概率模型 时间序列分析
下载PDF
一种基于PLSA和词袋模型的图像分类新方法 被引量:1
18
作者 田甜 张振国 《咸阳师范学院学报》 2010年第4期50-55,共6页
提出一种基于概率潜在语义分析模型(PLSA)和词袋模型(bag-of-words)的图像分类新方法。该方法首先利用尺度无关特征变换(SIFT)提取图像中的关键点,然后采用概率潜在语义分析模型去发现图像中的物体分布的信息,最后利用词袋模型进行图像... 提出一种基于概率潜在语义分析模型(PLSA)和词袋模型(bag-of-words)的图像分类新方法。该方法首先利用尺度无关特征变换(SIFT)提取图像中的关键点,然后采用概率潜在语义分析模型去发现图像中的物体分布的信息,最后利用词袋模型进行图像分类。通过在大规模数据集上的实验表明,新的图像分类算法在分类精度上明显提高。 展开更多
关键词 概率潜在语义分析模型 词袋模型 图像分类
下载PDF
基于高斯pLSA模型与项目的协同过滤混合推荐 被引量:5
19
作者 陈登科 孔繁胜 《计算机工程与应用》 CSCD 北大核心 2010年第23期209-211,234,共4页
协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通... 协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通过建立用户群体混合模型和基于目标项目的邻居集进行预测推荐。实验证明该算法与其他协同过滤算法相比具有更高的准确率。 展开更多
关键词 概率潜在语义分析 高斯模型 基于项目的协同过滤 基于模型的协同过滤 混合推荐
下载PDF
一种基于语义分析的热点新闻发现方法 被引量:4
20
作者 曹通 《计算机与现代化》 2017年第6期30-33,39,共5页
随着互联网的发展和普及,互联网新闻报道已是人们获取社会信息的主要手段,如何快速准确地获取互联网新闻热点话题是一个急需解决的问题。本文使用LDA(Latent Dirichlet Allocation)和BTM(Biterm Topic Model)主题模型,充分考虑新闻标题... 随着互联网的发展和普及,互联网新闻报道已是人们获取社会信息的主要手段,如何快速准确地获取互联网新闻热点话题是一个急需解决的问题。本文使用LDA(Latent Dirichlet Allocation)和BTM(Biterm Topic Model)主题模型,充分考虑新闻标题和新闻正文对新闻热点检测影响的不同,分别对新闻的正文和标题进行语义分析,新闻标题使用BTM模型,新闻正文使用LDA模型,提取主题特征向量,并将2种语义特征进行融合,形成全文的语义特征,然后通过改进的聚类算法,进行聚类,在此基础上引入新闻热度的定义,通过热度公式计算新闻的热度,利用计算出的热度值排序得到最近一段时间的热点新闻。通过在爬取的新闻数据上的实验,验证了本文方法的有效性和实用性。 展开更多
关键词 隐含语义分析 新闻热度 话题检测 LDA与BTM模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部