期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
Semi-supervised learning based probabilistic latent semantic analysis for automatic image annotation 被引量:1
1
作者 Tian Dongping 《High Technology Letters》 EI CAS 2017年第4期367-374,共8页
In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficie... In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation. 展开更多
关键词 automatic image annotation semi-supervised learning probabilistic latent semantic analysis(plsa) transductive support vector machine(TSVM) image segmentation image retrieval
下载PDF
Fast and robust training of a probabilistic latent semantic analysis model by the parallel learning and data segmentation
2
作者 Masaharu Kato Tetsuo Kosaka +1 位作者 Akinori Ito Shozo Makino 《通讯和计算机(中英文版)》 2009年第5期28-35,共8页
关键词 LAM MIP plsa 计算机通讯
下载PDF
Online belief propagation algorithm for probabilistic latent semantic analysis 被引量:2
3
作者 Yun YE Shengrong GONG +3 位作者 Chunping LIU Jia ZENG Ning JIA YiZHANG 《Frontiers of Computer Science》 SCIE EI CSCD 2013年第4期526-535,共10页
Probabilistic latent semantic analysis (PLSA) is a topic model for text documents, which has been widely used in text mining, computer vision, computational biology and so on. For batch PLSA inference algorithms, th... Probabilistic latent semantic analysis (PLSA) is a topic model for text documents, which has been widely used in text mining, computer vision, computational biology and so on. For batch PLSA inference algorithms, the required memory size grows linearly with the data size, and handling massive data streams is very difficult. To process big data streams, we propose an online belief propagation (OBP) algorithm based on the improved factor graph representation for PLSA. The factor graph of PLSA facilitates the classic belief propagation (BP) algorithm. Furthermore, OBP splits the data stream into a set of small segments, and uses the estimated parameters of previous segments to calculate the gradient descent of the current segment. Because OBP removes each segment from memory after processing, it is memoryefficient for big data streams. We examine the performance of OBP on four document data sets, and demonstrate that OBP is competitive in both speed and accuracy for online ex- pectation maximization (OEM) in PLSA, and can also give a more accurate topic evolution. Experiments on massive data streams from Baidu further confirm the effectiveness of the OBP algorithm. 展开更多
关键词 probabilistic latent semantic analysis topicmodels expectation maximization belief propagation
原文传递
基于PLSA模型的文本分割 被引量:25
4
作者 石晶 戴国忠 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期242-248,共7页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度量手段及边界估计策略,同时考虑相邻句重复的未登录词对相似值的影响,其最佳结果表明,片段边界的识别错误率为6·06%,远远低于其他同类算法· 展开更多
关键词 文本分割 概率潜在语义分析 相似性度量 边界识别
下载PDF
基于MapReduce的并行PLSA算法及在文本挖掘中的应用 被引量:7
5
作者 李宁 罗文娟 +2 位作者 庄福振 何清 史忠植 《中文信息学报》 CSCD 北大核心 2015年第2期79-86,共8页
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来... PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。 展开更多
关键词 概率主题模型 MAPREDUCE 并行 语义分析
下载PDF
基于PLSA方法的用户兴趣聚类 被引量:5
6
作者 陈冬玲 王大玲 +1 位作者 于戈 于芳 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第1期53-56,共4页
为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴... 为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合. 展开更多
关键词 用户兴趣描述文件 plsa 潜语义空间 ZIPF分布 用户兴趣层次树
下载PDF
基于PLSA-BOW模型的医学影像分类算法的研究 被引量:2
7
作者 曹春红 赵大哲 +1 位作者 张斌 刘岳 《计算机应用与软件》 CSCD 北大核心 2012年第12期103-107,共5页
随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模... 随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模型中的语义问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。实验结果表明,PLSA-BOW模型用于医学影像分类,具有较高的分类精度。 展开更多
关键词 医学影像分类 词袋模型 概率潜在语义分析算法
下载PDF
基于WordNet本体和PLSA的语义Web服务发现 被引量:2
8
作者 邢少敏 周伯生 陈天影 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第11期1325-1329,共5页
提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服... 提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服务描述文档集合为文档集,组成词汇-文档矩阵,以该矩阵为输入,使用PLSA方法对服务集进行分类,并将用户请求带入PLSA模型,确定其所属的类;然后在类中以标注后的输出参数为键,含有这个输出的服务的列表为键值,建立一个映射表,查找与用户请求的输出相似的映射表键,进而找出对应的键值,即服务列表;最后根据QoS(Quality of Service)和用户请求中的输入参数确定满足条件的服务结果集合.在415个Web服务组成的数据集上的测试结果表明,性能较其他方法有优势,召回率和R准确率也得到了改善. 展开更多
关键词 本体标注 概率潜在语义分析 WEB服务 索引 分类 语义 服务发现
下载PDF
基于多特征融合与PLSA-GMM的图像自动标注 被引量:6
9
作者 孙君顶 李海华 +1 位作者 靳姣林 张毅 《测控技术》 CSCD 2017年第4期31-35,39,共6页
为减少图像检索中图像信息的缺失与语义鸿沟的影响,提出了一种基于多特征融合与PLSA-GMM的图像自动标注方法。首先,提取图像的颜色特征、形状特征和纹理特征,三者融合作为图像的底层特征;然后,基于概率潜在语义分析(PLSA)与高斯混合模型... 为减少图像检索中图像信息的缺失与语义鸿沟的影响,提出了一种基于多特征融合与PLSA-GMM的图像自动标注方法。首先,提取图像的颜色特征、形状特征和纹理特征,三者融合作为图像的底层特征;然后,基于概率潜在语义分析(PLSA)与高斯混合模型(GMM)建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用Corel 5k数据库进行验证,实验结果证明了本文方法的有效性。 展开更多
关键词 多特征融合 概率潜在语义分析 高斯混合模型 图像自动标注
下载PDF
一种基于改进PLSA和案例推理的行为识别算法 被引量:1
10
作者 涂宏斌 岳艳艳 +1 位作者 周新建 罗锟 《计算机科学》 CSCD 北大核心 2017年第6期283-289,共7页
针对行为人发生的行为因遮挡或者自遮挡可能导致行为歧义性的问题,提出基于改进PLSA和案例推理算法的行为识别方法。该算法既可以克服传统PLSA算法中生成式模型对观察特征序列的独立性假设会导致过拟合的缺点,又可以消除由于遮挡等原因... 针对行为人发生的行为因遮挡或者自遮挡可能导致行为歧义性的问题,提出基于改进PLSA和案例推理算法的行为识别方法。该算法既可以克服传统PLSA算法中生成式模型对观察特征序列的独立性假设会导致过拟合的缺点,又可以消除由于遮挡等原因引起的歧义性带来的识别精度降低问题。实验表明该方法能有效地提高人体行为识别准确率。 展开更多
关键词 行为识别 歧义性行为 时空兴趣点 plsa 案例推理
下载PDF
基于标准化高斯pLSA协同过滤的用电量预测模型 被引量:3
11
作者 刘粤钳 姚红玉 《控制理论与应用》 EI CAS CSCD 北大核心 2008年第5期929-932,937,共5页
现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内... 现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内容的协同过滤技术去建立用电量预测模型,从而利用统计学习的方法避开了对影响系统输出的隐含变元的寻找与刻画.采用MATLAB进行数值仿真实验的结果表明该算法相比于神经网络和灰色预测在准确度方面具有优势. 展开更多
关键词 概率潜在语义分析 协同过滤 示象模型 用电量预测模型
下载PDF
融合PLSA和随机游走模型的自动图像标注 被引量:5
12
作者 田东平 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1899-1905,共7页
为了有效克服语义鸿沟问题,提出一种融合概率潜语义分析(PLSA)和随机游走(random walk,RW)模型的图像语义标注方法.从已标注图像的文本信息出发构建一个非对等模态的PLSA模型,以此计算未知图像的初始语义标注;,基于初始标注的语义信息... 为了有效克服语义鸿沟问题,提出一种融合概率潜语义分析(PLSA)和随机游走(random walk,RW)模型的图像语义标注方法.从已标注图像的文本信息出发构建一个非对等模态的PLSA模型,以此计算未知图像的初始语义标注;,基于初始标注的语义信息和与之关联的图像的视觉信息构造标签相似性图,以有效避免图像标注过程中因多义词而引入的噪声数据;在所构造的相似性图上执行随机游走过程,进一步挖掘和分析初始标注之间的潜在语义关联,从而获得未知图像的精确化语义标注.通过在Corel5k图像集上的实验表明,本文方法(PLSA-RW)的性能明显优于若干经典的自动图像标注方法,而且具有更好的检索性能. 展开更多
关键词 图像语义标注 概率潜语义分析 随机游走 语义鸿沟 图像检索
下载PDF
User-oriented web search based on PLSA
13
作者 于芳 陈冬玲 +2 位作者 王大玲 于戈 鲍玉斌 《Journal of Southeast University(English Edition)》 EI CAS 2007年第3期347-351,共5页
In order to solve the problem that current search engines provide query-oriented searches rather than user-oriented ones, and that this improper orientation leads to the search engines' inability to meet the personal... In order to solve the problem that current search engines provide query-oriented searches rather than user-oriented ones, and that this improper orientation leads to the search engines' inability to meet the personalized requirements of users, a novel method based on probabilistic latent semantic analysis (PLSA) is proposed to convert query-oriented web search to user-oriented web search. First, a user profile represented as a user' s topics of interest vector is created by analyzing the user' s click through data based on PLSA, then the user' s queries are mapped into categories based on the user' s preferences, and finally the result list is re-ranked according to the user' s interests based on the new proposed method named user-oriented PageRank (UOPR). Experiments on real life datasets show that the user-oriented search system that adopts PLSA takes considerable consideration of user preferences and better satisfies a user' s personalized information needs. 展开更多
关键词 user-oriented search underlying search intention probabilistic latent semantic analysis (plsa user profile topics of interest
下载PDF
一种基于PLSA和AGPSO的文本属性约简方法及其分类器
14
作者 童亚拉 《计算机应用与软件》 CSCD 2010年第9期20-22,87,共4页
将概率潜在语义分析PLSA(probabilistic latent semantic analysis)和自适应广义粒子群算法AGPSO(adaptive general particle swarm optimization)相结合,提出了一种文本特征降维新方法,进而实现了基于PLSA和AGPSO的网页分类器。采用概... 将概率潜在语义分析PLSA(probabilistic latent semantic analysis)和自适应广义粒子群算法AGPSO(adaptive general particle swarm optimization)相结合,提出了一种文本特征降维新方法,进而实现了基于PLSA和AGPSO的网页分类器。采用概率潜在语义分析将语义关系体现在VSM(Vector Space Model)中,通过EM算法有效地降低向量空间的维数;设计交叉操作模拟粒子飞行速度的变化,变异操作保持种群的多样性,同时引入自适应策略动态调整变异概率,以求最优特征子集。在用自适应广义粒子群算法约简前,先用概率潜在语义分析对原始特征空间约简,得到中间特征子集,然后再用自适应广义粒子群算法继续约简,充分发挥两者的优势。实验表明此算法能有效降低文本维数,提高分类精度。 展开更多
关键词 网页分类 属性约简 广义粒子群 概率潜在语义分析 自适应策略
下载PDF
基于PLSA的个性化Web信息检索系统
15
作者 吴启明 阮忠 《软件导刊》 2008年第8期149-151,共3页
分析了用户兴趣特点及变化规律,将用户兴趣分为突出兴趣和次要兴趣两类。采用Web浏览内容挖掘和行为分析相结合的方法进行用户建模,对收藏文档采用PLSA(Probabilistic Latent Semantic Analysis)生成用户突出兴趣和潜在兴趣,对用户查询... 分析了用户兴趣特点及变化规律,将用户兴趣分为突出兴趣和次要兴趣两类。采用Web浏览内容挖掘和行为分析相结合的方法进行用户建模,对收藏文档采用PLSA(Probabilistic Latent Semantic Analysis)生成用户突出兴趣和潜在兴趣,对用户查询请求进行扩展以提高查全率。通过对查询结果的二次重排提高TOP-X查准率,从而实现了用户个性化的信息检索。 展开更多
关键词 概率潜在语义分析 个性化 信息检索 WEB信息检索系统
下载PDF
协同推荐pLSA模型的动态修正 被引量:1
16
作者 李超然 徐雁斐 张亮 《计算机工程》 CAS CSCD 北大核心 2005年第20期46-48,共3页
提出一种对协同推荐的pLSA模型进行修正的算法,在推荐的过程中通过逐步修正PLSA模型中用户的兴趣模型,来适应用户兴趣的变化。通过实验证明该算法能够取得更好的推荐准确度。
关键词 推荐系统 probabilistic latent semantic analysis(pLAS) 协同过滤
下载PDF
基于高斯pLSA模型与项目的协同过滤混合推荐 被引量:5
17
作者 陈登科 孔繁胜 《计算机工程与应用》 CSCD 北大核心 2010年第23期209-211,234,共4页
协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通... 协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通过建立用户群体混合模型和基于目标项目的邻居集进行预测推荐。实验证明该算法与其他协同过滤算法相比具有更高的准确率。 展开更多
关键词 概率潜在语义分析 高斯模型 基于项目的协同过滤 基于模型的协同过滤 混合推荐
下载PDF
基于PLSA主题模型的多标记文本分类 被引量:5
18
作者 蒋铭初 潘志松 尤峻 《数据采集与处理》 CSCD 北大核心 2016年第3期541-547,共7页
为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,... 为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,以文本的主题分布表示一篇文本,在去噪的同时可以大大降低数据维度。在此基础上利用多标记假设重用算法(Multi-label algorithm of hypothesis reuse,MAHR)进行分类,由于经过PLSA降维后的特征组本身就具有语义信息,因此算法能够精确地挖掘出多标记之间的关系并用于训练基分类器,从而避免了人为输入标记关系的缺陷。实验验证了该方法能够充分利用PLSA降维得到的语义信息来改善多标记文本分类的性能。 展开更多
关键词 文本分类 多标记学习 概率隐语义分析 多标记假设重用算法
下载PDF
基于PLSA和BoW的高分遥感影像小型港口检测 被引量:3
19
作者 毕奇 童心 +3 位作者 张济勇 许凯 张涵 秦昆 《应用科学学报》 CAS CSCD 北大核心 2019年第3期301-312,共12页
高分辨率遥感影像可以为小型港口的监管提供有效途径.针对小型港口形态多样、特征难以描述等问题,研究了一种基于概率潜在语义分析(probabilistic latent semantic analysis, PLSA)模型和词袋(bag of words, BoW)模型的小型港口检测方法... 高分辨率遥感影像可以为小型港口的监管提供有效途径.针对小型港口形态多样、特征难以描述等问题,研究了一种基于概率潜在语义分析(probabilistic latent semantic analysis, PLSA)模型和词袋(bag of words, BoW)模型的小型港口检测方法.该方法首先提取水岸线以缩小搜索范围;然后将灰度直方图、归一化差分水体指数、分形维数特征引入PLSA模型生成特征描述集,将加速鲁棒特征向量引入BoW模型生成视觉词典;根据以上特征描述集和构建的小型港口样本库训练SVM分类器,利用22幅影像进行小型港口检测实验.实验结果表明,相比于只使用常见单一特征或单一模型,该方法的检测结果更佳,耗时更少. 展开更多
关键词 高分遥感影像 小型港口检测 概率潜在语义分析 词袋模型 水岸线提取
下载PDF
Fusing PLSA model and Markov random fields for automatic image annotation 被引量:1
20
作者 田东平 Zhao Xiaofei Shi Zhongzhi 《High Technology Letters》 EI CAS 2014年第4期409-414,共6页
A novel image auto-annotation method is presented based on probabilistic latent semantic analysis(PLSA) model and multiple Markov random fields(MRF).A PLSA model with asymmetric modalities is first constructed to esti... A novel image auto-annotation method is presented based on probabilistic latent semantic analysis(PLSA) model and multiple Markov random fields(MRF).A PLSA model with asymmetric modalities is first constructed to estimate the joint probability between images and semantic concepts,then a subgraph is extracted served as the corresponding structure of Markov random fields and inference over it is performed by the iterative conditional modes so as to capture the final annotation for the image.The novelty of our method mainly lies in two aspects:exploiting PLSA to estimate the joint probability between images and semantic concepts as well as multiple MRF to further explore the semantic context among keywords for accurate image annotation.To demonstrate the effectiveness of this approach,an experiment on the Corel5 k dataset is conducted and its results are compared favorably with the current state-of-the-art approaches. 展开更多
关键词 automatic image annotation probabilistic latent semantic analysis (plsa expectation maximization Markov random fields (MRF) image retrieval
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部