期刊文献+
共找到304篇文章
< 1 2 16 >
每页显示 20 50 100
Semi-supervised learning based probabilistic latent semantic analysis for automatic image annotation 被引量:1
1
作者 田东平 《High Technology Letters》 EI CAS 2017年第4期367-374,共8页
In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficie... In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation. 展开更多
关键词 automatic image annotation semi-supervised learning probabilistic latent semantic analysis(Plsa) transductive support vector machine(TSVM) image segmentation image retrieval
下载PDF
Metaphor Analysis Method Based on Latent Semantic Analysis
2
作者 陶然 卫亚萍 杨唐峰 《Journal of Donghua University(English Edition)》 CAS 2021年第1期83-90,共8页
Current research on metaphor analysis is generally knowledge-based and corpus-based,which calls for methods of automatic feature extraction and weight calculation.Combining natural language processing(NLP),latent sema... Current research on metaphor analysis is generally knowledge-based and corpus-based,which calls for methods of automatic feature extraction and weight calculation.Combining natural language processing(NLP),latent semantic analysis(LSA),and Pearson correlation coefficient,this paper proposes a metaphor analysis method for extracting the content words from both literal and metaphorical corpus,calculating correlation degree,and analyzing their relationships.The value of the proposed method was demonstrated through a case study by using a corpus with keyword“飞翔(fly)”.When compared with the method of Pearson correlation coefficient,the experiment shows that the LSA can produce better results with greater significance in correlation degree.It is also found that the number of common words that appeared in both literal and metaphorical word bags decreased with the correlation degree.The case study also revealed that there are more nouns appear in literal corpus,and more adjectives and adverbs appear in metaphorical corpus.The method proposed will benefit NLP researchers to develop the required step-by-step calculation tools for accurate quantitative analysis. 展开更多
关键词 latent semantic analysis(lsa) METAPHOR natural language processing(NLP) pearson correlation coefficient
下载PDF
Fast and robust training of a probabilistic latent semantic analysis model by the parallel learning and data segmentation
3
作者 Masaharu Kato Tetsuo Kosaka +1 位作者 Akinori Ito Shozo Makino 《通讯和计算机(中英文版)》 2009年第5期28-35,共8页
关键词 LAM MIP Plsa 计算机通讯
下载PDF
基于MapReduce的并行PLSA算法及在文本挖掘中的应用 被引量:7
4
作者 李宁 罗文娟 +2 位作者 庄福振 何清 史忠植 《中文信息学报》 CSCD 北大核心 2015年第2期79-86,共8页
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来... PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。 展开更多
关键词 概率主题模型 MAPREDUCE 并行 语义分析
下载PDF
基于PLSA方法的用户兴趣聚类 被引量:5
5
作者 陈冬玲 王大玲 +1 位作者 于戈 于芳 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第1期53-56,共4页
为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴... 为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合. 展开更多
关键词 用户兴趣描述文件 Plsa 潜语义空间 ZIPF分布 用户兴趣层次树
下载PDF
一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT 被引量:7
6
作者 戴新宇 田宝明 +1 位作者 周俊生 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1626-1630,共5页
本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有... 本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有训练数据和测试数据进行统一建模,挖掘数据中潜在的多种结构信息.LSASGT引入潜在语义分析技术用于构造文本图表示模型,在能够反映人的分类标准的潜在语义特征空间中,描述文本之间的语义相关性;基于这样的文本表示,利用半监督的直推式谱图算法进行文本分类.在基准英文文本分类数据集Reuters21578和中文文本分类数据集Tan-Corp上的实验结果表明,本文给出的LSASGT文本分类方法获得了较好的分类结果. 展开更多
关键词 直推式谱图 潜在语义分析 文本分类 图构造
下载PDF
基于LSA降维的KNN文本分类算法 被引量:7
7
作者 李良俊 张斌 杨明 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2007年第2期33-36,共4页
针对文本自动分类问题,提出了一种基于LSA降维的KNN改进算法.通过对文本特征向量运用LSA理论进行降维处理,可以有效提高KNN算法的运行效率,提高分类精度.实验证明,改进的KNN算法具有很好的性能.
关键词 潜在语义分析 KNN 文本分类 降维
下载PDF
基于LSA降维的RPCL文本聚类算法 被引量:5
8
作者 高茂庭 王正欧 《计算机工程与应用》 CSCD 北大核心 2006年第23期138-140,共3页
文本聚类中,存在诸如文本特征空间维数巨大、聚类的数目不能事先确定等问题。隐含语义分析方法可以对文本特征空间作降维处理并有效地凸现出文本和词条之间的语义关系;次胜者受罚竞争学习规则可以进行有效的聚类并自动确定适当的聚类数... 文本聚类中,存在诸如文本特征空间维数巨大、聚类的数目不能事先确定等问题。隐含语义分析方法可以对文本特征空间作降维处理并有效地凸现出文本和词条之间的语义关系;次胜者受罚竞争学习规则可以进行有效的聚类并自动确定适当的聚类数目。将这两种方法结合进行文本聚类可以在一定程度上解决维数和聚类数的问题,实验表明,这种方法能够收到较好的聚类效果,同时,实验还验证了向量余弦距离比欧氏距离方法更适合于文本相似度的计算。 展开更多
关键词 文本聚类 次胜者受罚竞争学习 隐含语义分析 聚类分析
下载PDF
基于PLSA模型的文本分割 被引量:25
9
作者 石晶 戴国忠 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期242-248,共7页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度量手段及边界估计策略,同时考虑相邻句重复的未登录词对相似值的影响,其最佳结果表明,片段边界的识别错误率为6·06%,远远低于其他同类算法· 展开更多
关键词 文本分割 概率潜在语义分析 相似性度量 边界识别
下载PDF
使用LSA降维的改进ART2神经网络文本聚类 被引量:4
10
作者 徐晨凯 高茂庭 《计算机工程与应用》 CSCD 2014年第24期133-138,177,共7页
针对文本数据高维度的特点和聚类的动态性要求,结合隐含语义分析(LSA)降维,提出一种改进的ART2神经网络文本聚类算法,通过LSA凸显文本和词条之间的语义关系,减少无用噪声,降低数据维度和计算复杂性;采用改进的折中学习方法,减少计算步骤... 针对文本数据高维度的特点和聚类的动态性要求,结合隐含语义分析(LSA)降维,提出一种改进的ART2神经网络文本聚类算法,通过LSA凸显文本和词条之间的语义关系,减少无用噪声,降低数据维度和计算复杂性;采用改进的折中学习方法,减少计算步骤,加快ART2神经网络计算速度,并利用最近邻动态重组方法提高ART2网络聚类的稳定性,减弱算法对样本输入顺序的依赖。实验表明,改进的文本聚类算法能有效地实现动态文本聚类。 展开更多
关键词 ART2神经网络 最近邻 隐含语义分析(lsa) 降维 文本聚类 聚类分析
下载PDF
TCBLSA:一种中文文本聚类新方法 被引量:15
11
作者 王国勇 徐建锁 《计算机工程》 CAS CSCD 北大核心 2004年第5期21-22,37,共3页
根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异... 根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异值分解(SVD),有效地降低了向量空间的维数,从而提高了文本聚类的精度和速度。 展开更多
关键词 文本聚类 隐含语义分析 奇异值分解 向量空间模型
下载PDF
LSA在中文短文自动判分系统中的应用研究 被引量:4
12
作者 李莉 张太红 《计算机工程与应用》 CSCD 北大核心 2007年第20期177-180,共4页
对潜在语义分析(Latent Semantic Analysis,LSA)的理论基础进行了介绍,研究了潜在语义分析在中文短文写作自动评分领域的应用方法。从136名大学生的短文写作试卷着手,对比了不同的语义空间构造方法和不同数据标准化方法对机器自动评分... 对潜在语义分析(Latent Semantic Analysis,LSA)的理论基础进行了介绍,研究了潜在语义分析在中文短文写作自动评分领域的应用方法。从136名大学生的短文写作试卷着手,对比了不同的语义空间构造方法和不同数据标准化方法对机器自动评分结果的影响,探讨了SVD的作用和奇异值个数K的取值规律,比较了LSA对不同类型学生的短文写作自动评分结果的差异。通过与两名教师对学生短文写作评分的比较表明,使用机器对主观题进行自动评分是可行的,该方法为自动化考试系统试题多样性提供了有效的解决方案。 展开更多
关键词 潜在语义分析 奇异值分解 主观题自动判分
下载PDF
基于WordNet本体和PLSA的语义Web服务发现 被引量:2
13
作者 邢少敏 周伯生 陈天影 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第11期1325-1329,共5页
提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服... 提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服务描述文档集合为文档集,组成词汇-文档矩阵,以该矩阵为输入,使用PLSA方法对服务集进行分类,并将用户请求带入PLSA模型,确定其所属的类;然后在类中以标注后的输出参数为键,含有这个输出的服务的列表为键值,建立一个映射表,查找与用户请求的输出相似的映射表键,进而找出对应的键值,即服务列表;最后根据QoS(Quality of Service)和用户请求中的输入参数确定满足条件的服务结果集合.在415个Web服务组成的数据集上的测试结果表明,性能较其他方法有优势,召回率和R准确率也得到了改善. 展开更多
关键词 本体标注 概率潜在语义分析 WEB服务 索引 分类 语义 服务发现
下载PDF
集成模糊LSA与MIL的图像分类算法 被引量:4
14
作者 李大湘 彭进业 李展 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第10期1796-1802,1809,共8页
针对自然图像的分类问题,提出一种基于模糊潜在语义分析(LSA)与直推式支持向量机(TSVM)相结合的半监督多示例学习(MIL)算法.该算法将图像当作多示例包,分割区域的底层视觉特征当作包中的示例.为了将MIL问题转化成单示例问题进行求解,首... 针对自然图像的分类问题,提出一种基于模糊潜在语义分析(LSA)与直推式支持向量机(TSVM)相结合的半监督多示例学习(MIL)算法.该算法将图像当作多示例包,分割区域的底层视觉特征当作包中的示例.为了将MIL问题转化成单示例问题进行求解,首先利用K-Means方法对训练包中所有的示例进行聚类,建立"视觉词汇表";然后根据"视觉字"与示例之间的距离定义模糊隶属度函数,建立模糊"词-文档"矩阵,再采用LSA方法获得多示例包(图像)的模糊潜在语义模型,并通过该模型将每个多示例包转化成单个样本;采用半监督的TSVM训练分类器,以利用未标注图像来提高分类精度.基于Corel图像库的对比实验结果表明,与传统的LSA方法相比,模糊LSA的分类准确率提高了5.6%,且性能优于其他分类方法. 展开更多
关键词 多示例学习 场景图像分类 模糊潜在语义分析
下载PDF
基于多特征融合与PLSA-GMM的图像自动标注 被引量:6
15
作者 孙君顶 李海华 +1 位作者 靳姣林 张毅 《测控技术》 CSCD 2017年第4期31-35,39,共6页
为减少图像检索中图像信息的缺失与语义鸿沟的影响,提出了一种基于多特征融合与PLSA-GMM的图像自动标注方法。首先,提取图像的颜色特征、形状特征和纹理特征,三者融合作为图像的底层特征;然后,基于概率潜在语义分析(PLSA)与高斯混合模型... 为减少图像检索中图像信息的缺失与语义鸿沟的影响,提出了一种基于多特征融合与PLSA-GMM的图像自动标注方法。首先,提取图像的颜色特征、形状特征和纹理特征,三者融合作为图像的底层特征;然后,基于概率潜在语义分析(PLSA)与高斯混合模型(GMM)建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用Corel 5k数据库进行验证,实验结果证明了本文方法的有效性。 展开更多
关键词 多特征融合 概率潜在语义分析 高斯混合模型 图像自动标注
下载PDF
概率潜在语义分析(PLSA)在中药新药处方发现中的应用 被引量:3
16
作者 雷蕾 张早华 +3 位作者 温先荣 亢力 张竹绿 刘森 《世界科学技术-中医药现代化》 北大核心 2012年第5期1976-1980,共5页
目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角... 目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角度对候选方进行分析,最后结合专家智慧在候选方的基础上给出具有开发潜力的新药处方。结果:筛选出治疗该病的中药核心组合,并证明了PLSA算法用于中药处方发现具有一定的可靠性和稳定性。同时专家从计算机筛选出的处方中选出有开发前景的两首方。结论:PLSA算法在治疗缺血性心脑血管疾病中药处方发现中有着广阔的应用前景。 展开更多
关键词 概率潜在语义分析 缺血性心脑血管疾病 中药处方发现
下载PDF
LSA和MD5算法在垃圾邮件过滤系统的应用研究 被引量:3
17
作者 张秋余 孙晶涛 +1 位作者 闫晓文 黄文汉 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第6期1223-1227,共5页
随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而... 随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Nave Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Nave Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。 展开更多
关键词 邮件指纹 特征提取 潜在语义分析 MD5算法 滑动窗口 垃圾邮件过滤
下载PDF
基于PLSA-BOW模型的医学影像分类算法的研究 被引量:2
18
作者 曹春红 赵大哲 +1 位作者 张斌 刘岳 《计算机应用与软件》 CSCD 北大核心 2012年第12期103-107,共5页
随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模... 随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模型中的语义问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。实验结果表明,PLSA-BOW模型用于医学影像分类,具有较高的分类精度。 展开更多
关键词 医学影像分类 词袋模型 概率潜在语义分析算法
下载PDF
基于标准化高斯pLSA协同过滤的用电量预测模型 被引量:3
19
作者 刘粤钳 姚红玉 《控制理论与应用》 EI CAS CSCD 北大核心 2008年第5期929-932,937,共5页
现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内... 现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内容的协同过滤技术去建立用电量预测模型,从而利用统计学习的方法避开了对影响系统输出的隐含变元的寻找与刻画.采用MATLAB进行数值仿真实验的结果表明该算法相比于神经网络和灰色预测在准确度方面具有优势. 展开更多
关键词 概率潜在语义分析 协同过滤 示象模型 用电量预测模型
下载PDF
基于LSA和结构特性的微博话题检测 被引量:2
20
作者 曹春萍 崔海船 《计算机应用研究》 CSCD 北大核心 2015年第9期2720-2723,共4页
针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在... 针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在语义分析(LSA)的微博文本模型以解决数据稀疏性问题,最后结合时间信息给出新的相似度计算方法,并采用凝聚层次聚类法检测微博话题。实验结果表明,提出的方法降低了话题检测的错失率,大大提高了微博话题检测的性能。 展开更多
关键词 微博 话题检测 文本聚类 语义空间 潜在语义分析
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部