期刊文献+
共找到119篇文章
< 1 2 6 >
每页显示 20 50 100
Semi-supervised learning based probabilistic latent semantic analysis for automatic image annotation 被引量:1
1
作者 Tian Dongping 《High Technology Letters》 EI CAS 2017年第4期367-374,共8页
In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficie... In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation. 展开更多
关键词 automatic image annotation semi-supervised learning probabilistic latent semantic analysis(PLSA) transductive support vector machine(TSVM) image segmentation image retrieval
下载PDF
Fast and robust training of a probabilistic latent semantic analysis model by the parallel learning and data segmentation
2
作者 Masaharu Kato Tetsuo Kosaka +1 位作者 Akinori Ito Shozo Makino 《通讯和计算机(中英文版)》 2009年第5期28-35,共8页
关键词 LAM MIP PLSA 计算机通讯
下载PDF
Semantic Based Greedy Levy Gradient Boosting Algorithm for Phishing Detection
3
作者 R.Sakunthala Jenni S.Shankar 《Computer Systems Science & Engineering》 SCIE EI 2022年第5期525-538,共14页
The detection of phishing and legitimate websites is considered a great challenge for web service providers because the users of such websites are indistinguishable.Phishing websites also create traffic in the entire ... The detection of phishing and legitimate websites is considered a great challenge for web service providers because the users of such websites are indistinguishable.Phishing websites also create traffic in the entire network.Another phishing issue is the broadening malware of the entire network,thus highlighting the demand for their detection while massive datasets(i.e.,big data)are processed.Despite the application of boosting mechanisms in phishing detection,these methods are prone to significant errors in their output,specifically due to the combination of all website features in the training state.The upcoming big data system requires MapReduce,a popular parallel programming,to process massive datasets.To address these issues,a probabilistic latent semantic and greedy levy gradient boosting(PLS-GLGB)algorithm for website phishing detection using MapReduce is proposed.A feature selection-based model is provided using a probabilistic intersective latent semantic preprocessing model to minimize errors in website phishing detection.Here,the missing data in each URL are identified and discarded for further processing to ensure data quality.Subsequently,with the preprocessed features(URLs),feature vectors are updated by the greedy levy divergence gradient(model)that selects the optimal features in the URL and accurately detects the websites.Thus,greedy levy efficiently differentiates between phishing websites and legitimate websites.Experiments are conducted using one of the largest public corpora of a website phish tank dataset.Results show that the PLS-GLGB algorithm for website phishing detection outperforms stateof-the-art phishing detection methods.Significant amounts of phishing detection time and errors are also saved during the detection of website phishing. 展开更多
关键词 Web service providers probabilistic intersective latent semantic greedy levy DIVERGENCE gradient phishing detection big data
下载PDF
Generating Markov Logic Networks Rulebase Based on Probabilistic Latent Semantics Analysis
4
作者 Shan Cui Tao Zhu +3 位作者 Xiao Zhang Liming Chen Lingfeng Mao Huansheng Ning 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2023年第5期952-964,共13页
Human Activity Recognition(HAR)has become a subject of concern and plays an important role in daily life.HAR uses sensor devices to collect user behavior data,obtain human activity information and identify them.Markov... Human Activity Recognition(HAR)has become a subject of concern and plays an important role in daily life.HAR uses sensor devices to collect user behavior data,obtain human activity information and identify them.Markov Logic Networks(MLN)are widely used in HAR as an effective combination of knowledge and data.MLN can solve the problems of complexity and uncertainty,and has good knowledge expression ability.However,MLN structure learning is relatively weak and requires a lot of computing and storage resources.Essentially,the MLN structure is derived from sensor data in the current scene.Assuming that the sensor data can be effectively sliced and the sliced data can be converted into semantic rules,MLN structure can be obtained.To this end,we propose a rulebase building scheme based on probabilistic latent semantic analysis to provide a semantic rulebase for MLN learning.Such a rulebase can reduce the time required for MLN structure learning.We apply the rulebase building scheme to single-person indoor activity recognition and prove that the scheme can effectively reduce the MLN learning time.In addition,we evaluate the parameters of the rulebase building scheme to check its stability. 展开更多
关键词 Markov Logic Network(MLN) structure learning rulebase construction probabilistic latent semantics
原文传递
Online belief propagation algorithm for probabilistic latent semantic analysis 被引量:2
5
作者 Yun YE Shengrong GONG +3 位作者 Chunping LIU Jia ZENG Ning JIA YiZHANG 《Frontiers of Computer Science》 SCIE EI CSCD 2013年第4期526-535,共10页
Probabilistic latent semantic analysis (PLSA) is a topic model for text documents, which has been widely used in text mining, computer vision, computational biology and so on. For batch PLSA inference algorithms, th... Probabilistic latent semantic analysis (PLSA) is a topic model for text documents, which has been widely used in text mining, computer vision, computational biology and so on. For batch PLSA inference algorithms, the required memory size grows linearly with the data size, and handling massive data streams is very difficult. To process big data streams, we propose an online belief propagation (OBP) algorithm based on the improved factor graph representation for PLSA. The factor graph of PLSA facilitates the classic belief propagation (BP) algorithm. Furthermore, OBP splits the data stream into a set of small segments, and uses the estimated parameters of previous segments to calculate the gradient descent of the current segment. Because OBP removes each segment from memory after processing, it is memoryefficient for big data streams. We examine the performance of OBP on four document data sets, and demonstrate that OBP is competitive in both speed and accuracy for online ex- pectation maximization (OEM) in PLSA, and can also give a more accurate topic evolution. Experiments on massive data streams from Baidu further confirm the effectiveness of the OBP algorithm. 展开更多
关键词 probabilistic latent semantic analysis topicmodels expectation maximization belief propagation
原文传递
基于多重启发式规则的英文特征值提取算法研究
6
作者 郑海燕 《自动化技术与应用》 2023年第11期95-97,共3页
提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算... 提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算法具体流程,并将所提出的基于多重启发式规则的英文特征值提取算法与基于词频的常规算法进行对比,取得了较为理想的特征值提取效果。 展开更多
关键词 英文文本 特征值提取 概率启发 语义启发
下载PDF
在线课程推荐系统综述 被引量:6
7
作者 余鹏 刘星雨 +3 位作者 程颢 杨佳琦 陈国华 贺超波 《计算机工程与应用》 CSCD 北大核心 2023年第22期1-14,共14页
在线教育的快速发展使得在线课程数量爆炸式增长,学习者很容易陷入“课程过载”带来的课程信息获取效率低下的问题,这推动了在线课程推荐系统的产生和发展。目前在线课程推荐系统已成为研究热点,并且在该领域中提出了大量方法,有必要对... 在线教育的快速发展使得在线课程数量爆炸式增长,学习者很容易陷入“课程过载”带来的课程信息获取效率低下的问题,这推动了在线课程推荐系统的产生和发展。目前在线课程推荐系统已成为研究热点,并且在该领域中提出了大量方法,有必要对最新的研究进展进行系统的梳理分析。首先归纳总结在线课程推荐系统的基本框架和相关概念。然后重点对比分析现有在线课程推荐系统采用的各类核心推荐方法,其中包括基于关联规则挖掘、基于矩阵分解、基于概率模型、基于深度学习、基于智能优化、基于语义计算等类型的方法。最后介绍在线课程系统的各种评价指标和公开可用的数据集,并展望未来的发展方向。 展开更多
关键词 在线课程推荐系统 关联规则挖掘 矩阵分解 概率模型 深度学习 智能优化 语义计算
下载PDF
融合人格特征的概率推荐模型
8
作者 沈铁孙龙 付晓东 +2 位作者 岳昆 刘骊 刘利军 《计算机科学与探索》 CSCD 北大核心 2023年第1期251-262,共12页
以模型为基础的协同过滤推荐算法需分析提取“用户-项目”特征矩阵以进行用户推荐。用户特征不同直接导致用户偏好不同,但以模型为基础的协同过滤推荐算法仅考虑分析提取影响项目特征的关键因素而未考虑分析提取影响用户特征的重要因素... 以模型为基础的协同过滤推荐算法需分析提取“用户-项目”特征矩阵以进行用户推荐。用户特征不同直接导致用户偏好不同,但以模型为基础的协同过滤推荐算法仅考虑分析提取影响项目特征的关键因素而未考虑分析提取影响用户特征的重要因素,这类传统模型往往将用户潜在特征向量随机初始化,并赋予一个假定的正态分布,导致这些推荐系统模型中没有任何一项数据变化可以对用户潜在特征建模结果产生直接影响。另外基于用户的推荐系统模型往往将用户的评论、评分的信息直接近似作为用户特征,传统推荐系统中这些数据引用方式和这些数据本身不足以支撑获取用户的本质特征。这些特征的近似也不能满足个性化推荐的需求。针对现有推荐算法所面临的没有分析提取用户本质特征以及项目本质特征提取不充分进而推荐结果难以体现用户个性的问题,提出一种融合人格特征的推荐模型。首先根据推荐平台中用户的非结构化评论文本信息,将人格特征作为用户特征的直接影响因素,设计一个神经网络模型计算评论用户的BIG FIVE人格得分,并将人格得分向量化作为用户特征;然后通过项目的评论文本信息获得项目特征;设计人格感知的协同学习框架,定义损失函数获取用户、项目的特征向量;最后根据用户、项目表征结果对目标用户进行推荐。在3个数据集上进行了全面的实验验证,结果表明算法在预测准确率、F1值、AUC指标等方面表现优于对比算法,通过人格建模,能够为用户推荐更符合其偏好的项目。 展开更多
关键词 人格识别 语义分析 推荐系统 协同学习 概率矩阵分解
下载PDF
基于二维概率网格的语义地图构建
9
作者 张栋翔 邓一民 李天然 《汽车工程师》 2023年第10期6-10,共5页
在同步定位与地图构建(SLAM)算法构建语义地图的过程中,为解决使用深度学习技术提取的语义信息中含有噪声的问题,提出通过网格的概率表征语义观测的语义匹配法,结合网格匹配和概率更新降低噪声的影响,无需特征点匹配等辅助手段即可增量... 在同步定位与地图构建(SLAM)算法构建语义地图的过程中,为解决使用深度学习技术提取的语义信息中含有噪声的问题,提出通过网格的概率表征语义观测的语义匹配法,结合网格匹配和概率更新降低噪声的影响,无需特征点匹配等辅助手段即可增量地构建清晰的地图。基于实车数据构建的地图所包含的斑马线和车道线均清晰准确,证明了该方法的有效性。 展开更多
关键词 语义匹配 语义噪声 概率网格 同步定位与地图构建
下载PDF
一种基于上下文语义信息的图像块视觉单词生成算法 被引量:41
10
作者 刘硕研 须德 +2 位作者 冯松鹤 刘镝 裘正定 《电子学报》 EI CAS CSCD 北大核心 2010年第5期1156-1161,共6页
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像... 基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能. 展开更多
关键词 场景分类 视觉单词 概率潜在语义分析模型 MARKOV随机场模型 上下文语义信息
下载PDF
基于语义学习的图像多模态检索 被引量:6
11
作者 李志欣 施智平 +1 位作者 陈宏朝 吴璟莉 《计算机工程》 CAS CSCD 2013年第3期258-263,共6页
针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力... 针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力较差。基于语义图例的查询能够在很大程度上克服这个缺陷,通过在显式或隐式的语义空间上进行查询,使检索结果更符合人类感知。实验结果表明,与基于纹理特征的图像检索相比,基于语义图例的检索具有更高的精度及召回率。 展开更多
关键词 图像多模态检索 图像自动标注 概率主题建模 概率潜在语义分析 语义鸿沟 语义学习 语义多项式
下载PDF
基于概率潜在语义分析的词汇情感倾向判别 被引量:15
12
作者 宋晓雷 王素格 +1 位作者 李红霞 李德玉 《中文信息学报》 CSCD 北大核心 2011年第2期89-93,共5页
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词... 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。 展开更多
关键词 概率潜在语义分析 数据稀疏 语义聚类 情感倾向
下载PDF
基于MapReduce的并行PLSA算法及在文本挖掘中的应用 被引量:7
13
作者 李宁 罗文娟 +2 位作者 庄福振 何清 史忠植 《中文信息学报》 CSCD 北大核心 2015年第2期79-86,共8页
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来... PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。 展开更多
关键词 概率主题模型 MAPREDUCE 并行 语义分析
下载PDF
融合语义主题的图像自动标注 被引量:50
14
作者 李志欣 施智平 +1 位作者 李志清 史忠植 《软件学报》 EI CSCD 北大核心 2011年第4期801-812,共12页
由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计... 由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计一个概率模型分别从视觉模态和文本模态中捕获潜在语义主题,并提出一种自适应的不对称学习方法融合两种语义主题.对于每个图像文档,它在各个模态上的主题分布通过加权进行融合,而权值由该文档的视觉词分布的熵值来确定.于是,融合之后的概率模型适当地关联了视觉模态和文本模态的信息,因此能够很好地预测未知图像的语义标注.在一个通用的Corel图像数据集上,将提出的方法与几种前沿的图像标注方法进行了比较.实验结果表明,该方法具有更好的标注和检索性能. 展开更多
关键词 图像自动标注 主题模型 概率潜语义分析 自适应不对称学习 图像检索
下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
15
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率潜在语义分析 参数初始化 潜在语义分析
下载PDF
基于多尺度上下文语义信息的图像场景分类算法 被引量:14
16
作者 张瑞杰 李弼程 魏福山 《电子学报》 EI CAS CSCD 北大核心 2014年第4期646-652,共7页
传统视觉词典模型没有考虑图像的多尺度和上下文语义共生关系.本文提出一种基于多尺度上下文语义信息的图像场景分类算法.首先,对图像进行多尺度分解,从多个尺度提取不同粒度的视觉信息;其次利用基于密度的自适应选择算法确定最优概率... 传统视觉词典模型没有考虑图像的多尺度和上下文语义共生关系.本文提出一种基于多尺度上下文语义信息的图像场景分类算法.首先,对图像进行多尺度分解,从多个尺度提取不同粒度的视觉信息;其次利用基于密度的自适应选择算法确定最优概率潜在语义分析模型主题数;然后,结合Markov随机场共同挖掘图像块的上下文语义共生信息,得到图像的多尺度直方图表示;最后结合支持向量机实现场景分类.实验结果表明,本文算法能有效利用图像的多尺度和上下文语义信息,提高视觉单词的语义准确性,从而改善场景分类性能. 展开更多
关键词 场景分类 多尺度信息 概率潜在语义分析 自适应主题数 上下文语义信息
下载PDF
基于文本和内容的图像检索算法 被引量:8
17
作者 顾昕 张兴亮 +2 位作者 王超 陈思媛 方正 《计算机应用》 CSCD 北大核心 2014年第A02期280-282,313,共4页
为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换(DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析(PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初... 为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换(DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析(PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初步检索,在此结果集上对筛选出的语义相关图像按内容相似度排序输出。在数据集Corel1000上的实验结果表明,该算法能够实现有效的图像检索,检索效率优于单一的基于内容的图像检索算法。 展开更多
关键词 图像检索 稠密的尺度不变特征转换 概率潜在语义分析 自动标注 视觉语义
下载PDF
应用稀疏非负矩阵分解聚类实现高光谱影像波段的优化选择 被引量:16
18
作者 施蓓琦 刘春 +1 位作者 孙伟伟 陈能 《测绘学报》 EI CSCD 北大核心 2013年第3期351-358,366,共9页
针对高光谱影像数据高维性、高度相关性和冗余性等特点,提出应用稀疏非负矩阵分解聚类实现高光谱影像波段的优化选择。通过稀疏非负矩阵分解方法对高光谱影像进行稀疏化表示,同时顾及其可聚类的特性,在保留所选波段物理意义的基础上,得... 针对高光谱影像数据高维性、高度相关性和冗余性等特点,提出应用稀疏非负矩阵分解聚类实现高光谱影像波段的优化选择。通过稀疏非负矩阵分解方法对高光谱影像进行稀疏化表示,同时顾及其可聚类的特性,在保留所选波段物理意义的基础上,得到波段选择后的高光谱影像降维数据。通过该方法对PHI-3高光谱影像进行波段选择的试验分析,应用聚类特征有效性分析波段聚类结果,并采用波段子集的信息量、相关性和可分性3类评价指标来验证方法的效果。最终,从运行效率和分类精度两方面证明了基于无监督聚类的稀疏非负矩阵分解对高光谱影像的波段选择的实用性。 展开更多
关键词 高光谱影像 波段选择 稀疏表示 非负矩阵分解 概率潜语义分析聚类
下载PDF
融合主题和视觉语义的图像自动标注方法 被引量:7
19
作者 赵鹏 王文彬 朱伟伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2013年第11期1709-1714,共6页
为了减小图像语义检索过程中"语义鸿沟"的影响,提出融合主题和视觉语义的图像自动标注方法.该方法先在训练集的文本空间中用概率潜在语义分析(PLSA)模型拟合出主题集合;然后根据图像的高维视觉特征建立主题集合中每个主题的... 为了减小图像语义检索过程中"语义鸿沟"的影响,提出融合主题和视觉语义的图像自动标注方法.该方法先在训练集的文本空间中用概率潜在语义分析(PLSA)模型拟合出主题集合;然后根据图像的高维视觉特征建立主题集合中每个主题的高斯混合模型(GMM),以准确描述其视觉语义信息,减小了"语义鸿沟",提高了图像自动标注的准确性.在Corel数据集上进行了对比实验的结果表明,文中方法在标注的平均标准率和平均标全率上都表现良好,证明了其有效性. 展开更多
关键词 高斯混合模型 概率潜在语义分析 图像自动标注 语义鸿沟 特征聚类
下载PDF
一种压缩稀疏用户评分矩阵的协同过滤算法 被引量:12
20
作者 侯翠琴 焦李成 张文革 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2009年第4期614-618,638,共6页
提出了一种通过降低用户评分矩阵维数来解决数据稀疏问题的协同过滤算法(基于项目多类属概率潜在语义的协同过滤算法).首先将概率潜在语义分析法中的隐变量集固定为项目的多类属集,明确隐变量的意义,限制隐变量的变化范围;而后迭代学习... 提出了一种通过降低用户评分矩阵维数来解决数据稀疏问题的协同过滤算法(基于项目多类属概率潜在语义的协同过滤算法).首先将概率潜在语义分析法中的隐变量集固定为项目的多类属集,明确隐变量的意义,限制隐变量的变化范围;而后迭代学习隐变量的分布,即用户的兴趣模型,压缩用户评分矩阵;最后用学到的兴趣模型度量用户的相似度,对目标用户做出推荐.仿真实验结果表明:该算法有效解决了数据稀疏问题,平均绝对误差低于基于记忆的协同过滤算法4%;与通过概率潜在语义分析法降低用户评分矩阵维数来解决数据稀疏问题的协同过滤算法相比,该算法明确了隐变量的意义,提高了对系统的理解,并取得了富有竞争力的推荐性能. 展开更多
关键词 项目多类属 概率潜在语义分析 迭代方法 协同过滤 算法
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部