期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于用户兴趣变化的隐语义协同过滤算法 被引量:2
1
作者 汪佩 梁立 甘健侯 《云南师范大学学报(自然科学版)》 2017年第4期39-43,共5页
协同过滤是推荐系统中广泛使用的算法.协同过滤模型没有考虑用户兴趣的动态变化,影响推荐质量.为提高推荐准确度,提出新的推荐算法——将基于动态时间窗口的协同过滤推荐与高斯概率隐语义模型结合,利用动态时间窗口捕捉用户的兴趣变化,... 协同过滤是推荐系统中广泛使用的算法.协同过滤模型没有考虑用户兴趣的动态变化,影响推荐质量.为提高推荐准确度,提出新的推荐算法——将基于动态时间窗口的协同过滤推荐与高斯概率隐语义模型结合,利用动态时间窗口捕捉用户的兴趣变化,并结合概率隐语义模型分析用户长期兴趣,进而为用户提供更准确的推荐.实验表明,该算法同其他协同过滤算法相比具有更高的准确度. 展开更多
关键词 协同过滤 兴趣变化 动态时间窗口 概率隐语义分析
下载PDF
基于PLSA主题模型的多标记文本分类 被引量:5
2
作者 蒋铭初 潘志松 尤峻 《数据采集与处理》 CSCD 北大核心 2016年第3期541-547,共7页
为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,... 为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,以文本的主题分布表示一篇文本,在去噪的同时可以大大降低数据维度。在此基础上利用多标记假设重用算法(Multi-label algorithm of hypothesis reuse,MAHR)进行分类,由于经过PLSA降维后的特征组本身就具有语义信息,因此算法能够精确地挖掘出多标记之间的关系并用于训练基分类器,从而避免了人为输入标记关系的缺陷。实验验证了该方法能够充分利用PLSA降维得到的语义信息来改善多标记文本分类的性能。 展开更多
关键词 文本分类 多标记学习 概率隐语义分析 多标记假设重用算法
下载PDF
超越隐主题包模型:针对场景类别识别的空间金字塔匹配(英文) 被引量:2
3
作者 Fu-xiang LU Jun HUANG 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第10期817-828,共12页
目的:随着智能手机、数码相机的普及和互联网的高速发展,基于内容的场景类别识别对于图像数据库标注和检索具有重要意义。在场景类别数目比较多的情况下,本文基于概率隐语义分析(p LSA)和自适应提升(Ada Boost)算法,实现一种鲁棒的场景... 目的:随着智能手机、数码相机的普及和互联网的高速发展,基于内容的场景类别识别对于图像数据库标注和检索具有重要意义。在场景类别数目比较多的情况下,本文基于概率隐语义分析(p LSA)和自适应提升(Ada Boost)算法,实现一种鲁棒的场景类别识别算法。创新点:记录p LSA学习得到的主题的位置关系,提出金字塔主题直方图;在词包(bag-of-words)模型中采用不同的兴趣点提取算子和不同的局部区域描述符,实现异质金字塔单词直方图,显著提升场景识别准确率;提出一种两级多分类算法。方法:利用期望最大化(EM)算法计算图像或图像块的p LSA主题分布,通过空间金字塔(SP)记录主题之间的大致位置关系;通过对兴趣点提取算子和区域描述符的比较研究,在词包模型中选用稠密兴趣点提取算子和六种区域描述符,从而得到六个金字塔主题直方图用来表示图像;为充分利用各异质金字塔主题直方图信息,先用Ada Boost选取分辨能力强的主题并计算测试图像的后验概率,再由prod-max融合规则确定测试图像的类别。结论:对于特定的兴趣点提取算子和特定的区域描述符,金字塔主题直方图对所有基准图像库的场景识别率均高于标准p LSA主题直方图;融合各异质金字塔主题直方图显著提高了场景类别识别率。 展开更多
关键词 场景类别识别 概率隐语义分析 词包 自适应提升
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部