期刊文献+
共找到74篇文章
< 1 2 4 >
每页显示 20 50 100
基于概率潜在语义分析的词汇情感倾向判别 被引量:15
1
作者 宋晓雷 王素格 +1 位作者 李红霞 李德玉 《中文信息学报》 CSCD 北大核心 2011年第2期89-93,共5页
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词... 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。 展开更多
关键词 概率潜在语义分析 数据稀疏 语义聚类 情感倾向
下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
2
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率潜在语义分析 参数初始化 在语义分析
下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
3
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率潜在语义分析模型 话题挖掘 情绪演进 情绪分析
下载PDF
基于概率潜在语义分析的中文信息检索 被引量:11
4
作者 罗景 涂新辉 《计算机工程》 CAS CSCD 北大核心 2008年第2期199-201,共3页
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。... 传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。 展开更多
关键词 概率潜在语义分析 中文信息检索 索引技术 关键词抽取
下载PDF
基于混合概率潜在语义分析模型的Web聚类 被引量:2
5
作者 王治和 王凌云 +1 位作者 党辉 潘丽娜 《计算机应用》 CSCD 北大核心 2012年第11期3018-3022,共5页
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLS... 在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型,通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的H-PLSA模型和页面聚类的H-PLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的k-medoids算法。设计并构建了H-PLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。 展开更多
关键词 WEB聚类 概率潜在语义分析 潜在主题 k-medoids算法
下载PDF
基于概率潜在语义分析的Web用户聚类 被引量:4
6
作者 俞辉 景海峰 《计算机工程与应用》 CSCD 北大核心 2008年第23期160-162,共3页
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概... Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据。聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度。实验结果验证了该算法的有效性和局限性。 展开更多
关键词 WEB日志 预处理 WEB用户 概率潜在语义分析 聚类
下载PDF
概率潜在语义分析(PLSA)在中药新药处方发现中的应用 被引量:3
7
作者 雷蕾 张早华 +3 位作者 温先荣 亢力 张竹绿 刘森 《世界科学技术-中医药现代化》 北大核心 2012年第5期1976-1980,共5页
目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角... 目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角度对候选方进行分析,最后结合专家智慧在候选方的基础上给出具有开发潜力的新药处方。结果:筛选出治疗该病的中药核心组合,并证明了PLSA算法用于中药处方发现具有一定的可靠性和稳定性。同时专家从计算机筛选出的处方中选出有开发前景的两首方。结论:PLSA算法在治疗缺血性心脑血管疾病中药处方发现中有着广阔的应用前景。 展开更多
关键词 概率潜在语义分析 缺血性心脑血管疾病 中药处方发现
下载PDF
多源遥感影像湿地检测概率潜在语义分析 被引量:1
8
作者 许凯 张倩倩 +2 位作者 王彦华 刘福江 秦昆 《测绘学报》 EI CSCD 北大核心 2017年第8期1017-1025,共9页
提出了一种基于概率潜在语义分析的多源遥感影像湿地检测方法。首先提取高分辨率影像的光谱、纹理和湿地场景的地物组成成分,并结合由多光谱遥感数据提取的湿地地表温度、土壤含水量,组成湿地场景的特征空间;然后利用概率潜在语义分析... 提出了一种基于概率潜在语义分析的多源遥感影像湿地检测方法。首先提取高分辨率影像的光谱、纹理和湿地场景的地物组成成分,并结合由多光谱遥感数据提取的湿地地表温度、土壤含水量,组成湿地场景的特征空间;然后利用概率潜在语义分析将湿地场景表示成多个潜在语义的组合,并用潜在语义的权值向量来描述湿地场景的特征空间;最后利用SVM分类器实现湿地场景的检测。试验表明,概率潜在语义分析能够将湿地的高维特征空间映射到低维的潜在语义空间中,地物组成成分和定量环境特征的加入能更加有效地表征湿地特征空间,提高湿地检测精度。 展开更多
关键词 概率潜在语义分析 湿地检测 语义信息 多源遥感
下载PDF
基于概率潜在语义分析的文本聚类研究 被引量:3
9
作者 吴金学 《青岛理工大学学报》 CAS 2008年第2期95-99,共5页
根据内容对海量文本信息进行聚类分析,可以改进信息检索和管理的效率.在文本聚类中,首先利用奇异值分解对词-文档矩阵进行化简,达到降秩和去噪的目的;然后在聚类分析中,采用概率潜在语义分析强化文档的区分特征,以k-medoids聚类方法为基... 根据内容对海量文本信息进行聚类分析,可以改进信息检索和管理的效率.在文本聚类中,首先利用奇异值分解对词-文档矩阵进行化简,达到降秩和去噪的目的;然后在聚类分析中,采用概率潜在语义分析强化文档的区分特征,以k-medoids聚类方法为基础,提出的方法改进了聚类过程的鲁棒性,实验结果表明该算法的有效性. 展开更多
关键词 文本 聚类 奇异值分解 概率潜在语义分析
下载PDF
结合概率潜在语义分析的文本谱聚类方法研究
10
作者 张玉芳 张洪 +1 位作者 熊忠阳 李文田 《计算机工程与应用》 CSCD 北大核心 2011年第36期134-136,179,共4页
传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提... 传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提取文本中隐含语义信息的方法,并构建文本集的相似矩阵,从语义的角度考虑了文本之间的相关性。实验结果表明,利用该方法得到的聚类精度有较大提高,结果要好于传统的谱聚类算法,从而验证了该方法的有效性。 展开更多
关键词 文本聚类 概率潜在语义分析 谱聚类 相似矩阵
下载PDF
基于概率潜在语义分析的中文文本分类研究 被引量:4
11
作者 王奕 《甘肃联合大学学报(自然科学版)》 2011年第4期75-78,共4页
概率潜在语义模型使用统计的方法描述"文档—潜在语义—词"之间的概率分布关系,其实质是模拟了潜在的概率语义空间,并将文档和词映射到同一个语义空间.该文将概率潜在语义分析模型用于中文文本分类,一方面较好地处理了自然语... 概率潜在语义模型使用统计的方法描述"文档—潜在语义—词"之间的概率分布关系,其实质是模拟了潜在的概率语义空间,并将文档和词映射到同一个语义空间.该文将概率潜在语义分析模型用于中文文本分类,一方面较好地处理了自然语言中的同义、多义问题;另一方面通过计算概率潜在语义空间中向量的距离来获得文档间的类别信息从而达到文本分类的目的.实验结果表明,该分类器具有良好的分类性能. 展开更多
关键词 中文文本分类 概率潜在语义分析 语义空间
下载PDF
基于概率潜在语义分析的Blog个性化查询扩展研究
12
作者 崔琳 谈成访 吴孝银 《安阳师范学院学报》 2013年第2期39-42,共4页
随着Web2.0技术的日益成熟和Blog技术的发展,Blog页面的数量呈指数级上升,只靠基于关键字匹配的Blog搜索引擎已满足不了用户的需要。传统Blog搜索引擎的搜索效率达不到用户个性化要求,受概率潜在语义分析技术研究的启发,将概率潜在语义... 随着Web2.0技术的日益成熟和Blog技术的发展,Blog页面的数量呈指数级上升,只靠基于关键字匹配的Blog搜索引擎已满足不了用户的需要。传统Blog搜索引擎的搜索效率达不到用户个性化要求,受概率潜在语义分析技术研究的启发,将概率潜在语义分析模型用于Blog日志查询,根据用户的兴趣和个性化特点进行检索,返回与用户需求相关的查询结果。实验结果表明,相对于传统的向量空间模型和潜在语义分析模型,基于概率潜在语义分析模型的Blog日志查询在平均精度和召回率上得到了显著提高。 展开更多
关键词 概率潜在语义分析 博客 查询扩展 向量空间模型 在语义分析
下载PDF
基于概率潜在语义分析模型的自动答案选择 被引量:5
13
作者 张成 曲明成 +2 位作者 倪宁 仇光 卜佳俊 《计算机工程》 CAS CSCD 北大核心 2011年第14期70-72,共3页
问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和... 问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和问题之间的主题匹配度对候选答案进行排序。实验结果表明,该方法可有效挖掘用户兴趣,提高答案选择的准确率。 展开更多
关键词 答案选择 问答社区 概率潜在语义分析 主题建模
下载PDF
基于概率潜在语义分析优化拼音汉字转换 被引量:1
14
作者 郑叶清 刘功申 《信息技术》 2016年第11期33-37,41,共6页
文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强... 文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强模型性能,优化了拼音汉字转换模型应用效果。 展开更多
关键词 概率潜在语义分析 拼音汉字转换 统计语言模型
下载PDF
基于概率潜在语义分析和Adaboost算法的文本分类技术研究
15
作者 刘苗 谢邦昌 《统计与决策》 CSSCI 北大核心 2010年第19期21-23,共3页
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的... 文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。 展开更多
关键词 文本自动分类 概率潜在语义分析(PLSA) ADABOOST TEM迭代
下载PDF
基于概率潜在语义分析的Web用户会话识别
16
作者 高春贞 吴军华 《微电子学与计算机》 CSCD 北大核心 2010年第6期163-166,共4页
为提高Web用户会话识别的准确性,给出了一种基于概率潜在语义分析模型(PLSA)和竞争奖罚(CRP)算法的Web用户会话识别方法.其核心内容是利用PLSA模型计算出请求页面和每一个活动用户会话的概率,比较概率判定请求页面应该归属的用户会话,... 为提高Web用户会话识别的准确性,给出了一种基于概率潜在语义分析模型(PLSA)和竞争奖罚(CRP)算法的Web用户会话识别方法.其核心内容是利用PLSA模型计算出请求页面和每一个活动用户会话的概率,比较概率判定请求页面应该归属的用户会话,并采用竞争奖罚算法判别用户会话的结束.实验结果表明:基于PLSA模型和竞争奖罚算法的用户会话识别方法的识别成功率高于其他常用的会话识别方法. 展开更多
关键词 会话识别 概率潜在语义分析 竞争奖罚算法 最大期望值算法 WEB使用挖掘
下载PDF
多尺度空间判别性概率潜在语义分析的场景分类 被引量:2
17
作者 季海峰 高隽 +1 位作者 郑鹏 王婧 《中国图象图形学报》 CSCD 北大核心 2014年第1期109-118,共10页
目的传统潜在语义分析(LSA)方法无法获得场景目标空间分布信息和潜在主题的判别信息。方法针对这一问题提出了一种基于多尺度空间判别性概率潜在语义分析(PLSA)的场景分类方法。首先通过空间金字塔方法对图像进行空间多尺度划分获得图... 目的传统潜在语义分析(LSA)方法无法获得场景目标空间分布信息和潜在主题的判别信息。方法针对这一问题提出了一种基于多尺度空间判别性概率潜在语义分析(PLSA)的场景分类方法。首先通过空间金字塔方法对图像进行空间多尺度划分获得图像空间信息,结合PLSA模型获得每个局部块的潜在语义信息;然后串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息;最后结合提出的权值学习方法来学习不同图像主题间的判别信息,从而得到图像的多尺度空间判别性潜在语义信息,并将学习到的权值信息嵌入支持向量机(Support Vector Machine,SVM)分类器中完成图像的场景分类。结果在常用的3个场景图像库(Scene-13、Scene-15和Caltech-101)上的实验结果表明,本文方法平均分类精度比现有许多state-of-art方法均优。结论充分说明了空间信息和判别性信息在场景分类中的重要性,并进一步验证了其有效性和鲁棒性。 展开更多
关键词 概率潜在语义分析 空间金字塔 判别信息 场景分类
原文传递
基于网页概率潜在语义信息的用户兴趣聚类 被引量:2
18
作者 钱雪忠 吴志媛 《计算机工程与科学》 CSCD 北大核心 2014年第4期765-771,共7页
为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结... 为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。 展开更多
关键词 概率潜在语义分析 自动相似度阈值选择 用户兴趣点 凝聚式层次k中心点 个性化服务
下载PDF
概率潜在语义检索模型中中文索引技术的比较研究
19
作者 罗景 涂新辉 《计算机与数字工程》 2007年第4期102-105,111,共5页
概率潜在语义检索模型使用统计的方法建立“文档—潜在语义—词”之间概率分布关系并利用这种关系进行检索。本文比较了在概率潜在语义检索模型中不同中文索引技术对检索效果的影响,考察了基于分词、二元和关键词抽取三种不同的索引技术... 概率潜在语义检索模型使用统计的方法建立“文档—潜在语义—词”之间概率分布关系并利用这种关系进行检索。本文比较了在概率潜在语义检索模型中不同中文索引技术对检索效果的影响,考察了基于分词、二元和关键词抽取三种不同的索引技术,并和向量空间模型作了对比分析。实验结果表明:在概率潜在语义检索模型中,词的正确切分能提高检索的平均精度。 展开更多
关键词 中文索引技术 信息检索 概率潜在语义分析
下载PDF
基于分块潜在语义的场景分类方法 被引量:7
20
作者 曾璞 吴玲达 文军 《计算机应用》 CSCD 北大核心 2008年第6期1537-1539,1542,共4页
提出了一种基于分块潜在语义的场景分类方法。该方法首先对图像进行均匀分块并使用分块内视觉词汇的出现频率来描述每一个分块,然后利用概率潜在语义分析(PLSA)方法从图像的分块集合中发现潜在语义模型,最后利用该模型提取出潜在语义在... 提出了一种基于分块潜在语义的场景分类方法。该方法首先对图像进行均匀分块并使用分块内视觉词汇的出现频率来描述每一个分块,然后利用概率潜在语义分析(PLSA)方法从图像的分块集合中发现潜在语义模型,最后利用该模型提取出潜在语义在图像分块中的出现情况来进行场景分类。在13类场景图像上的实验表明,与其他方法相比,该方法具有更高的分类准确率。 展开更多
关键词 场景分类 分块在语义 视觉词汇 局部不变特征 概率潜在语义分析
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部