期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于语义聚类的典型日负荷曲线选取方法 被引量:14
1
作者 孟令奎 段红伟 +1 位作者 黄长青 孙琤 《华北电力大学学报(自然科学版)》 CAS 北大核心 2013年第1期43-48,共6页
将典型日负荷曲线的选取问题转化为基于统计学习的多元分类问题,利用概率潜在语义分析模型(PLSA)进行问题求解。方法首先通过K均值聚类和负荷曲线时段划分形成观测特征词和目标文档,通过阈值计算获得特征词-目标共生矩阵;然后基于Davies... 将典型日负荷曲线的选取问题转化为基于统计学习的多元分类问题,利用概率潜在语义分析模型(PLSA)进行问题求解。方法首先通过K均值聚类和负荷曲线时段划分形成观测特征词和目标文档,通过阈值计算获得特征词-目标共生矩阵;然后基于Davies-Bouldin指标计算PLSA模型的最佳主题数目,并对模型参数求解获得每个目标文档中特征词的潜在主题;最后依据电力负荷曲线与特征词的对应关系形成新的聚类,并采用选取策略获得各聚类的典型日。实验表明,方法能够较好的反映节假日、气候等因素的影响,典型日选取合理可行。 展开更多
关键词 概率潜在语义分析模型 典型日负荷曲线 Davies—Bouldin指标
下载PDF
基于主题词对的文档重排方法 被引量:2
2
作者 何婷婷 许婷 +1 位作者 瞿国忠 涂新辉 《计算机工程与应用》 CSCD 北大核心 2007年第11期161-163,共3页
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索... 提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。 展开更多
关键词 主题词对 概率潜在语义索引 文档重排
下载PDF
基于概率潜在语义分析的中文信息检索 被引量:11
3
作者 罗景 涂新辉 《计算机工程》 CAS CSCD 北大核心 2008年第2期199-201,共3页
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。... 传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。 展开更多
关键词 概率潜在语义分析 中文信息检索 索引技术 关键词抽取
下载PDF
基于WordNet本体和PLSA的语义Web服务发现 被引量:2
4
作者 邢少敏 周伯生 陈天影 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第11期1325-1329,共5页
提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服... 提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服务描述文档集合为文档集,组成词汇-文档矩阵,以该矩阵为输入,使用PLSA方法对服务集进行分类,并将用户请求带入PLSA模型,确定其所属的类;然后在类中以标注后的输出参数为键,含有这个输出的服务的列表为键值,建立一个映射表,查找与用户请求的输出相似的映射表键,进而找出对应的键值,即服务列表;最后根据QoS(Quality of Service)和用户请求中的输入参数确定满足条件的服务结果集合.在415个Web服务组成的数据集上的测试结果表明,性能较其他方法有优势,召回率和R准确率也得到了改善. 展开更多
关键词 本体标注 概率潜在语义分析 WEB服务 索引 分类 语义 服务发现
下载PDF
一种基于概率潜在语义分析的专利主题标引方法研究 被引量:2
5
作者 包翔 刘桂锋 《情报工程》 2020年第3期15-24,共10页
为了准确稳定地对专利主题进行标引,本文提出了一种基于概率潜在语义分析的专利主题标引方法。首先建立由共同主题和特定主题所联合起来的混合模型;然后通过这两类主题相关性推断出训练集和测试集特定主题的映射关系;最后选择相似度最... 为了准确稳定地对专利主题进行标引,本文提出了一种基于概率潜在语义分析的专利主题标引方法。首先建立由共同主题和特定主题所联合起来的混合模型;然后通过这两类主题相关性推断出训练集和测试集特定主题的映射关系;最后选择相似度最高的主题作为专利的主题完成标引。实验结果表明,该方法能较为准确、稳定地对未标记专利进行主题标引。本文尝试将概率潜在语义分析运用到专利文本的标引中,既是对专利标引自动化的一种积极尝试,也为深层次挖掘专利信息情报技术提供了一种新的思路。 展开更多
关键词 专利 标引 概率潜在语义 主题
下载PDF
一种基于PLSA的高效检索方法 被引量:3
6
作者 李胜 胡和平 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第11期48-50,75,共4页
为克服概率潜在语义索引在存储效率和查询速度方面的不足,引入概率潜在语义词典(PLSD)概念,建立词汇之间的关联矩阵代替词汇-文档矩阵.提出一种文档分值计算方法,以及词典中每个词汇的概率计算方法,用以获取相关的查询词汇,从而生成新... 为克服概率潜在语义索引在存储效率和查询速度方面的不足,引入概率潜在语义词典(PLSD)概念,建立词汇之间的关联矩阵代替词汇-文档矩阵.提出一种文档分值计算方法,以及词典中每个词汇的概率计算方法,用以获取相关的查询词汇,从而生成新的查询.实验表明:PLSD的引入消除了概率潜在语义分析对文档的依赖,通过调整文档阈值和词汇筛选等方法,可以在保证查准率的前提下,大幅度减少检索系统占用的存储空间. 展开更多
关键词 信息检索 概率潜在语义分析 词频索引 查询扩展 概率潜在语义词典
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部