期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于非负矩阵分解的隐含语义图像检索 被引量:7
1
作者 梁栋 杨杰 +1 位作者 卢进军 常宇畴 《上海交通大学学报》 EI CAS CSCD 北大核心 2006年第5期787-790,共4页
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空... 提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的. 展开更多
关键词 图像检索 隐含语义索引 非负矩阵分解 奇异值分解 语义空间
下载PDF
基于P2P的隐含语义索引模型的研究 被引量:5
2
作者 郭敏 董健全 宋智 《计算机工程与设计》 CSCD 北大核心 2005年第11期2910-2912,2954,共4页
P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基... P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基于文本语义的检索模型。为提高系统的查准率,扩展在P2P下的查询方式,本文提出了在P2P网络中引入隐含语义索引模型进行信息检索,并模拟实现了一个基于P2P网络的隐含语义索引模型的试验平台。 展开更多
关键词 P2P 隐含语义索引模型 检索
下载PDF
基于改进潜在语义分析的跨语言检索 被引量:14
3
作者 宁健 林鸿飞 《中文信息学报》 CSCD 北大核心 2010年第3期105-111,共7页
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用... 该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索。 展开更多
关键词 计算机应用 中文信息处理 改进潜在语义分析 语义空间 跨语言检索 svd NMF
下载PDF
基于支持向量机的隐含语意特征选择方法 被引量:2
4
作者 李旻松 段琢华 《计算机应用》 CSCD 北大核心 2011年第9期2429-2431,2435,共4页
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适... 隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适用于高维数据例如文档的分类。为此提出基于支持向量机的特征提取方法用于选择适于分类的LSI特征。该方法利用SVM高度泛化的分类能力,通过使用在每一个规则下训练的分类器的参数对第k个特征对反向平方分解面的贡献w2k的值进行估计。实验表明当需要比LSI更少的训练和测试时间时,该方法能够以更为紧凑的表示方式提高分类性能。 展开更多
关键词 隐含语意索引 向量空间模型 奇异值分解 文档矩阵 支持向量机
下载PDF
基于语义Web挖掘的宽范围扫描环境弱信号识别 被引量:1
5
作者 顾伟 傅德胜 蔡玮 《科学技术与工程》 北大核心 2013年第29期8791-8797,共7页
针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模... 针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模式;最后采用一种新的弱信号最大化方法计算出相关弱信号的最大数量;并由奇异值分解的维数表示,从而实现弱信号的高效识别。实验结果表明,相比其他最先进的弱信号识别方法,所提方法取得了更好的识别性能。 展开更多
关键词 弱信号 扫描环境 隐含语义索引 组织环境 奇异值分解 WEB挖掘
下载PDF
面向化学领域网络资源的文本自动分类算法 被引量:1
6
作者 梁春燕 夏诏杰 郭力 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期52-57,共6页
为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层... 为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影响进行了讨论.结果表明,该算法能较好地应用于化学领域网络资源的自动分类. 展开更多
关键词 机器学习 化学主题搜索引擎 文本自动分类 k-近邻方法 隐含语义检索
下载PDF
一种改进的潜在语义检索模型研究 被引量:2
7
作者 陈燕红 刘风华 《计算机技术与发展》 2014年第9期120-124,共5页
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在... 针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在语义分析生成的语义索引库,进行语义检索。通过多组实验分析确定了该模型所采用的词条权重计算方法和语义空间维数。最后,通过实验分析对比了改进后的潜在语义检索模型(ALSI)与传统潜在语义检索模型(LSI)的检索效果。结果表明,ALSI的检索效果明显好于LSI,适合应用于较大规模农业信息检索。 展开更多
关键词 农业信息 垂直搜索引擎 潜在语义检索 面向农业的潜在语义检索模型
下载PDF
矩阵奇异值分解在隐含语义信息检索中的应用 被引量:5
8
作者 何志林 王春红 《现代计算机》 2011年第6期21-23,27,共4页
对矩阵奇异值分解的特征进行分析,并将矩阵的奇异值分解应用于向量空间模型,对其进行改进,实现基于语义的信息检索模型,该模型能消除同义词和多义词的影响,提高了文本表示的准确性,从而使信息检索的准确率有显著提高,具有重要的实用价值。
关键词 奇异值分解 信息检索 隐含语义索引模型
下载PDF
XML文档聚类中基于语义的特征词权重计算方法
9
作者 龙鹏飞 石奇 《长沙理工大学学报(自然科学版)》 CAS 2015年第2期72-77,共6页
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率... 在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"长度因子"的新权重方案。并在建立向量空间模型时引入LSI理论,在词条之间搭建了语义关系,减少了原词-文档矩阵中包含的噪声,聚类速度和精度都有所提高。在IEEE无类别信息数据集上试验表明,与同类相似度计算方法和聚类方法相比,本研究方法在聚类速度和效果上都有所提高和改善。 展开更多
关键词 潜在语义索引 检索结果聚类 权重算法 聚类算法
下载PDF
一种大容量文本集的智能检索方法
10
作者 金小峰 《计算机工程与应用》 CSCD 北大核心 2011年第7期143-145,158,共4页
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模... 分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。 展开更多
关键词 向量空间模型 潜在语义索引 奇异值分解 文本信息检索
下载PDF
基于引文相关性排序的科技论文检索方法 被引量:3
11
作者 尹盼盼 崔荣一 《计算机工程与设计》 CSCD 北大核心 2011年第12期4223-4226,4250,共5页
为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特... 为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特征项的权重,构造引文的词项-文档关联矩阵,并利用奇异值分解方法构造引文的潜在语义空间,计算查询论文与文档库中论文的引文语义相关性;采用信息增益方法确定了引文相关性阈值,将引文相关性超过阈值的科技论文作为检索结果返回。实验结果表明,提出的检索方法的准确率、召回率、综合性能均高于基于概括性信息(标题、摘要、关键词)的检索方法。 展开更多
关键词 潜在语义索引 引文相关性 奇异值分解 信息增益 文本检索
下载PDF
基于语义的中文信息检索技术分析与研究
12
作者 王春红 《现代计算机》 2008年第10期54-56,共3页
对隐含语义索引模型在中文文本检索中的应用进行分析,证明了隐含语义索引模型通过挖掘文本和词汇之间的隐含关系较好地实现了语义检索,指出所存在的问题和进一步研究的方向。
关键词 隐含语义索引(LSI) 信息检索 svd 时间效率
下载PDF
SDD方法在信息检索中的应用
13
作者 罗洋 战学刚 迟呈英 《计算机应用与软件》 CSCD 北大核心 2008年第7期252-253,285,共3页
介绍潜在语义索引中半离散矩阵分解SDD(Semidiscrete Matrix Decomposition)方法的使用,改进其在存储空间方面的不足,提出了SDD+方法,并比较了奇异值分解SVD(Singular Vector Decomposition)、SDD和SDD+的性能差异。
关键词 潜在语义索引 奇异值分解 半离散矩阵分解 SDD+
下载PDF
二进制引力搜索结合LSI的混合CBIR算法 被引量:1
14
作者 耿淼 须文波 秦向东 《湘潭大学自然科学学报》 北大核心 2017年第3期85-88,共4页
针对高级用户描述的对象与低级的图像特征之间的语义差异问题,将潜在语义索引(LSI)与二进制引力搜索(BGSA)结合,提出一种基于内容的图像检索(CBIR)算法.该算法利用BGSA同时进行自适应特征提取和特征选择,LSI作为CBIR中的一个语义模型,... 针对高级用户描述的对象与低级的图像特征之间的语义差异问题,将潜在语义索引(LSI)与二进制引力搜索(BGSA)结合,提出一种基于内容的图像检索(CBIR)算法.该算法利用BGSA同时进行自适应特征提取和特征选择,LSI作为CBIR中的一个语义模型,图像特征矩阵的构建由Gabor小波、Daubechies小波和小波矩完成.实验在Corel收集的1 000幅图像库上进行,对某些类别的图像,该算法的检索精度可高达100%,前10幅图像,算法的准确率为83.18%,对于前100幅图像,精度仅降至67.40%.相比其他优秀算法,提出算法在平均精度和平均查全率方面均有显著提高,实用性较好. 展开更多
关键词 图像特征 基于内容的图像检索(CBIR) 二进制引力搜索 潜在语义索引
下载PDF
LSI文本挖掘技术剖析 被引量:1
15
作者 蔡豪源 《农业图书情报学刊》 2016年第7期5-9,共5页
介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法... 介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法上的异同,通过对词项—文档矩阵进行文本挖掘的例子,指出了LSI在分析文档间内在联系所起到的作用。 展开更多
关键词 潜在语义索引 文本挖掘 向量空间模型 奇异值分解
下载PDF
基于潜在语义索引的超链接分析模型 被引量:2
16
作者 刘华生 刘刚 吕玉琴 《世界科技研究与发展》 CSCD 2008年第6期743-745,共3页
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎... 为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎作弊以及上下文搜索和主题相关搜索问题。 展开更多
关键词 链接分析模型 潜在语义索引 搜索引擎
原文传递
基于层次搜索的潜在语义索引方法研究 被引量:1
17
作者 李华云 金玉坚 《图书情报工作》 CSSCI 北大核心 2006年第11期36-38,共3页
针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme, LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在... 针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme, LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在信息过滤阶段保持高的查全率,在信息检索阶段保证高的查准率,从而最后达到很好的检索效果。 展开更多
关键词 潜在语义索引 层次搜索 奇异值分解(svd)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部