期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
17
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于非负矩阵分解的隐含语义图像检索
被引量:
7
1
作者
梁栋
杨杰
+1 位作者
卢进军
常宇畴
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2006年第5期787-790,共4页
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空...
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的.
展开更多
关键词
图像检索
隐含语义索引
非负矩阵分解
奇异值分解
语义空间
下载PDF
职称材料
基于P2P的隐含语义索引模型的研究
被引量:
5
2
作者
郭敏
董健全
宋智
《计算机工程与设计》
CSCD
北大核心
2005年第11期2910-2912,2954,共4页
P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基...
P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基于文本语义的检索模型。为提高系统的查准率,扩展在P2P下的查询方式,本文提出了在P2P网络中引入隐含语义索引模型进行信息检索,并模拟实现了一个基于P2P网络的隐含语义索引模型的试验平台。
展开更多
关键词
P2P
隐含语义索引模型
检索
下载PDF
职称材料
基于改进潜在语义分析的跨语言检索
被引量:
14
3
作者
宁健
林鸿飞
《中文信息学报》
CSCD
北大核心
2010年第3期105-111,共7页
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用...
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索。
展开更多
关键词
计算机应用
中文信息处理
改进潜在语义分析
语义空间
跨语言检索
svd
NMF
下载PDF
职称材料
基于支持向量机的隐含语意特征选择方法
被引量:
2
4
作者
李旻松
段琢华
《计算机应用》
CSCD
北大核心
2011年第9期2429-2431,2435,共4页
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适...
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适用于高维数据例如文档的分类。为此提出基于支持向量机的特征提取方法用于选择适于分类的LSI特征。该方法利用SVM高度泛化的分类能力,通过使用在每一个规则下训练的分类器的参数对第k个特征对反向平方分解面的贡献w2k的值进行估计。实验表明当需要比LSI更少的训练和测试时间时,该方法能够以更为紧凑的表示方式提高分类性能。
展开更多
关键词
隐含语意索引
向量空间模型
奇异值分解
文档矩阵
支持向量机
下载PDF
职称材料
基于语义Web挖掘的宽范围扫描环境弱信号识别
被引量:
1
5
作者
顾伟
傅德胜
蔡玮
《科学技术与工程》
北大核心
2013年第29期8791-8797,共7页
针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模...
针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模式;最后采用一种新的弱信号最大化方法计算出相关弱信号的最大数量;并由奇异值分解的维数表示,从而实现弱信号的高效识别。实验结果表明,相比其他最先进的弱信号识别方法,所提方法取得了更好的识别性能。
展开更多
关键词
弱信号
扫描环境
隐含语义索引
组织环境
奇异值分解
WEB挖掘
下载PDF
职称材料
面向化学领域网络资源的文本自动分类算法
被引量:
1
6
作者
梁春燕
夏诏杰
郭力
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期52-57,共6页
为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层...
为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影响进行了讨论.结果表明,该算法能较好地应用于化学领域网络资源的自动分类.
展开更多
关键词
机器学习
化学主题搜索引擎
文本自动分类
k-近邻方法
隐含语义检索
下载PDF
职称材料
一种改进的潜在语义检索模型研究
被引量:
2
7
作者
陈燕红
刘风华
《计算机技术与发展》
2014年第9期120-124,共5页
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在...
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在语义分析生成的语义索引库,进行语义检索。通过多组实验分析确定了该模型所采用的词条权重计算方法和语义空间维数。最后,通过实验分析对比了改进后的潜在语义检索模型(ALSI)与传统潜在语义检索模型(LSI)的检索效果。结果表明,ALSI的检索效果明显好于LSI,适合应用于较大规模农业信息检索。
展开更多
关键词
农业信息
垂直搜索引擎
潜在语义检索
面向农业的潜在语义检索模型
下载PDF
职称材料
矩阵奇异值分解在隐含语义信息检索中的应用
被引量:
5
8
作者
何志林
王春红
《现代计算机》
2011年第6期21-23,27,共4页
对矩阵奇异值分解的特征进行分析,并将矩阵的奇异值分解应用于向量空间模型,对其进行改进,实现基于语义的信息检索模型,该模型能消除同义词和多义词的影响,提高了文本表示的准确性,从而使信息检索的准确率有显著提高,具有重要的实用价值。
关键词
奇异值分解
信息检索
隐含语义索引模型
下载PDF
职称材料
XML文档聚类中基于语义的特征词权重计算方法
9
作者
龙鹏飞
石奇
《长沙理工大学学报(自然科学版)》
CAS
2015年第2期72-77,共6页
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率...
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"长度因子"的新权重方案。并在建立向量空间模型时引入LSI理论,在词条之间搭建了语义关系,减少了原词-文档矩阵中包含的噪声,聚类速度和精度都有所提高。在IEEE无类别信息数据集上试验表明,与同类相似度计算方法和聚类方法相比,本研究方法在聚类速度和效果上都有所提高和改善。
展开更多
关键词
潜在语义索引
检索结果聚类
权重算法
聚类算法
下载PDF
职称材料
一种大容量文本集的智能检索方法
10
作者
金小峰
《计算机工程与应用》
CSCD
北大核心
2011年第7期143-145,158,共4页
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模...
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。
展开更多
关键词
向量空间模型
潜在语义索引
奇异值分解
文本信息检索
下载PDF
职称材料
基于引文相关性排序的科技论文检索方法
被引量:
3
11
作者
尹盼盼
崔荣一
《计算机工程与设计》
CSCD
北大核心
2011年第12期4223-4226,4250,共5页
为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特...
为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特征项的权重,构造引文的词项-文档关联矩阵,并利用奇异值分解方法构造引文的潜在语义空间,计算查询论文与文档库中论文的引文语义相关性;采用信息增益方法确定了引文相关性阈值,将引文相关性超过阈值的科技论文作为检索结果返回。实验结果表明,提出的检索方法的准确率、召回率、综合性能均高于基于概括性信息(标题、摘要、关键词)的检索方法。
展开更多
关键词
潜在语义索引
引文相关性
奇异值分解
信息增益
文本检索
下载PDF
职称材料
基于语义的中文信息检索技术分析与研究
12
作者
王春红
《现代计算机》
2008年第10期54-56,共3页
对隐含语义索引模型在中文文本检索中的应用进行分析,证明了隐含语义索引模型通过挖掘文本和词汇之间的隐含关系较好地实现了语义检索,指出所存在的问题和进一步研究的方向。
关键词
隐含语义索引(LSI)
信息检索
svd
时间效率
下载PDF
职称材料
SDD方法在信息检索中的应用
13
作者
罗洋
战学刚
迟呈英
《计算机应用与软件》
CSCD
北大核心
2008年第7期252-253,285,共3页
介绍潜在语义索引中半离散矩阵分解SDD(Semidiscrete Matrix Decomposition)方法的使用,改进其在存储空间方面的不足,提出了SDD+方法,并比较了奇异值分解SVD(Singular Vector Decomposition)、SDD和SDD+的性能差异。
关键词
潜在语义索引
奇异值分解
半离散矩阵分解
SDD+
下载PDF
职称材料
二进制引力搜索结合LSI的混合CBIR算法
被引量:
1
14
作者
耿淼
须文波
秦向东
《湘潭大学自然科学学报》
北大核心
2017年第3期85-88,共4页
针对高级用户描述的对象与低级的图像特征之间的语义差异问题,将潜在语义索引(LSI)与二进制引力搜索(BGSA)结合,提出一种基于内容的图像检索(CBIR)算法.该算法利用BGSA同时进行自适应特征提取和特征选择,LSI作为CBIR中的一个语义模型,...
针对高级用户描述的对象与低级的图像特征之间的语义差异问题,将潜在语义索引(LSI)与二进制引力搜索(BGSA)结合,提出一种基于内容的图像检索(CBIR)算法.该算法利用BGSA同时进行自适应特征提取和特征选择,LSI作为CBIR中的一个语义模型,图像特征矩阵的构建由Gabor小波、Daubechies小波和小波矩完成.实验在Corel收集的1 000幅图像库上进行,对某些类别的图像,该算法的检索精度可高达100%,前10幅图像,算法的准确率为83.18%,对于前100幅图像,精度仅降至67.40%.相比其他优秀算法,提出算法在平均精度和平均查全率方面均有显著提高,实用性较好.
展开更多
关键词
图像特征
基于内容的图像检索(CBIR)
二进制引力搜索
潜在语义索引
下载PDF
职称材料
LSI文本挖掘技术剖析
被引量:
1
15
作者
蔡豪源
《农业图书情报学刊》
2016年第7期5-9,共5页
介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法...
介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法上的异同,通过对词项—文档矩阵进行文本挖掘的例子,指出了LSI在分析文档间内在联系所起到的作用。
展开更多
关键词
潜在语义索引
文本挖掘
向量空间模型
奇异值分解
下载PDF
职称材料
基于潜在语义索引的超链接分析模型
被引量:
2
16
作者
刘华生
刘刚
吕玉琴
《世界科技研究与发展》
CSCD
2008年第6期743-745,共3页
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎...
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎作弊以及上下文搜索和主题相关搜索问题。
展开更多
关键词
链接分析模型
潜在语义索引
搜索引擎
原文传递
基于层次搜索的潜在语义索引方法研究
被引量:
1
17
作者
李华云
金玉坚
《图书情报工作》
CSSCI
北大核心
2006年第11期36-38,共3页
针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme, LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在...
针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme, LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在信息过滤阶段保持高的查全率,在信息检索阶段保证高的查准率,从而最后达到很好的检索效果。
展开更多
关键词
潜在语义索引
层次搜索
奇异值分解(
svd
)
原文传递
题名
基于非负矩阵分解的隐含语义图像检索
被引量:
7
1
作者
梁栋
杨杰
卢进军
常宇畴
机构
上海交通大学图像处理与模式识别研究所
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2006年第5期787-790,共4页
基金
上海市科技攻关项目(03DZ19320)
文摘
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的.
关键词
图像检索
隐含语义索引
非负矩阵分解
奇异值分解
语义空间
Keywords
image retrieval
latent
semantic
indexing
(LSI)
non-negative matrix factorization (NMF)
singular value decomposition (
svd
)
semantic
space
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于P2P的隐含语义索引模型的研究
被引量:
5
2
作者
郭敏
董健全
宋智
机构
上海大学计算机工程与科学学院
出处
《计算机工程与设计》
CSCD
北大核心
2005年第11期2910-2912,2954,共4页
基金
上海市科委发展基金项目(7A05722)
文摘
P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基于文本语义的检索模型。为提高系统的查准率,扩展在P2P下的查询方式,本文提出了在P2P网络中引入隐含语义索引模型进行信息检索,并模拟实现了一个基于P2P网络的隐含语义索引模型的试验平台。
关键词
P2P
隐含语义索引模型
检索
Keywords
P2P
latent
semantic
indexing
search
ing
分类号
TP393.0 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进潜在语义分析的跨语言检索
被引量:
14
3
作者
宁健
林鸿飞
机构
大连理工大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2010年第3期105-111,共7页
基金
国家自然科学基金资助项目(60673039
60973068)
+2 种基金
国家863高科技计划资助项目(2006AA01Z151)
教育部留学人员归国科研启动基金
教育部博士点基金资助(20090041110002)
文摘
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索。
关键词
计算机应用
中文信息处理
改进潜在语义分析
语义空间
跨语言检索
svd
NMF
Keywords
computer application
Chinese information processing
improved
latent
semantic
indexing
semantic
spacel cross language IR
svd
NMF
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于支持向量机的隐含语意特征选择方法
被引量:
2
4
作者
李旻松
段琢华
机构
韶关学院计算机科学学院
出处
《计算机应用》
CSCD
北大核心
2011年第9期2429-2431,2435,共4页
基金
广东省自然科学基金博士科研启动项目(9451200501002983)
韶关市技术创新项目(韶科(成)2008-03)
文摘
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适用于高维数据例如文档的分类。为此提出基于支持向量机的特征提取方法用于选择适于分类的LSI特征。该方法利用SVM高度泛化的分类能力,通过使用在每一个规则下训练的分类器的参数对第k个特征对反向平方分解面的贡献w2k的值进行估计。实验表明当需要比LSI更少的训练和测试时间时,该方法能够以更为紧凑的表示方式提高分类性能。
关键词
隐含语意索引
向量空间模型
奇异值分解
文档矩阵
支持向量机
Keywords
latent
semantic
indexing
(LSI)
Vector Space Model (VSM)
Singular Value Decomposition (
svd
)
termdocument matrix
Support Vector Machine (SVM)
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于语义Web挖掘的宽范围扫描环境弱信号识别
被引量:
1
5
作者
顾伟
傅德胜
蔡玮
机构
南京信息工程大学江苏省网络监控中心
南京信息工程大学计算机与软件学院
南京工程学院计算机工程学院
出处
《科学技术与工程》
北大核心
2013年第29期8791-8797,共7页
基金
江苏高校优势学科建设工程项目(PAPD)资助
文摘
针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模式;最后采用一种新的弱信号最大化方法计算出相关弱信号的最大数量;并由奇异值分解的维数表示,从而实现弱信号的高效识别。实验结果表明,相比其他最先进的弱信号识别方法,所提方法取得了更好的识别性能。
关键词
弱信号
扫描环境
隐含语义索引
组织环境
奇异值分解
WEB挖掘
Keywords
weak signal
scanning environment
latent
semantic
indexing
organization's environment
svd
Web mining
分类号
TP311.11 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向化学领域网络资源的文本自动分类算法
被引量:
1
6
作者
梁春燕
夏诏杰
郭力
机构
中国科学院过程工程研究所
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期52-57,共6页
基金
国家自然科学基金资助项目(20273076)
文摘
为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影响进行了讨论.结果表明,该算法能较好地应用于化学领域网络资源的自动分类.
关键词
机器学习
化学主题搜索引擎
文本自动分类
k-近邻方法
隐含语义检索
Keywords
machine learning
chemistry-focused
search
engine
automatic text categorization
k-nearest neighbor
latent
semantic
indexing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种改进的潜在语义检索模型研究
被引量:
2
7
作者
陈燕红
刘风华
机构
新疆农业大学计算机与信息工程学院
新疆工程学院计算机工程系
出处
《计算机技术与发展》
2014年第9期120-124,共5页
基金
新疆维吾尔自治区科技攻关项目(200931103)
新疆农业大学校前期资助课题(XJAU201117)
文摘
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在语义分析生成的语义索引库,进行语义检索。通过多组实验分析确定了该模型所采用的词条权重计算方法和语义空间维数。最后,通过实验分析对比了改进后的潜在语义检索模型(ALSI)与传统潜在语义检索模型(LSI)的检索效果。结果表明,ALSI的检索效果明显好于LSI,适合应用于较大规模农业信息检索。
关键词
农业信息
垂直搜索引擎
潜在语义检索
面向农业的潜在语义检索模型
Keywords
agricultural information
vertical
search
engine
latent
semantic
indexing
ALSI
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
矩阵奇异值分解在隐含语义信息检索中的应用
被引量:
5
8
作者
何志林
王春红
机构
山西运城学院计算机科学与技术系
出处
《现代计算机》
2011年第6期21-23,27,共4页
文摘
对矩阵奇异值分解的特征进行分析,并将矩阵的奇异值分解应用于向量空间模型,对其进行改进,实现基于语义的信息检索模型,该模型能消除同义词和多义词的影响,提高了文本表示的准确性,从而使信息检索的准确率有显著提高,具有重要的实用价值。
关键词
奇异值分解
信息检索
隐含语义索引模型
Keywords
Singular Value Decomposition(
svd
)
Information Retrieval
latent
semantic
Index Model
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
XML文档聚类中基于语义的特征词权重计算方法
9
作者
龙鹏飞
石奇
机构
长沙理工大学计算机与通信工程学院
出处
《长沙理工大学学报(自然科学版)》
CAS
2015年第2期72-77,共6页
基金
国家自然科学基金资助项目(61303043)
文摘
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"长度因子"的新权重方案。并在建立向量空间模型时引入LSI理论,在词条之间搭建了语义关系,减少了原词-文档矩阵中包含的噪声,聚类速度和精度都有所提高。在IEEE无类别信息数据集上试验表明,与同类相似度计算方法和聚类方法相比,本研究方法在聚类速度和效果上都有所提高和改善。
关键词
潜在语义索引
检索结果聚类
权重算法
聚类算法
Keywords
latent
semantic
indexing
(LSI)
clustering
search
results
weighting algorithms
clustering algorithms
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种大容量文本集的智能检索方法
10
作者
金小峰
机构
延边大学工学院计算机科学与技术系智能信息处理研究室
出处
《计算机工程与应用》
CSCD
北大核心
2011年第7期143-145,158,共4页
基金
吉林省科技发展计划国际合作项目(No.20050703-1)
文摘
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。
关键词
向量空间模型
潜在语义索引
奇异值分解
文本信息检索
Keywords
Vector Space Model (VSM)
latent
semantic
indexing
(LSI)
Singular Value Decomposition (
svd
)
text informa-tion retrieval
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于引文相关性排序的科技论文检索方法
被引量:
3
11
作者
尹盼盼
崔荣一
机构
延边大学计算机科学与技术学科智能信息处理研究室
出处
《计算机工程与设计》
CSCD
北大核心
2011年第12期4223-4226,4250,共5页
基金
国家自然科学基金项目(69362001)
文摘
为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特征项的权重,构造引文的词项-文档关联矩阵,并利用奇异值分解方法构造引文的潜在语义空间,计算查询论文与文档库中论文的引文语义相关性;采用信息增益方法确定了引文相关性阈值,将引文相关性超过阈值的科技论文作为检索结果返回。实验结果表明,提出的检索方法的准确率、召回率、综合性能均高于基于概括性信息(标题、摘要、关键词)的检索方法。
关键词
潜在语义索引
引文相关性
奇异值分解
信息增益
文本检索
Keywords
latent
semantic
indexing
citation relevance
svd
information gain
text retrieval
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于语义的中文信息检索技术分析与研究
12
作者
王春红
机构
运城学院计算机科学与技术系
出处
《现代计算机》
2008年第10期54-56,共3页
文摘
对隐含语义索引模型在中文文本检索中的应用进行分析,证明了隐含语义索引模型通过挖掘文本和词汇之间的隐含关系较好地实现了语义检索,指出所存在的问题和进一步研究的方向。
关键词
隐含语义索引(LSI)
信息检索
svd
时间效率
Keywords
latent
semantic
indexing
(LSI)
Information Retrieval
svd
Time Efficiency
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
SDD方法在信息检索中的应用
13
作者
罗洋
战学刚
迟呈英
机构
辽宁科技大学计算机科学与工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2008年第7期252-253,285,共3页
文摘
介绍潜在语义索引中半离散矩阵分解SDD(Semidiscrete Matrix Decomposition)方法的使用,改进其在存储空间方面的不足,提出了SDD+方法,并比较了奇异值分解SVD(Singular Vector Decomposition)、SDD和SDD+的性能差异。
关键词
潜在语义索引
奇异值分解
半离散矩阵分解
SDD+
Keywords
latent
semantic
indexing
svd
SDD SDD +
分类号
TP333 [自动化与计算机技术—计算机系统结构]
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
二进制引力搜索结合LSI的混合CBIR算法
被引量:
1
14
作者
耿淼
须文波
秦向东
机构
太湖学院物联网工程学院
江南大学物联网工程学院
出处
《湘潭大学自然科学学报》
北大核心
2017年第3期85-88,共4页
基金
江苏省高校自然科学研究项目(14KJB520036)
文摘
针对高级用户描述的对象与低级的图像特征之间的语义差异问题,将潜在语义索引(LSI)与二进制引力搜索(BGSA)结合,提出一种基于内容的图像检索(CBIR)算法.该算法利用BGSA同时进行自适应特征提取和特征选择,LSI作为CBIR中的一个语义模型,图像特征矩阵的构建由Gabor小波、Daubechies小波和小波矩完成.实验在Corel收集的1 000幅图像库上进行,对某些类别的图像,该算法的检索精度可高达100%,前10幅图像,算法的准确率为83.18%,对于前100幅图像,精度仅降至67.40%.相比其他优秀算法,提出算法在平均精度和平均查全率方面均有显著提高,实用性较好.
关键词
图像特征
基于内容的图像检索(CBIR)
二进制引力搜索
潜在语义索引
Keywords
image feature
content-based image ret r ieval
binary gravi ty
search
latent
semantic
index ing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
LSI文本挖掘技术剖析
被引量:
1
15
作者
蔡豪源
机构
广州图书馆
出处
《农业图书情报学刊》
2016年第7期5-9,共5页
文摘
介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法上的异同,通过对词项—文档矩阵进行文本挖掘的例子,指出了LSI在分析文档间内在联系所起到的作用。
关键词
潜在语义索引
文本挖掘
向量空间模型
奇异值分解
Keywords
latent
semantic
indexing
Text mining
VSM
svd
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于潜在语义索引的超链接分析模型
被引量:
2
16
作者
刘华生
刘刚
吕玉琴
机构
北京邮电大学电子工程学院
出处
《世界科技研究与发展》
CSCD
2008年第6期743-745,共3页
文摘
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引[1,2]以及文档聚类分析的内容分析技术,能很好的适应新增W eb页面,并且能用来解决基于链接和基于内容的搜索引擎作弊以及上下文搜索和主题相关搜索问题。
关键词
链接分析模型
潜在语义索引
搜索引擎
Keywords
hypedink analysis model
latent
semantic
indexing
web
search
engine
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于层次搜索的潜在语义索引方法研究
被引量:
1
17
作者
李华云
金玉坚
机构
上海大学国际工商管理学院
出处
《图书情报工作》
CSSCI
北大核心
2006年第11期36-38,共3页
文摘
针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme, LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在信息过滤阶段保持高的查全率,在信息检索阶段保证高的查准率,从而最后达到很好的检索效果。
关键词
潜在语义索引
层次搜索
奇异值分解(
svd
)
Keywords
latent semantic indexing level search svd
分类号
G354 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于非负矩阵分解的隐含语义图像检索
梁栋
杨杰
卢进军
常宇畴
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2006
7
下载PDF
职称材料
2
基于P2P的隐含语义索引模型的研究
郭敏
董健全
宋智
《计算机工程与设计》
CSCD
北大核心
2005
5
下载PDF
职称材料
3
基于改进潜在语义分析的跨语言检索
宁健
林鸿飞
《中文信息学报》
CSCD
北大核心
2010
14
下载PDF
职称材料
4
基于支持向量机的隐含语意特征选择方法
李旻松
段琢华
《计算机应用》
CSCD
北大核心
2011
2
下载PDF
职称材料
5
基于语义Web挖掘的宽范围扫描环境弱信号识别
顾伟
傅德胜
蔡玮
《科学技术与工程》
北大核心
2013
1
下载PDF
职称材料
6
面向化学领域网络资源的文本自动分类算法
梁春燕
夏诏杰
郭力
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004
1
下载PDF
职称材料
7
一种改进的潜在语义检索模型研究
陈燕红
刘风华
《计算机技术与发展》
2014
2
下载PDF
职称材料
8
矩阵奇异值分解在隐含语义信息检索中的应用
何志林
王春红
《现代计算机》
2011
5
下载PDF
职称材料
9
XML文档聚类中基于语义的特征词权重计算方法
龙鹏飞
石奇
《长沙理工大学学报(自然科学版)》
CAS
2015
0
下载PDF
职称材料
10
一种大容量文本集的智能检索方法
金小峰
《计算机工程与应用》
CSCD
北大核心
2011
0
下载PDF
职称材料
11
基于引文相关性排序的科技论文检索方法
尹盼盼
崔荣一
《计算机工程与设计》
CSCD
北大核心
2011
3
下载PDF
职称材料
12
基于语义的中文信息检索技术分析与研究
王春红
《现代计算机》
2008
0
下载PDF
职称材料
13
SDD方法在信息检索中的应用
罗洋
战学刚
迟呈英
《计算机应用与软件》
CSCD
北大核心
2008
0
下载PDF
职称材料
14
二进制引力搜索结合LSI的混合CBIR算法
耿淼
须文波
秦向东
《湘潭大学自然科学学报》
北大核心
2017
1
下载PDF
职称材料
15
LSI文本挖掘技术剖析
蔡豪源
《农业图书情报学刊》
2016
1
下载PDF
职称材料
16
基于潜在语义索引的超链接分析模型
刘华生
刘刚
吕玉琴
《世界科技研究与发展》
CSCD
2008
2
原文传递
17
基于层次搜索的潜在语义索引方法研究
李华云
金玉坚
《图书情报工作》
CSSCI
北大核心
2006
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部