期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于潜在语义标引的WEB文档自动分类 被引量:9
1
作者 戚涌 徐永红 刘凤玉 《计算机工程与应用》 CSCD 北大核心 2004年第22期28-31,共4页
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若... Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。 展开更多
关键词 WEB挖掘 潜在语义标引 最佳鉴别变换 分类
下载PDF
基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究 被引量:27
2
作者 李毅 庞景安 《情报学报》 CSSCI 北大核心 2003年第4期403-411,共9页
为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的... 为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的语义类型和语义关系,进一步完善了医学信息语义网络.以信息检索的认知理论为依据,建立了基于三层概念语义网络结构的中文医学信息语义标引体系和语义检索模型.对扩展检索和语义检索进行统计学Kappa检验,认为两种检索方法的一致性非常显著(p<0.01);与扩展检索中的任何一种方法相比,语义检索方法具有更高的检索效率. 展开更多
关键词 中文信息 医学信息 信息检索 检索效率 语义 语义检索 语义标引 语义网络 扩展检索 医学语言系统 UMLS
下载PDF
基于本体的语义标引研究与实现 被引量:8
3
作者 张功杰 黄穗 《计算机工程与设计》 CSCD 北大核心 2008年第8期2078-2080,共3页
标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。... 标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。为了更清晰的描述标引过程,建立了基于本体的语义标引模型,并对模型中各环节进行详细的功能定义。参照具体的实例本体进行实验和分析。 展开更多
关键词 语义标引 本体 语义向量 概念相似度 语义相似度 语义检索
下载PDF
医学信息资源组织与管理——深化标引和语义标引 被引量:3
4
作者 张磊 张桂云 龙莉艳 《中华医学图书情报杂志》 CAS 2009年第4期6-7,19,共3页
探讨了深化标引和语义标引的现实需求和可行性,提出了深化标引和语义标引的研究思路。
关键词 信息资源建设 信息资源管理 语义标引 深化标引
下载PDF
潜在语义标引(LSI)研究综述 被引量:6
5
作者 孙海霞 成颖 《现代图书情报技术》 CSSCI 北大核心 2007年第9期49-53,共5页
在回顾我国潜在语义标引技术的研究成果基础上,分析、总结我国现有潜在语义标引研究的不足,指出我国潜在语义标引的进一步研究方向。
关键词 潜在语义标引 文本处理 信息检索
下载PDF
基于隐性语义标引的知识匹配模型及算法分析 被引量:2
6
作者 赵涛 袁兰静 曾金平 《中国地质大学学报(社会科学版)》 2006年第3期54-56,共3页
本文从企业知识共享角度出发,提出通过编写用户简档来映射企业中员工的知识,运用隐性语义标引技术建立了知识文档匹配模型,探讨了知识匹配模型的算法实现,从而使得用户简档准确定位企业的知识源,实现企业知识共享的目的。
关键词 知识共享 隐性语义标引 知识文档向量 企业知识共享
下载PDF
潜在语义标引在中文信息检索中的研究与实现 被引量:16
7
作者 居斌 《计算机工程》 CAS CSCD 北大核心 2007年第5期193-196,共4页
随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理... 随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理,以及潜在语义索引模型的原理、设计、实现,进行了研究和探讨,同时开发了一个适合中文信息检索的系统原型。对系统进行了测试,取得了较好的实验效果。 展开更多
关键词 潜在语义标引 向量空间模型 信息检索 中文
下载PDF
基于潜语义标引的自然语言检索 被引量:3
8
作者 陶跃华 孙茂松 《现代图书情报技术》 CSSCI 北大核心 2001年第5期40-41,共2页
在信息检索中 ,向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性 ,以及传统信息检索模型受到同义词、多义词的影响 ,检索的查准率不高。为了提高自然语言检索的查准率 ,我们对基于概念的信息检索模型——潜语义标引 ( L... 在信息检索中 ,向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性 ,以及传统信息检索模型受到同义词、多义词的影响 ,检索的查准率不高。为了提高自然语言检索的查准率 ,我们对基于概念的信息检索模型——潜语义标引 ( LSI)模型进行了探讨 ,并分析了基于 LSI的两个实例。 展开更多
关键词 自然语言 信息检索 语义标引 向量空间模型
下载PDF
LSI潜在语义标引方法在情报检索中的应用 被引量:11
9
作者 冯项云 《现代图书情报技术》 CSSCI 北大核心 1998年第4期19-21,53,共4页
介绍了一种基于词相依性的语义结构,被称为“潜在语义标引”的文献自动标引和检索技术。采用词频统计和奇值分解技术来捕捉文献的语义结构,得到标引词、提问和文献的向量表示,检索系统可以预测文献与提问之间的相关度。
关键词 情报检索 自动标引 向量空间模型 潜在语义标引
下载PDF
基于子空间优化的潜在语义标引技术研究 被引量:1
10
作者 季铎 常利伟 蔡东风 《沈阳航空航天大学学报》 2013年第2期60-65,共6页
潜在语义标引是一项无监督的特征抽取技术,并且其有效性在信息检索等多个研究领域得到证明。由于该技术的特征抽取效果完全依赖于数据的特征分布,因此对数据的优化能够较好改善技术的有效性。提出了一种潜在语义标引的优化技术-增广空... 潜在语义标引是一项无监督的特征抽取技术,并且其有效性在信息检索等多个研究领域得到证明。由于该技术的特征抽取效果完全依赖于数据的特征分布,因此对数据的优化能够较好改善技术的有效性。提出了一种潜在语义标引的优化技术-增广空间模型,同时提出了基于文档长度和特征DF分布状态的数据分割策略,该策略的提出能够使子空间尽可能继承原始空间的良好结构。实验证明合理的子空间分割策略,不但保证了正确率,同时极大地缩短了算法的运行时间。最后,采用增广空间模型,将不同子空间进行融合,并获得较好的性能。在分类实验中分类正确率已达85.92%。 展开更多
关键词 潜在语义标引 文档频度(DF)值分布分割 增广空间模型 系统融合
下载PDF
本体论在语义标引中的应用
11
作者 李学庆 《农业图书情报学刊》 2010年第8期175-176,182,共3页
提出了一种基于本体论的网页文档的标引算法,该算法利用本体论对提取的网页特征词汇进行概念歧义的消除,然后建立本体论与网页文档之间的映射关系,从而实现对网页文档进行语义标引。
关键词 本体论 语义标引
下载PDF
纹理谱直方图与潜在语义标引在图像检索中的应用 被引量:10
12
作者 木拉提.哈米提 刘伟 童勤业 《科技通报》 2006年第3期389-394,共6页
提出一种新的描述局域像素灰度变化的纹理谱方法,并将该方法抽取出的纹理谱直方图特征用于图像检索。实验表明该特征计算简单,检索结果较好,是一种适于图像检索的底层特征。同时将应用于文本检索领域的潜在语义标引方法用于图像检索,并... 提出一种新的描述局域像素灰度变化的纹理谱方法,并将该方法抽取出的纹理谱直方图特征用于图像检索。实验表明该特征计算简单,检索结果较好,是一种适于图像检索的底层特征。同时将应用于文本检索领域的潜在语义标引方法用于图像检索,并提出了一种计算近似矩阵秩的方法。实验结果显示使用该方法可以分析图像中存在的隐含语义结构,并提高检索效率。 展开更多
关键词 图像检索 纹理谱 潜在语义标引
下载PDF
基于潜在语义标引的文本聚类研究 被引量:3
13
作者 马晓佳 《情报探索》 2010年第7期3-5,共3页
文本聚类是文本数据挖掘的一个重要内容,同时也广泛应用于文本挖掘和信息检索领域。为了克服目前常用的向量空间模型中词条独立性假设的缺点,提出了基于潜在语义标引(LSI)的文本聚类方法,并详细阐述了其基本流程和各步骤的具体实现。
关键词 文本聚类 潜在语义标引 向量空间模型 奇异值分解
下载PDF
基于本体和语义标引的地质资料服务与管理研究 被引量:1
14
作者 闫东 王诚 《软件》 2017年第9期117-121,共5页
在信息化时代,高效地组织管理大量地质领域数据成为实现良好的地质资料服务与管理的关键所在。为解决我国地质资料标准化程度低及应用难度大等问题,本文提出了一种基于本体和语义标引的地质资料服务与管理方法。首先建立地质领域信息资... 在信息化时代,高效地组织管理大量地质领域数据成为实现良好的地质资料服务与管理的关键所在。为解决我国地质资料标准化程度低及应用难度大等问题,本文提出了一种基于本体和语义标引的地质资料服务与管理方法。首先建立地质领域信息资源元数据模型和关联关系模型;并根据关联模型自动化构建计算机可读的地质本体;采用基于地质本体的语义概念映射的方法将高维的词语向量转换到低维语义空间,加之词频、词位置和词跨度等权重因子的综合作用,对地质资料文本进行精准快速有效的分类,实现文本的语义标引;最后根据地质本体和语义标引开展地质资料检索试验,试验结果表明,查全率和查准率分别从75.7%和81.2%提高到80.7%和84.8%,检索效果得到了明显提升。因此,本文为地质资料的服务与管理模型设计与实现奠定了良好的基础。 展开更多
关键词 计算机应用技术 知识服务 本体 语义标引
下载PDF
潜语义标引与汉语信息检索研究 被引量:4
15
作者 刘博勤 丁晓明 《计算机科学》 CSCD 北大核心 2000年第3期93-95,共3页
1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中... 1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中拥有不同的语义,即一词多义,因此基于语词匹配的查询方法,其准确性和完整性都不够理想。尽管同义词词典的使用,在一定程度上,提高了信息检索的查全率(recall),但却降低了查询的精度,且在实际应用中,需要不断更新同义词库,才能满足系统不断变化的要求。 展开更多
关键词 语义标引 汉语信息检索 关键词 查全率
下载PDF
基于特征翻译和潜在语义标引的跨语言文本聚类实验分析 被引量:3
16
作者 邓三鸿 万接喜 +1 位作者 王昊 刘喜文 《现代图书情报技术》 CSSCI 北大核心 2014年第1期28-35,共8页
【目的】通过多组实验来分析跨语言文本聚类中的基于特征翻译和潜在语义标引性能、注意事项和发展方向。【方法】从有关双语站点选取2 736篇中英文对齐的双语新闻语料,以基于特征翻译和潜在语义标引这两种方法分别进行文本聚类实验,并... 【目的】通过多组实验来分析跨语言文本聚类中的基于特征翻译和潜在语义标引性能、注意事项和发展方向。【方法】从有关双语站点选取2 736篇中英文对齐的双语新闻语料,以基于特征翻译和潜在语义标引这两种方法分别进行文本聚类实验,并进行各自召回率、准确率、F值的对比。【结果】基于特征翻译的方法处理相对简单,能明显提升多语言文本的聚类效果;基于潜在语义标引的方法由于方法自身在时间和空间复杂度以及其他固有缺陷,最终结果差强人意。【局限】样本丰富度有待进一步扩展,期待在高性能计算环境下对LSI方法进行更全面的实验。【结论】基于特征翻译的方法需进一步提高翻译系统的性能,而LSI方法则需要解决计算复杂度、K值选取等问题。 展开更多
关键词 跨语言文本聚类 特征翻译 潜在语义标引
原文传递
基于领域本体的文献语义标引模式的构建研究 被引量:2
17
作者 王欣 孔庆杰 徐宝祥 《情报科学》 CSSCI 北大核心 2013年第9期88-92,共5页
提出了基于领域本体的文献语义标引模式,并利用跨学科研究法、信息研究方法及定量与定性相结合分析法,通过构建领域本体模块、文本处理模块和语义向量模块,使检索系统提高了查全率并降低了误检率。
关键词 领域本体 语义标引 模式构建
原文传递
基于本体和Word2Vec的文本知识片段语义标引 被引量:9
18
作者 唐晓波 翟夏普 《情报科学》 CSSCI 北大核心 2019年第4期97-102,共6页
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片段语义标引的流程框架,并对本... 【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知识的文本信息组织提供了有益的参考。 展开更多
关键词 本体 语义标引 语义识别 文本检索
原文传递
基于语义网的网络信息检索相关性研究 被引量:20
19
作者 何绍华 宫兆晖 《情报杂志》 CSSCI 北大核心 2007年第12期120-123,共4页
针对传统网络信息检索中出现的查全率和查准率低下的问题,对Mizzaro相关性理论以及语义网理论进行介绍,指出查全率和查准率不高的主要原因在于检索算法采用词型匹配而非词义匹配以及对来源信息的标引缺乏语义描述信息,提出一种语义信息... 针对传统网络信息检索中出现的查全率和查准率低下的问题,对Mizzaro相关性理论以及语义网理论进行介绍,指出查全率和查准率不高的主要原因在于检索算法采用词型匹配而非词义匹配以及对来源信息的标引缺乏语义描述信息,提出一种语义信息标引方法和语义查询扩展方法来改善查全率和查准率,然后通过一个计算机科学领域本体实例详细阐述实现过程。 展开更多
关键词 语义 相关性 查询扩展 语义标引
下载PDF
解读语义对等网——一种很有潜力的分布式信息资源管理与共享环境 被引量:1
20
作者 秦春秀 赵捧未 刘成山 《情报理论与实践》 CSSCI 北大核心 2014年第7期123-128,共6页
文章通过对国内外该领域近几年的相关文献进行系统跟踪,对这些文献进行筛选、分析和分类,探讨了语义对等网的基本内涵;简要剖析了语义对等网的架构和模型;并从资源语义标引和组织、语义检索、语义查询、语义互操作4个方面系统分析了语... 文章通过对国内外该领域近几年的相关文献进行系统跟踪,对这些文献进行筛选、分析和分类,探讨了语义对等网的基本内涵;简要剖析了语义对等网的架构和模型;并从资源语义标引和组织、语义检索、语义查询、语义互操作4个方面系统分析了语义对等网上的资源语义处理问题;初步探讨了语义对等网在图书情报领域可能的研究与应用趋势。 展开更多
关键词 语义对等网 语义标引 语义检索 语义查询 互操作 信息资源管理
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部