期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
全文检索单元词索引技术研究 被引量:4
1
作者 靖培栋 宋雯斐 《情报理论与实践》 CSSCI 北大核心 2006年第1期118-121,共4页
单汉字索引是中文全文检索索引技术中一个主要方法,此方法在索引的空间和检索的效率方面都存在不足。本文引入单元词索引,并分析试验数据,表明引入单元词索引后,索引的空间效率和检索的时间效率均有提高。
关键词 信息检索 全文检索/单元词索引 检索方法
下载PDF
一种高效的全文检索索引技术 被引量:7
2
作者 陈玮 陈玉鹏 +1 位作者 石晶 陆达 《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词 全文检索 索引 内存缓存 索引压缩
下载PDF
中文全文检索系统截词检索的实现研究 被引量:4
3
作者 靖培栋 宋雯斐 《情报科学》 CSSCI 北大核心 2006年第6期884-887,共4页
本文探讨了在基于关键词索引的中文全文检索系统中实现各种截词检索的方法,建立了关键词索引的Hash索引,这种方法即能节省内存又提高检索效率。
关键词 检索 全文检索 关键索引
下载PDF
中文全文检索技术研究 被引量:1
4
作者 夏亚云 《图书情报论坛》 1999年第1期41-43,共3页
1 认识全文检索一般而言,用户在信息检索中的最终要求是查询全文,因为题录和文摘都是二次文献,提供的信息不够全面,只有全文才更符合用户需求。全文检索系统与传统的检索系统的区别在于它能检索出所有包含检索词的全文,能对文献中所出... 1 认识全文检索一般而言,用户在信息检索中的最终要求是查询全文,因为题录和文摘都是二次文献,提供的信息不够全面,只有全文才更符合用户需求。全文检索系统与传统的检索系统的区别在于它能检索出所有包含检索词的全文,能对文献中所出现的词、字进行检索; 展开更多
关键词 中文全文检索技术 检索范围 检索 检索 查准率 索引算法 主题 文章 信息检索 全文检索系统
下载PDF
具有三级索引词库结构的中文分词方法研究 被引量:16
5
作者 肖红 许少华 李欣 《计算机应用研究》 CSCD 北大核心 2006年第8期49-51,共3页
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文... 提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。 展开更多
关键词 中文切 正向最大匹配 索引密度 全文检索
下载PDF
一种基于三级索引词库结构的中文分词方法研究 被引量:5
6
作者 段小斌 林雯 +1 位作者 阮百尧 陈基漓 《计算机与数字工程》 2007年第7期47-49,共3页
提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全... 提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全和查准率。 展开更多
关键词 索引结构 中文切 全文检索
下载PDF
基于字、词、词组的中文搜索引擎分词系统 被引量:3
7
作者 陈天娥 赵曾贻 《武汉工业学院学报》 CAS 2002年第3期37-40,共4页
分析了全文检索系统中常用的基于字表和基于词表的中文分词方法的优缺点 ,提出了基于字、词、词组混合模型的中文搜索引擎分词系统 ;并利用广义语词概念 ,设计了分词词典 ,改进了最大匹配分词算法 (MM) ;最后把分词系统应用于全文检索中。
关键词 中文 索引 系统 全文检索 最大匹配算法 广义语
下载PDF
美国《工程索引》与英国《科学文摘》主题索引的比较 被引量:1
8
作者 赵庆玲 李春华 金砺 《晋图学刊》 1993年第1期60-61,共2页
美国《工程索引》(简称Ei),英国《科学文摘》(简称SA),它们都具备有主题索引,了解和掌握它们各自主题索引的特点,比较它们的异同,对于检索者使用《Ei》和《SA》从主题途径取得满意的检索效果是十分重要的。主题索引是用题词作为检索标识... 美国《工程索引》(简称Ei),英国《科学文摘》(简称SA),它们都具备有主题索引,了解和掌握它们各自主题索引的特点,比较它们的异同,对于检索者使用《Ei》和《SA》从主题途径取得满意的检索效果是十分重要的。主题索引是用题词作为检索标识,并按字顺排列形成的索引。在主题索引中,又可视所用的标识不同,分为关键词索引、单元词索引、标题词索引及叙词索引。 展开更多
关键词 主题索引 关键索引 《科学文摘》 检索标识 单元索引 检索效果 检索 累积索引 刊都 主要文献
下载PDF
我国情报检索语言形式化语际转换系统的现状及其新进展
9
作者 张正强 《技术与市场》 1992年第6期449-454,共6页
本文分析了我国情报检索语言形式化语际转换系统的现状和进展,指出了与国外先进水平的差距,并就形式化语际转换系统——入口词表的编制中的几个问题做了探讨。
关键词 情报检索语言 语际转换 入口 单元 索引语言 检索效率 国外先进水平
下载PDF
各种索引语言与标引系统的比较评价——著名的“克兰菲尔德试验”概述 被引量:6
10
作者 陈光祚 《图书情报知识》 1983年第1期12-17,共6页
英国克兰菲尔德(Cranfield)航空学院图书馆长克里文敦(C·W·Cleverdon)指导下的研究小组,于1957年开始,对各种索引语言以及由这些索引语言建立起来的标引系统,就其对检索系统的性能影响问题,作了历时十年的比较试验。这就是有... 英国克兰菲尔德(Cranfield)航空学院图书馆长克里文敦(C·W·Cleverdon)指导下的研究小组,于1957年开始,对各种索引语言以及由这些索引语言建立起来的标引系统,就其对检索系统的性能影响问题,作了历时十年的比较试验。这就是有名的克兰菲尔德试验。这个试验分两个阶段进行;第一次克兰菲尔德试验(Cranfield Ⅰ)于1957年至1962年进行、第二次克兰菲尔德试验(Cranfield Ⅱ)于1963年至1966年进行。在情报检索系统的试验与评价方面,这个试验是具有经典意义的。它明确地提出了一套进行试验的必要条件、环境与程序,为检索系统的试验奠定了方法学的基础。 展开更多
关键词 索引语言 标引系统 情报检索系统 标引 查全率 试验与评价 单元 国际十进分类法 查准率 文献资料
下载PDF
情报检索语言大纲 被引量:4
11
作者 张琪玉 《图书馆学刊》 1981年第3期54-66,45,共14页
情报检索语言(又称情报语言、检索语言、文献工作语言、索引语言、标引语言、标引符号、标识系统)包括体系分类法、组配分类法、标题法、单元词法、叙词法(主题词法)、关键词法以及各种代码系统等。它是图书情报工作者和文献情报检索者... 情报检索语言(又称情报语言、检索语言、文献工作语言、索引语言、标引语言、标引符号、标识系统)包括体系分类法、组配分类法、标题法、单元词法、叙词法(主题词法)、关键词法以及各种代码系统等。它是图书情报工作者和文献情报检索者为实现文献情报的存贮检索所必须使用的共同语言。它的质量高低,对检索效率影响甚大。所以,它的改进和创新,是图书馆学情报学领域的一系列迫切的研究课题之一。而对它的正确使用,则又是图书情报工作人员和读者的基本功。国内对情报检索语言的研究和创制,过去偏重于体系分类法,而且有关著作又偏重于在原则上讨论对它的思想性、科学性、实用性要求及三者之间的关系,而对于它的构成原理、编制方法、影响检索效率的因素等方面的具体问题,就甚少涉及,至于讨论其它各种情报检索语言的著作,则相当稀少。最近几年,讨论如何提高体系分类法的检索效率以及研究叙词法、组配分类法的著作有所增加,但还是不多,而且多半是就一种语言进行论述的。其实,各种情报检索语言的基本原理是一致的,在方法上又有不断创新並相互渗透和综合的趋势。所以,有必要对它们进行系统的比较式的研究讨论。张琪玉同志的《大纲》,是在这方面的一个尝试。它是在武汉大学图书馆学系1980年新开设的《情报检索语言》课程的基础上抽提出来的,比较详细地系统地列出了情报检索语言的基本问题、各种情报检索语言的原理、编制法、性能以及文献分析标引等方面的各种问题要点。本刊把它刊载出来,一方面供同志们参考,另一方面作为提倡,希望在这方面的研究讨论能更广泛地开展起来。 展开更多
关键词 情报检索语言 标题 检索效率 组配分类法 索引语言 检索 主题 单元
下载PDF
情报检索语言大纲(续完) 被引量:3
12
作者 张琪玉 《图书馆学刊》 1981年第4期8-20,50,共14页
第一节单元词法的原理一、单元词法的构成原理单元词法脱胎于标题法,它是作为对标题法先组式标识的改革而出现的。单元词法目前已发展为叙词法。了解它的原理、方法和性能,有助于深入了解叙词法,也有助于进一步了解标题法。单元词法的... 第一节单元词法的原理一、单元词法的构成原理单元词法脱胎于标题法,它是作为对标题法先组式标识的改革而出现的。单元词法目前已发展为叙词法。了解它的原理、方法和性能,有助于深入了解叙词法,也有助于进一步了解标题法。单元词法的基本原理是:任何一个复合概念都可分解为若干单元概念。 展开更多
关键词 单元 情报检索语言 组配标引 等级关系 索引款目 标引深度 文献标引 标引人员
下载PDF
企业内容检索追求 查准率查全率
13
作者 钱峻英 《中国传媒科技》 2003年第7期58-60,共3页
全文检索技术的两大类别 互联网搜索引擎面向的是Internet上大量的杂乱无章的网页,主要目的是找到一些有用的参考信息和屏蔽一些有害信息,尽量把有用的网页排在前面。关于有用性,有各种度量方法。
关键词 全文检索技术 TRS按检索 查准率 查全率 企业内容检索系统 互联网 索引
下载PDF
国外检索工具的利用
14
作者 林尧泽 《情报科学》 1981年第1期64-69,共6页
本文着重介绍“常用法”,即利用检索工具检索科技资料的一种方法。在扼要地介绍了检索工具后,并提出如下步骤来使用检索工具:1.分析研究课题;2.确定检索范围和检索标志;3.选定检索工具;4.确定检索途径和方法以及具体查找过程,其中并列... 本文着重介绍“常用法”,即利用检索工具检索科技资料的一种方法。在扼要地介绍了检索工具后,并提出如下步骤来使用检索工具:1.分析研究课题;2.确定检索范围和检索标志;3.选定检索工具;4.确定检索途径和方法以及具体查找过程,其中并列举实例。 展开更多
关键词 检索工具书 文献资料 检索途径 单元索引 查找过程 字顺编排 参考文献 主题索引 主题 检索方法
下载PDF
索引因子说
15
作者 黄恩祝 《新世纪图书馆》 1987年第2期42-43,共2页
把文献中的每一个字、姓名、物名、地名、官名、机关团体名、符号,数字、篇名、书名、图名……等等按一定的顺序序列就成索引。这些被序列的字、词、数、图自古以来有如下许多不同的称谓:紧切字,紧要字、目、含意字、标题(Subject headi... 把文献中的每一个字、姓名、物名、地名、官名、机关团体名、符号,数字、篇名、书名、图名……等等按一定的顺序序列就成索引。这些被序列的字、词、数、图自古以来有如下许多不同的称谓:紧切字,紧要字、目、含意字、标题(Subject heading)、关键词(Key-word)、标字(Catchword)。 展开更多
关键词 索引 因子 科技文献 序列 标引 主题 关键 文献内容 篇名 单元
下载PDF
园区网站内全文检索系统 被引量:1
16
作者 陈暄 《网络财富》 2010年第22期198-199,共2页
因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题。HTML文件具备许多平面文件没有的优点,实现了内容、结构和表现三者的分离,适于数据表现、存储和检索。目前,HTML已经成为Web数据表... 因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题。HTML文件具备许多平面文件没有的优点,实现了内容、结构和表现三者的分离,适于数据表现、存储和检索。目前,HTML已经成为Web数据表现、存储、集成和展示的行业标准。为了更加有效地利用、加工、分析和处理HTML,本课题在前人已有工作的基础上,针对HTML文档的具体特点,提出一种文档标准化处理和关键词加权的方案。论文探讨了现有较为成熟的文档解析和中文切词技术的实现,并在此基础上加以改进使之适用于HTML文档;研究了Model-View-Controller设计模式、jsp标准标志库、表达式语言、过滤器、Servlet、Jsp等javaweb编程技术;本文分析了基于java的全文检索工具包Lucene具体实现以及它的应用,并从MVC设计思想的角度,详细的介绍了的全文检索系统的设计与实现。 展开更多
关键词 园区网站内全文检索 检索 索引 索引 中文切
原文传递
基于后验概率词格的汉语自然对话语音索引 被引量:2
17
作者 孟莎 余鹏 +1 位作者 Frank Seide 刘加 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期673-677,共5页
语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于... 语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LV SCR得到的)和66.9%(用音节识别器得到的)提高到78.8%。 展开更多
关键词 语音检索 后验概率 索引单元
原文传递
书末索引与图书内容检索 被引量:2
18
作者 苏凡 《图书情报工作》 1987年第2期23-24,40,共3页
一、引言图书是一种成熟、定型的出版物。它所提供的资料具有系统、全面、成熟、可靠等特点,因而,它是广大读者经常阅读的主要对象。图书种类繁多,卷帙浩繁。查找图书,我们通常是使用书目,但是书目著录款目均是以一书为单位,这是因为每... 一、引言图书是一种成熟、定型的出版物。它所提供的资料具有系统、全面、成熟、可靠等特点,因而,它是广大读者经常阅读的主要对象。图书种类繁多,卷帙浩繁。查找图书,我们通常是使用书目,但是书目著录款目均是以一书为单位,这是因为每种图书都有一个中心主题,内容相对稳定集中,故一本书即作为一个文献实体。 展开更多
关键词 书末索引 图书内容 内容检索 索引 出版物 人名索引 书目著录 知识单元 主要对象 索引
原文传递
联机解疑
19
作者 康紫波 《情报理论与实践》 1987年第2期32-33,共2页
关键词 文档 DIALOG系统 单元 CHEM 算符 化学物质名称 索引 MAPS 会议文献
下载PDF
试谈分类法与主题法
20
作者 何巧云 《图书馆研究》 1990年第4期29-33,共5页
本文试从分类法与主题法的产生、演变、发展及其异同和分类法、主题法一体化三个方面作简单介绍,并谈点个人意见,以求教于同仁. (一)
关键词 主题法 单元 美国国会图书馆 《中图法》 组配分类法 国际十进分类法 范畴索引 主题标引 十进
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部