期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
PS-Tree:一种基于路径的语义文档索引
1
作者 方丽英 史斌 +1 位作者 闫健卓 王普 《北京工业大学学报》 EI CAS CSCD 北大核心 2012年第9期1353-1358,共6页
针对以多个关键词形成的节点集合作为输入的语义路径包含查询问题,提出了PS-Tree结构,并将其应用到语义搜索引擎的索引结构上.PS-Tree借鉴了面向对象数据库中的集合值属性索引的方法,通过范围查询快速地遍历树形索引,将用户的多关键词... 针对以多个关键词形成的节点集合作为输入的语义路径包含查询问题,提出了PS-Tree结构,并将其应用到语义搜索引擎的索引结构上.PS-Tree借鉴了面向对象数据库中的集合值属性索引的方法,通过范围查询快速地遍历树形索引,将用户的多关键词查询输入请求对应到包含其语义连接的语义路径上,实现以节点集合作为输入的查询功能.实验结果表明,当查询关键词之间的语义距离较长时,PS-Tree结构表现出良好的性能. 展开更多
关键词 语义网 语义文档索引 路径索引
下载PDF
一种优化的基于LPI的文档索引算法FLPI
2
作者 陶剑文 赵杰煜 《计算机应用》 CSCD 北大核心 2008年第6期1566-1569,1574,共5页
LPI对于局部流形结构是优化的,但在时空上运行效率较低,使其很难应用于大型数据集。基于LPI算法,提出了一种优化的LPI算法FLPI,它将LPI问题分解为一个图嵌入问题和一个正则最小二乘问题,避免了稠密矩阵的特征值分解,显著减少了计算复杂... LPI对于局部流形结构是优化的,但在时空上运行效率较低,使其很难应用于大型数据集。基于LPI算法,提出了一种优化的LPI算法FLPI,它将LPI问题分解为一个图嵌入问题和一个正则最小二乘问题,避免了稠密矩阵的特征值分解,显著减少了计算复杂度。此外,在监督环境下,利用一个特别设计的图,使FLPI只需要解决正则最小二乘问题,进一步减少了时空开销。实时数据集实验结果显示,FLPI获得了相似或优于LPI的结果,且运行速度明显提升。 展开更多
关键词 局部保留索引 潜在语意索引 文档索引 维度归约
下载PDF
一种XML文档索引及查询处理方式 被引量:3
3
作者 眭苏博 胡运发 《计算机应用与软件》 CSCD 北大核心 2004年第6期35-37,75,共4页
本文首先论述了传统XML路径模式索引方式 ,在此基础上提出面向元素的XML文档索引方式和相关算法 ,以及使用扩展的后序遍历序号进行元素节点标识的方案 ,并给出了该索引方式和元素节点标识方案下规则路径表达式查询和树型模式查询处理的... 本文首先论述了传统XML路径模式索引方式 ,在此基础上提出面向元素的XML文档索引方式和相关算法 ,以及使用扩展的后序遍历序号进行元素节点标识的方案 ,并给出了该索引方式和元素节点标识方案下规则路径表达式查询和树型模式查询处理的方法 。 展开更多
关键词 XML文档索引 查询处理方式 后序遍历 元素节点标识 索引方式 树型模式 路径模式 规则路径表达式
下载PDF
一种融合音位属性的语音文档索引方法
4
作者 陆明明 张连海 +1 位作者 屈丹 牛铜 《计算机工程》 CAS CSCD 2012年第19期159-162,共4页
为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统建立词格,利用其信息互补性,与传统的词格进行起止节点合并。针对合并后Lattice规模增大的问题,采用基于... 为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统建立词格,利用其信息互补性,与传统的词格进行起止节点合并。针对合并后Lattice规模增大的问题,采用基于位置的分段对齐方法对其结构进行压缩。实验结果表明,该方法在提高索引覆盖率和降低最小错误率方面均优于传统的语音文档索引方法,能够有效提高语音检索性能。 展开更多
关键词 语音文档检索 语音文档索引 自动语音识别 音位属性检测 词格 信息融合
下载PDF
基于子词PSPL的汉语语音文档索引
5
作者 陆明明 张连海 屈丹 《应用科学学报》 CAS CSCD 北大核心 2013年第3期259-265,共7页
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词... 针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法. 展开更多
关键词 语音文档检索 语音文档索引 子词PSPL 词格 子词后验概率
下载PDF
多格式文档搜索引擎索引系统设计与实现 被引量:1
6
作者 方跃胜 董辉 姚宏亮 《长江大学学报(自科版)(上旬)》 CAS 2012年第7期111-113,8,共3页
随着Internet和计算机的迅猛发展,搜索引擎应需而生,越来越多的企业利用计算机处理运营过程中产生的大量电子文档。如何从这些网络和多格式文档资源中迅速、方便而准确地检索出企业用户所需的信息已成为越来越重要的问题。索引系统是搜... 随着Internet和计算机的迅猛发展,搜索引擎应需而生,越来越多的企业利用计算机处理运营过程中产生的大量电子文档。如何从这些网络和多格式文档资源中迅速、方便而准确地检索出企业用户所需的信息已成为越来越重要的问题。索引系统是搜索引擎的核心,为提高系统的查全率和查准率,设计了一种适用于文档检索的数据库存储的索引结构并建立索引库来降低索引组织的复杂度,通过布尔逻辑和向量空间的组合模型实现对检索结果排序,以返回最优文档列表。该系统在Windows环境下采用PHP开发组件实现,能够提高检索文档的查全率和查准率。 展开更多
关键词 文档索引 索引同步 检索模型
下载PDF
文档搜索引擎的解决方案及其检索功能比较分析 被引量:1
7
作者 孙良红 张玉祥 《图书馆界》 2013年第5期82-85,共4页
总结了文档搜索引擎发展过程中存在的两种主要解决方案,并分析这两种解决方案在检索功能上的差异,最后提出了文档搜索引擎的发展前景。
关键词 文档索引 信息检索 检索功能
下载PDF
iBASE Index System——文档索引服务系统
8
《中国信息导报》 2001年第9期59-60,共2页
关键词 文档索引服务系统 信息自动分类 信息发布 全文检索 系统功能
原文传递
DIALOG系统新增“世界专利索引”(WPI)文档
9
作者 江妍 《情报理论与实践》 1985年第3期38-40,共3页
1984年12月开始,DIALOG 系统新增加了德温特公司的 WPI 世界专利索引文档(DIAL-OG 350号文档)和 WPIL 世界专利近期索引文档(DIALOG 351号文档)。这两个文档只有通过使用 DIALOG 2版本软件才能进行联机检索。DIALOG2版本要求有一特殊的... 1984年12月开始,DIALOG 系统新增加了德温特公司的 WPI 世界专利索引文档(DIAL-OG 350号文档)和 WPIL 世界专利近期索引文档(DIALOG 351号文档)。这两个文档只有通过使用 DIALOG 2版本软件才能进行联机检索。DIALOG2版本要求有一特殊的联通程序(在 DIALOG 展开更多
关键词 世界专利索引 索引文档 联机检索 等同专利 温特 基本专利 文献记录 系统 专利文献 技术领域
下载PDF
索引文档检测技术应用分析
10
作者 张睿涵 《信息系统工程》 2016年第3期94-94,共1页
本文通过对索引文档检测技术基本方法及适用情况的分析,结合石油企业敏感数据文件的特征,探讨索引文档检测技术在企业数据信息防泄漏过程中应用的可能性和运用方法。
关键词 索引文档检测技术 数据指纹 数据泄漏防护
下载PDF
两美企宣布核工业开源人工智能模型研发进展
11
作者 伍浩松 张焰 《国外核新闻》 2024年第7期5-5,共1页
【本刊2024年7月综合报道】2024年5月,美国原子峡谷公司(Atomic Canyon)和NuclearN.AI公司分别宣布核工业人工智能模型研发进展。原子峡谷公司原子峡谷公司5月15日宣布,将与能源部橡树岭国家实验室(ORNL)合作,利用后者的超级计算机Front... 【本刊2024年7月综合报道】2024年5月,美国原子峡谷公司(Atomic Canyon)和NuclearN.AI公司分别宣布核工业人工智能模型研发进展。原子峡谷公司原子峡谷公司5月15日宣布,将与能源部橡树岭国家实验室(ORNL)合作,利用后者的超级计算机Frontier,训练一种专门服务于核工业的开源人工智能模型,目标是构建开源核术语知识库,帮助建设人工智能基础设施,提供高效数据导航和文档索引服务,促进数据共享,加快核设施监管审批速度。 展开更多
关键词 数据共享 人工智能 超级计算机 基础设施 文档索引 开源 核设施 数据导航
下载PDF
基于数据仓库的数据搜索引擎实践 被引量:1
12
作者 栾晓宇 《软件产业与工程》 2015年第3期52-56,共5页
针对现有数据仓库中数据种类多、应用多、指标多的情况,本文提出一种针对数据仓库的搜索引擎应用的信息技术架构,以实现对数据仓库中的应用、报表和数据的搜索功能。本文详细介绍了数据仓库搜索引擎的设计框架与工作流程,介绍了如何对... 针对现有数据仓库中数据种类多、应用多、指标多的情况,本文提出一种针对数据仓库的搜索引擎应用的信息技术架构,以实现对数据仓库中的应用、报表和数据的搜索功能。本文详细介绍了数据仓库搜索引擎的设计框架与工作流程,介绍了如何对业务语言进行解析,并介绍了如何对搜索的结果进行匹配度判定。 展开更多
关键词 索引 数据仓库 业务语言解析 文档索引
下载PDF
管理好你的Word文档
13
作者 霞子 《电脑与电信》 2000年第12期71-71,共1页
众所周知,制作文档需要使用文字处理工具,现在最流行的文字处理工具就是微软的Word系列,一般用户使用Word 97,新潮用户则使用Word 2000。我们面临的问题就是,如何方便地查看和修改已有的Word文档的内容。也许有人会说,在资源管理器中找... 众所周知,制作文档需要使用文字处理工具,现在最流行的文字处理工具就是微软的Word系列,一般用户使用Word 97,新潮用户则使用Word 2000。我们面临的问题就是,如何方便地查看和修改已有的Word文档的内容。也许有人会说,在资源管理器中找到要查看的文档点击,打开Word 97/2000显示其内容不就行了吗?这还有什么可说的。 如果只需要查看一个Word内容,这么做当然是一件十分简单易行的事。可是在实际使用中,大多数用户在制作一个新文档的时侯,需要参考已有文档的内容,因而常常需要在多个Word文档之间来回地跳转以查看已有的内容。以下两种办法可以实现方便的操作。 展开更多
关键词 索引文档 WORD文档 索引文件 文件夹 超级链接 文档内容 索引 WORD文档 文字处理 目标文件
下载PDF
Acrobat 2.0:可移植文档的策源地
14
作者 Edward Mendelson 于长云 《个人电脑》 1995年第4期16-17,共2页
Adobe Acrobat 2.0使电子出版软件较从前更加简单、方便并且更加灵活,它能够创建复杂而丰富的文档,并且将它们自由传播到不同的电脑平台。Acrobat已进一步成为一种针对电子文档制作的全用途工具。该程序现在支持许多文件类型,访问文件(... Adobe Acrobat 2.0使电子出版软件较从前更加简单、方便并且更加灵活,它能够创建复杂而丰富的文档,并且将它们自由传播到不同的电脑平台。Acrobat已进一步成为一种针对电子文档制作的全用途工具。该程序现在支持许多文件类型,访问文件(例如观看视频画面或修改电子表格)只需揿动一下鼠标即可。Acrobat2.0增加了一个可自由传播的阅读器程序,可将Acrobat文件散布到任何地方;同时它还增加了索引文档的能力以实现快速查找。由此,Acrobat2.0不仅更正了其初始版本中的失误,还为其它程序树立了仿效的标准。 展开更多
关键词 可移植 电子出版 阅读器 自由传播 文件类型 索引文档 打印机驱动程序 视频画面 电子表格 应用程序
下载PDF
一种辅以强规则学习的双层文本分类模型 被引量:3
15
作者 刘金红 陆余良 周新栋 《计算机工程》 CAS CSCD 北大核心 2007年第8期165-167,共3页
随着基于机器学习的文本自动分类方法成为主流分类技术,基于机器学习的文本分类方法往往忽视了对规则分类方法的有效运用。该文将基于规则的分类思想和基于机器学习的分类方法有机地结合起来,把规则判别看作一个分量分类器,提出了一种... 随着基于机器学习的文本自动分类方法成为主流分类技术,基于机器学习的文本分类方法往往忽视了对规则分类方法的有效运用。该文将基于规则的分类思想和基于机器学习的分类方法有机地结合起来,把规则判别看作一个分量分类器,提出了一种辅以规则补充的双层文本分类模型和一种优化的分类规则学习算法。根据该方法设计并实现了一个基于规则和N-Gram统计分类相结合的双层分类器,进行了双层分类模型与单独的N-Gram分类模型的实验,结果表明辅以规则补充的双层分类器具有更好的分类性能。 展开更多
关键词 文本分类 文档索引 分类规则学习
下载PDF
基于Lucene的中文全文检索系统的研究与设计 被引量:6
16
作者 索红光 孙鑫 《计算机工程与设计》 CSCD 北大核心 2008年第19期5083-5086,共4页
提出了一种基于Lucene的中文全文检索系统模型。通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度。在检索结果的处理上,采用文本聚类的办法,使... 提出了一种基于Lucene的中文全文检索系统模型。通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度。在检索结果的处理上,采用文本聚类的办法,使检索结果分类显示,提高了用户的查找的效率。实验数据表明,该系统在检索中文网页时,在效率、精度和结果处理等方面性能明显提高。 展开更多
关键词 全文检索 网页正文提取 中文分词模块 索引文档预处理 文本聚类
下载PDF
基于音位属性检测的PSPL改进方法
17
作者 陆明明 张连海 牛铜 《信息工程大学学报》 2012年第4期426-431,共6页
为了提高PSPL(position specific posterior lattices)作为语音文档索引时的检索性能,提出一种基于音位属性检测的PSPL改进方法。该方法首先根据信源熵准则找出原始PSPL中不确定度较大的词弧集合,然后利用音位属性对这些词弧集合进行识... 为了提高PSPL(position specific posterior lattices)作为语音文档索引时的检索性能,提出一种基于音位属性检测的PSPL改进方法。该方法首先根据信源熵准则找出原始PSPL中不确定度较大的词弧集合,然后利用音位属性对这些词弧集合进行识别结果修正以及后验概率重估,从而实现对PSPL数据结构的改善。实验结果表明,改进后的PSPL在包含更多正确识别结果的同时,解决了后验概率取值不准确的问题,其解码性能和检索性能均优于原始PSPL。 展开更多
关键词 语音文档检索 语音文档索引 PSPL 自动语音识别 音位属性检测
下载PDF
DIALOGWEB中的DIALINDEX 被引量:1
18
作者 郑菲 《现代图书情报技术》 CSSCI 北大核心 1999年第S1期126-127,141,共3页
对 Dialog联机检索系统在 Internet网上建立的主页 Dialog WEB中的免费多文档索引工具 Dialindex进行了详细介绍 ,并阐述了它在使用中的优缺点。
关键词 DIALOG 索引文档
下载PDF
WD—TQGX文献数据库的设计与压缩措施
19
作者 周宁 杨珍菊 +4 位作者 王大可 刘荣 张玉峰 梁芸 雷春明 《现代图书情报技术》 1984年第3期6-10,共5页
关键词 倒排文件 压缩措施 文献数据库 倒排索引 倒排文档 文档 存贮空间 文献库 索引文档 索取号
下载PDF
登录号在计算机流通管理中的作用
20
作者 陈能华 《图书馆杂志》 1987年第3期39-42,共4页
在手工操作流通管理中,登录号所起作用很少有人注意,但在计算机流通管理中,它扮演了重要角色。在笔者设计的TLG—01图书流通管理系统中,充分利用登录号的作用,实践证明,巧妙地利用登录号,有利于简化和优化图书流通管理过程。
关键词 登录号 计算机流通管理 流通管理系统 文档 逻辑地址 索引文档 记录 借书证 手工操作 实践证明
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部