期刊文献+
共找到262篇文章
< 1 2 14 >
每页显示 20 50 100
基于语义排序功能实现对比文件快速筛选
1
作者 陈立兵 《科技创新与生产力》 2024年第6期19-22,共4页
为提高专利的审查质量和效率,本文提出了在智能检索系统下灵活运用语义排序功能以实现对比文件的快速筛选。通过结合一个实际案例的检索分析,阐述了如何在检索结果中运用语义排序功能。采用申请号或原权利要求作为一次语义排序基准,并... 为提高专利的审查质量和效率,本文提出了在智能检索系统下灵活运用语义排序功能以实现对比文件的快速筛选。通过结合一个实际案例的检索分析,阐述了如何在检索结果中运用语义排序功能。采用申请号或原权利要求作为一次语义排序基准,并以发明构思作为二次语义排序基准,可以将目标文献的排序提前,有效提高筛选效率。 展开更多
关键词 语义排序 对比文件 专利检索 发明构思
下载PDF
稀疏向量匹配技术在智能信息快速搜索中的运用评价
2
作者 胡若云 刘鹏 +2 位作者 张燕 金家红 赵天成 《粘接》 CAS 2024年第5期177-180,共4页
针对传统的电网领域搜索系统通常依赖关键词,存在查准率和召回率低的问题,无法为用户提供高效智能的信息检索体验。提出了一种基于稀疏向量匹配和机器阅读理解的电力文件智能搜索问答算法。通过对于电力文档中的文字内容进行向量化编码... 针对传统的电网领域搜索系统通常依赖关键词,存在查准率和召回率低的问题,无法为用户提供高效智能的信息检索体验。提出了一种基于稀疏向量匹配和机器阅读理解的电力文件智能搜索问答算法。通过对于电力文档中的文字内容进行向量化编码,建立语义索引,针对用户搜索的问题进行编码和机器阅读理解,实现自然语言问答式的智能搜索。结合稀疏向量匹配的快速检索召回能力和机器阅读理解的精准回答特性,同时提高了搜索系统的查准率和召回率,有效提高了用户的搜索体验和信息获取效率。实验结果表明该方法准确率和召回率均有较大提升。 展开更多
关键词 文档搜索 语义搜索 稀疏向量 机器阅读理解 智能问答
下载PDF
基于Softmax回归分类模型的网页搜索排序算法
3
作者 党米花 《吉林大学学报(信息科学版)》 CAS 2024年第5期985-990,共6页
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页... 针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。 展开更多
关键词 Softmax回归分类模型 网页搜索排序 文本预处理 TF-IDF算法 Okapi BM25算法
下载PDF
ISTC: A New Method for Clustering Search Results 被引量:2
4
作者 ZHANG Wei XU Baowen +1 位作者 ZHANG Weifeng XU Junling 《Wuhan University Journal of Natural Sciences》 CAS 2008年第4期501-504,共4页
A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phr... A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phrases, which improve the accuracy of clustering. Also, the equation to measure the in-dependence of a phrase is proposed in this paper. The new algorithm which improves suffix tree clustering algorithm (STC) is named as improved suffix tree clustering (ISTC). To validate the proposed algorithm, a prototype system is implemented and used to cluster several groups of web search results obtained from Google search engine. Experimental results show that the improved algorithm offers higher accuracy than traditional suffix tree clustering. 展开更多
关键词 Web search results clustering suffix tree term frequency-inverse document frequency (TFIDF) independence of phrases
下载PDF
人工智能机器人技术在图书馆的应用 被引量:1
5
作者 燕卓君 《信息与电脑》 2023年第23期162-164,共3页
文章利用自然语言处理和机器学习技术,理解图书馆用户的检索意图并提供准确的文献检索结果,分析用户的查询语句和历史检索记录,学习和识别用户的偏好,从而提供个性化的检索服务。实验结果表明,文章应用人工智能机器人技术构建的文献自... 文章利用自然语言处理和机器学习技术,理解图书馆用户的检索意图并提供准确的文献检索结果,分析用户的查询语句和历史检索记录,学习和识别用户的偏好,从而提供个性化的检索服务。实验结果表明,文章应用人工智能机器人技术构建的文献自动检索系统具有较高的准确性和可靠性,能够有效提高图书馆文献检索的效率和质量。 展开更多
关键词 人工智能机器人技术 图书馆 文献自动搜索
下载PDF
可跟踪段落状态的结构化文档协作管理的研究
6
作者 丁旭渊 吕书龙 《福建电脑》 2023年第1期66-69,共4页
针对流式文档在多人协作过程中存在的协同控制与部分文档更新处理管理难的问题,探索新的控制方案十分必要。本文提出了一种以段落为控制节点的分解文档管理方案,对流式文档的控制顺序、段落管理、文本、表格、图像管理提出了具体的管理... 针对流式文档在多人协作过程中存在的协同控制与部分文档更新处理管理难的问题,探索新的控制方案十分必要。本文提出了一种以段落为控制节点的分解文档管理方案,对流式文档的控制顺序、段落管理、文本、表格、图像管理提出了具体的管理结构。应用方案的结果表明,采用该方案可以解决多人文档协同工作场景下的制作管理同步的问题。 展开更多
关键词 核查比对 文档处理器 字符串查找 短文本分类 文本分割
下载PDF
基于聚类BNR扩展模型的信息检索研究 被引量:2
7
作者 杨断利 黄勇 +2 位作者 王克俭 杨素林 李岩 《计算机工程与应用》 CSCD 北大核心 2008年第13期137-140,共4页
使用聚类技术对BNR进行扩展,得到一个新的4层模型,该模型同时使用了术语间和文档间的相近和相似关系,将此扩展模型和简单的RNR、扩展的BNRM模型比较,实验证实信息检索系统的检准率和检全率都有所提高。
关键词 BNR 扩展模型 聚类技术 信息检索 文档聚类
下载PDF
科技查新流程对查新质量的影响 被引量:9
8
作者 郝慧 胡娟 《现代情报》 CSSCI 北大核心 2015年第5期149-152,共4页
本文首先对清华大学查新站与北京工业大学查新室的查新流程进行了对比,前者具有检索策略制定客观、科学,文献分析深入,报告格式有条理的优势,最终的查新质量有保证,而后者具有报告周期可控以及二次审核查新报告的特点,对查新效率和查新... 本文首先对清华大学查新站与北京工业大学查新室的查新流程进行了对比,前者具有检索策略制定客观、科学,文献分析深入,报告格式有条理的优势,最终的查新质量有保证,而后者具有报告周期可控以及二次审核查新报告的特点,对查新效率和查新质量的提高很有帮助。论文另外对查新流程中检索词的选择及检索策略的制定中经常遇到的查全率和检索结果为零的情况进行了举例分析,认为检索式的制定要根据不同检索词及其逻辑关系进行适当调整和取舍,防止得出片面的查新结论,造成新颖性误判。 展开更多
关键词 科技查新 查新流程 文献检索 检索词 检索式
下载PDF
基于词频统计的个性化信息过滤技术 被引量:12
9
作者 张国印 陈先 皮鹏 《哈尔滨工程大学学报》 EI CAS CSCD 2003年第1期63-67,共5页
对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典... 对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典的构建及词条权值调整等环节.然后提出了一种基于词频统计的个性化文档过滤算法,该算法对传统的向量空间模型法做了改进,使之能够更好地计算文档与用户个性词典之间的相关度,根据用户的兴趣爱好对文档进行相关度的过滤、排序,并给出了实验数据.实验结果表明该方法较好地解决了智能搜索引擎中Internet信息过滤、排序的问题. 展开更多
关键词 搜索引擎 文档过滤 向量空间模型法 词频统计 个性词典
下载PDF
基于主题词频数特征的文本主题划分 被引量:11
10
作者 康恺 林坤辉 周昌乐 《计算机应用》 CSCD 北大核心 2006年第8期1993-1995,共3页
目前文本分类所采用的文本—词频矩阵具有词频维数过大和过于稀疏两个特点,给计算造成了一定困难。为解决这一问题,从用户使用搜索引擎时选择所需文本的心理出发,提出了一种基于主题词频数特征的文本主题划分方法。该方法首先根据统计... 目前文本分类所采用的文本—词频矩阵具有词频维数过大和过于稀疏两个特点,给计算造成了一定困难。为解决这一问题,从用户使用搜索引擎时选择所需文本的心理出发,提出了一种基于主题词频数特征的文本主题划分方法。该方法首先根据统计方法筛选各文本类的主题词,然后以主题词类替代单个词作为特征采用模糊C-均值(FCM)算法施行文本聚类。实验获得了较好的主题划分效果,并与一种基于词聚类的文本聚类方法进行了过程及结果中多个方面的比较,得出了一些在实施要点和应用背景上较有意义的结论。 展开更多
关键词 搜索引擎 文本聚类 模糊C-均值 主题词筛选
下载PDF
搜索引擎中的聚类浏览技术 被引量:9
11
作者 李红梅 丁振国 +1 位作者 周水生 周利华 《中文信息学报》 CSCD 北大核心 2008年第3期56-63,共8页
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,... 搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。 展开更多
关键词 计算机应用 中文信息处理 搜索引擎 文档聚类 信息检索 聚类标识
下载PDF
基于RDF句子的语义网文档搜索 被引量:4
12
作者 吴鸿汉 瞿裕忠 李慧颖 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期255-263,共9页
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,... 语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升. 展开更多
关键词 语义网 搜索引擎 语义网文档搜索 RDF句子 片段提取
下载PDF
搜索引擎的文档预处理技术研究 被引量:2
13
作者 陶跃华 赵波 杨秀国 《计算机科学》 CSCD 北大核心 2002年第7期111-112,100,共3页
搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询.设计搜索引擎的第一步就是对输入的各项进行规格化处理,使... 搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询.设计搜索引擎的第一步就是对输入的各项进行规格化处理,使之标准化. 展开更多
关键词 搜索引擎 文档预处理 数据结构 网页标引 计算机网络 信息检索
下载PDF
科技查新中专利文献的检索与对比分析 被引量:9
14
作者 王晓丽 景怀宇 《现代情报》 CSSCI 北大核心 2015年第7期89-92,共4页
科技查新中通常采用官方免费专利数据库和商业集成专利数据库相结合的方式获取专利文献,检索时需要注意检索词的合理确定和检索字段的适当限制。对于检索到的专利文献,查新人员应当依据查新点新颖性判断原则选取最适合的对比文献,并将... 科技查新中通常采用官方免费专利数据库和商业集成专利数据库相结合的方式获取专利文献,检索时需要注意检索词的合理确定和检索字段的适当限制。对于检索到的专利文献,查新人员应当依据查新点新颖性判断原则选取最适合的对比文献,并将其以恰当的形式,准确的措辞有效地呈现在科技查新报告中。本文依据专利文献的特点,阐述了在科技查新过程中如何有效检索及正确对比分析专利文献,旨在为科技查新人员提供借鉴和参考。 展开更多
关键词 科技查新 专利文献 检索 对比分析
下载PDF
用户信息搜索行为与认知的国内外文献统计分析研究 被引量:7
15
作者 甘利人 吴鹏 钱敏 《现代情报》 CSSCI 2010年第9期3-8,共6页
基于认知理论的用户信息搜索行为研究越来越受到情报领域的重视,我们通过Science Direct期刊全文数据库搜索获得该研究方向的100多篇国外文献,并通过中文数据库CNKI获得百余篇国内相关文献,分别对国内外文献做了统计分析。总体来说,用... 基于认知理论的用户信息搜索行为研究越来越受到情报领域的重视,我们通过Science Direct期刊全文数据库搜索获得该研究方向的100多篇国外文献,并通过中文数据库CNKI获得百余篇国内相关文献,分别对国内外文献做了统计分析。总体来说,用户信息搜索行为与认知研究尚处于起步阶段,相关研究还有很大的提升空间。 展开更多
关键词 信息搜索行为 认知 文献统计
下载PDF
影响查新咨询工作质量的相关因素及对策 被引量:5
16
作者 刘莉 逄大欣 《情报科学》 CSSCI 1999年第5期512-514,共3页
本文从4个方面讨论了影响查新咨询工作质量的相关因素,如用户提问的模糊性、查新人员的主观因素以及文献支持系统的选择等,并对提高查新咨询工作质量提出几点建议。
关键词 查新咨询 文献检索 信息服务
下载PDF
半结构化数据相似搜索的索引技术研究 被引量:11
17
作者 杨建武 陈晓鸥 《计算机学报》 EI CSCD 北大核心 2002年第11期1219-1226,共8页
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想... 为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想,避免了根据坐标维进行分裂时所要求的维不相关性,同时在节点组织、分裂算法和搜索算法等方面进行了改进,提出了新的搜索剪枝策略.实验表明,该结构及算法对海量半结构化数据相似搜索的效率明显优于传统算法. 展开更多
关键词 半结构化数据 相似搜索 索引 相似索引 聚类 数据挖掘 数据库 多路平衡树
下载PDF
Web信息检索服务系统与搜索引擎 被引量:11
18
作者 常桂然 张晓辉 《计算机科学》 CSCD 北大核心 1998年第5期86-90,共5页
引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某... 引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某种次序排列组织,使用户可以通过索引进行查阅。 展开更多
关键词 信息检索系统 WEB 搜索引擎
下载PDF
现代文检课教材的结构及有关问题 被引量:3
19
作者 丛立 古今 陈茜 《图书馆学研究》 2007年第4期73-75,共3页
文章提出文检课教材的1:1:8结构体系,依此比例安排并序列基础理论、手工检索、计算机检索的内容。以理论为基础,应用为主体,以Internet网络检索为龙头,辅以光盘检索、联机检索、手工检索,构筑全方位、多层面体系结构,并从开放性、综合... 文章提出文检课教材的1:1:8结构体系,依此比例安排并序列基础理论、手工检索、计算机检索的内容。以理论为基础,应用为主体,以Internet网络检索为龙头,辅以光盘检索、联机检索、手工检索,构筑全方位、多层面体系结构,并从开放性、综合性、系统性等若干方面就其总体规划加以探讨。 展开更多
关键词 文检课教材 文检课改革 信息检索
下载PDF
一种基于后缀树的Web搜索结果聚类方法 被引量:5
20
作者 吴江宁 王治江 《情报学报》 CSSCI 北大核心 2010年第1期78-83,共6页
为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别... 为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量。测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性。 展开更多
关键词 WEB搜索 后缀树 文档聚类
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部