期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
Orbit Weighting Scheme in the Context of Vector Space Information Retrieval
1
作者 Ahmad Ababneh Yousef Sanjalawe +2 位作者 Salam Fraihat Salam Al-E’mari Hamzah Alqudah 《Computers, Materials & Continua》 SCIE EI 2024年第7期1347-1379,共33页
This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schem... This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schemes like tf-idf and BM25.These conventional methods often struggle with accurately capturing document relevance,leading to inefficiencies in both retrieval performance and index size management.OWS proposes a dynamic weighting mechanism that evaluates the significance of terms based on their orbital position within the vector space,emphasizing term relationships and distribution patterns overlooked by existing models.Our research focuses on evaluating OWS’s impact on model accuracy using Information Retrieval metrics like Recall,Precision,InterpolatedAverage Precision(IAP),andMeanAverage Precision(MAP).Additionally,we assessOWS’s effectiveness in reducing the inverted index size,crucial for model efficiency.We compare OWS-based retrieval models against others using different schemes,including tf-idf variations and BM25Delta.Results reveal OWS’s superiority,achieving a 54%Recall and 81%MAP,and a notable 38%reduction in the inverted index size.This highlights OWS’s potential in optimizing retrieval processes and underscores the need for further research in this underrepresented area to fully leverage OWS’s capabilities in information retrieval methodologies. 展开更多
关键词 information retrieval orbit weighting scheme semantic text analysis Tf-Idf weighting scheme vector space model
下载PDF
Hybrid Chinese Information Retrieval Model Based on the Combination of Keyword and Concept 被引量:2
2
作者 樊孝忠 李宏乔 李良富 《Journal of Beijing Institute of Technology》 EI CAS 2003年第S1期120-123,共4页
A hybrid model that is based on the Combination of keywords and concept was put forward. The hybrid model is built on vector space model and probabilistic reasoning network. It not only can exert the advantages of key... A hybrid model that is based on the Combination of keywords and concept was put forward. The hybrid model is built on vector space model and probabilistic reasoning network. It not only can exert the advantages of keywords retrieval and concept retrieval but also can compensate for their shortcomings. Their parameters can be adjusted according to different usage in order to accept the best information retrieval result, and it has been proved by our experiments. 展开更多
关键词 hybrid information retrieval model concept retrieval vector space model probabilistic reasoning network
下载PDF
基于前缀剪枝的大规模向量空间相似检索框架
3
作者 刘健博 邓凌风 +1 位作者 李文海 田野 《软件导刊》 2024年第6期92-97,共6页
针对大规模文本集合下基于权重的相似性查询问题,提出一种支持前缀剪枝的高效检索框架。首先给出向量空间模型下相似性及其带权前缀定义,理论证明了带权前缀剪枝的正确性;其次,面向大规模文本查询,提出一种新的倒排索引结构,利用索引叶... 针对大规模文本集合下基于权重的相似性查询问题,提出一种支持前缀剪枝的高效检索框架。首先给出向量空间模型下相似性及其带权前缀定义,理论证明了带权前缀剪枝的正确性;其次,面向大规模文本查询,提出一种新的倒排索引结构,利用索引叶节点维护记录的前缀权重,并基于该索引构建高效的相似检索算法;最后,在TF/IDF权重策略下证明该方法能够有效支持大规模带权相似检索。结果表明,其查询效率较Lucene的归并验证策略提升了5倍以上。 展开更多
关键词 前缀剪枝 TF/IDF 向量空间 倒排索引 信息检索 数据库
下载PDF
基于空间向量模型的网络信息检索系统设计
4
作者 丁艳风 刘肖飞 《信息与电脑》 2023年第1期210-212,共3页
为提高网络信息检索系统的查全率和查准率,引入空间向量模型设计网络信息检索系统。首先,基于网络信息检索系统结构基本框架采集和预处理网络信息文档。其次,引入空间向量模型计算文本段与查询式相似度。再次,根据相似度计算公式设置不... 为提高网络信息检索系统的查全率和查准率,引入空间向量模型设计网络信息检索系统。首先,基于网络信息检索系统结构基本框架采集和预处理网络信息文档。其次,引入空间向量模型计算文本段与查询式相似度。再次,根据相似度计算公式设置不同网络信息文档的相似度门槛值。最后,基于相似度门槛值过滤网络信息检索,将过滤后的网络信息作为检索结果显示给系统用户。通过对比实验的方式证明,新的检索系统可根据用户输入内容给出查全率和查准率较高的检索结果。 展开更多
关键词 空间 模型 检索系统 信息 网络 向量
下载PDF
基于向量空间模型的信息资源关键词智能检索工具的研究 被引量:3
5
作者 刘宁 牛佳乐 +2 位作者 郑剑 李思岑 王丹丹 《自动化技术与应用》 2023年第10期105-107,161,共4页
传统检索工具内部模型存在缺陷,改变搜索阈值会导致检索的查全率和查准率降低,因此设计基于向量空间模型的信息资源关键词智能检索工具。创建优化循环架构,优化处理关键词;计算优化后关键词与未知文档间的夹角,得到信息关键词,转换成特... 传统检索工具内部模型存在缺陷,改变搜索阈值会导致检索的查全率和查准率降低,因此设计基于向量空间模型的信息资源关键词智能检索工具。创建优化循环架构,优化处理关键词;计算优化后关键词与未知文档间的夹角,得到信息关键词,转换成特征向量矩阵形式,以空间向量模型为参照,完成检索时相关指标的关联匹配;根据检索工具的特点设计智能检索分布,完善模型转换过程,实现信息资源关键词智能检索工具的设计。实验测试结果显示:所设计检索工具可有效智能检索关键词,在搜索阈值增大时,其F值能保证在70%以上,检索性能更加稳定。 展开更多
关键词 向量空间模型 信息资源 关键词智能检索
下载PDF
数字图书馆的个性化服务 被引量:20
6
作者 宋丽哲 牛振东 +2 位作者 宋瀚涛 师雪霖 孙一钢 《计算机工程》 CAS CSCD 北大核心 2004年第3期46-48,共3页
针对当前数字图书馆中服务的非主动性以及不能体现用户的兴趣爱好的问题,提出了个性化数字图书馆的服务模型,并对此模型进行了分析,对系统实现中的主要技术问题及解决策略进行了探讨。
关键词 用户模型 个性化服务 数字图书馆 分布式存储 信息检索 人工神经网络
下载PDF
基于改进向量空间模型的Web信息检索技术研究 被引量:21
7
作者 雷景生 林冬雪 符浅浅 《计算机工程》 EI CAS CSCD 北大核心 2005年第1期14-16,共3页
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果... 提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。 展开更多
关键词 向量空间模型 信息检索 相似度
下载PDF
基于HowNet的话题跟踪及倾向性分类研究 被引量:21
8
作者 金珠 林鸿飞 赵晶 《情报学报》 CSSCI 北大核心 2005年第5期555-561,共7页
本文研究了如何基于信息检索技术和"知网"实现有效的话题跟踪和话题立场分类.话题跟踪任务就是给出话题相关的训练新闻报道,系统在后续报道中发现与这个话题相关的报道.它属于话题检测与跟踪的一项子任务.本文针对跟踪任务中... 本文研究了如何基于信息检索技术和"知网"实现有效的话题跟踪和话题立场分类.话题跟踪任务就是给出话题相关的训练新闻报道,系统在后续报道中发现与这个话题相关的报道.它属于话题检测与跟踪的一项子任务.本文针对跟踪任务中话题本身的特点,论述了权重调整、事件框架和报道扩充等多种提高跟踪性能的策略,同时基于"知网"中的情感体系和动态角色框架,提出了如何填充框架并结合建立的立场概念库对报道进行话题立场分类.实验证明这些方法是有效的. 展开更多
关键词 HOWNET 信息检索 话题跟踪 倾向性分类
下载PDF
个性化智能信息提取中的用户兴趣发现 被引量:13
9
作者 欧洁 林守勋 刘桂林 《计算机科学》 CSCD 北大核心 2001年第3期112-115,共4页
1 引言 1990年, WWW (World Wide Web )出现,在随后的几年中它获得了空前的发展,Internet上的信息量以指数形式飞速增长,现在,Internet已成为一个浩瀚的海量信息源。但由于Internet是一个具有开放性、动态性和异构性的全球分布式网... 1 引言 1990年, WWW (World Wide Web )出现,在随后的几年中它获得了空前的发展,Internet上的信息量以指数形式飞速增长,现在,Internet已成为一个浩瀚的海量信息源。但由于Internet是一个具有开放性、动态性和异构性的全球分布式网络,资源分布很分散,且没有统一的管理和结构,这就导致了信息获取的困难。如何快速、准确地从浩瀚的信息资源中寻找到所需的信息已经成为困扰用户的一大难题。 展开更多
关键词 信息检索 个性化 智能信息提取 WWW INTERNET
下载PDF
基于统计语言模型的信息检索 被引量:9
10
作者 李晓光 王大玲 于戈 《计算机科学》 CSCD 北大核心 2005年第8期124-127,共4页
本文对基于统计语言模型的信息检索进行了综述,介绍了目前基于统计语言模型信息检索中比较有代表性的模型,给出了语言模型估计中常用的几种平滑技术,将语言模型同目前流行信息检索模型进行了比较,在此基础上,指出了基于统计语言模型信... 本文对基于统计语言模型的信息检索进行了综述,介绍了目前基于统计语言模型信息检索中比较有代表性的模型,给出了语言模型估计中常用的几种平滑技术,将语言模型同目前流行信息检索模型进行了比较,在此基础上,指出了基于统计语言模型信息检索的研究方向。 展开更多
关键词 统计语言模型 信息检索 平滑技术 布尔模型 概率模型 向量空间模型 信息检索模型 模型估计
下载PDF
有效地检索HTML文档 被引量:23
11
作者 刘芳 卢正鼎 《小型微型计算机系统》 CSCD 北大核心 2000年第9期986-988,共3页
WWW上的资源大多以 HTML 格式的文档存储 ,同普通文档不同 ,HTML 文档的标签特性使得它具有一定的结构 .我们采取了一种检索方法 ,它扩展了传统的信息检索 ,利用 HTML文档结构提高了在 WWW环境下的检索效率 .本文介绍了 HTML的结构以及... WWW上的资源大多以 HTML 格式的文档存储 ,同普通文档不同 ,HTML 文档的标签特性使得它具有一定的结构 .我们采取了一种检索方法 ,它扩展了传统的信息检索 ,利用 HTML文档结构提高了在 WWW环境下的检索效率 .本文介绍了 HTML的结构以及传统的向量空间信息检索 ;提出运用聚簇方法为标签分组 ;最后详细讨论了如何利用文档结构扩展加权框架 ,使得检索词能更贴切地描述文档 ,以提高检索的准确性 . 展开更多
关键词 信息检索 向量空间模型 聚簇 HTML文档 WWW
下载PDF
基于社会标注质量的文本分类模型框架 被引量:5
12
作者 李劲 张华 +2 位作者 吴浩雄 向军 辜希武 《计算机应用》 CSCD 北大核心 2012年第5期1335-1339,共5页
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产... 社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估。在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量。同时采用支持向量机分类算法进行分类实验。实验结果表明,通过对标注进行质量评估并过滤质量差的标注,同时结合文档内容以及标注来对文档能提高分类的效果,同传统的基于文档内容的分类算法相比,分类结果的F1度量值提高了6.2%。 展开更多
关键词 社会标注 向量空间模型 文本分类 信息检索 数据挖掘
下载PDF
近几年来国外信息检索模型研究进展 被引量:16
13
作者 孙坦 周静怡 《图书馆建设》 CSSCI 北大核心 2008年第3期82-85,共4页
信息检索模型是信息检索的核心。近几年来国外对于布尔模型的研究主要表现在对布尔模型的改进及对扩展布尔模型的进一步优化。对向量空间模型的研究,主要集中在对向量空间模型的扩展研究及对向量空间模型的应用方面。概率模型的发展主... 信息检索模型是信息检索的核心。近几年来国外对于布尔模型的研究主要表现在对布尔模型的改进及对扩展布尔模型的进一步优化。对向量空间模型的研究,主要集中在对向量空间模型的扩展研究及对向量空间模型的应用方面。概率模型的发展主要集中在继续对概率模型进一步的研究,其与其它信息检索模型的结合,以及语言模型的研究和发展。近年来对于新兴的基于本体的信息检索模型的研究,主要集中在对基于本体的信息检索模型理论的研究,与其它检索模型的融合,以及基于本体检索模型的应用。国外信息检索模型研究的最新成果,为国内此方面的研究提供了前沿性的参考信息。 展开更多
关键词 信息检索 布尔模型 向量空间模型 概率模型 语言模型 本体
下载PDF
融合描述文档结构和参引特征的Web服务发现 被引量:11
14
作者 魏登萍 王挺 王戟 《软件学报》 EI CSCD 北大核心 2011年第9期2006-2019,共14页
首先分析研究Web服务描述文档(WSDL文档)的两大特征——结构特征和参引特征,然后根据各个特征对Web服务功能语义描述的影响,提出相应的Web服务表示模型——多向量表示模型.区别于通用文本表示模型,该模型能够显式地表示Web服务描述文档... 首先分析研究Web服务描述文档(WSDL文档)的两大特征——结构特征和参引特征,然后根据各个特征对Web服务功能语义描述的影响,提出相应的Web服务表示模型——多向量表示模型.区别于通用文本表示模型,该模型能够显式地表示Web服务描述文档的本质特征.其中,结构特征语义表现在多向量空间的划分上,参引特征语义映射到子向量模型中特征权重的计算上.提出了基于多向量模型的Web服务相似度计算方法,并实现了基于该模型的Web服务发现原型系统.最后,在真实Web服务描述文档集合上构造了一个具有不完全相关性判断且涵盖了1576个WSDL文档的Web服务发现测试集,并在该测试集上进行了基于多向量模型的Web服务发现实验评估.实验结果表明,基于多向量模型的Web服务发现方法的检索效果比基于简单文本向量空间模型发现方法的检索效果在95%的置信度下有了显著提高. 展开更多
关键词 WEB服务 WEB服务发现 WSDL 向量空间模型 不完全信息 平均准确率
下载PDF
面向领域的个性化智能检索系统MySpy的研究与开发 被引量:5
15
作者 陈世平 周福华 俞海 《小型微型计算机系统》 CSCD 北大核心 2002年第11期1336-1339,共4页
针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴... 针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴含词词典 ,对查询词进行概念扩检 ,使检索结果能返回与查询需求相似的文档 . 展开更多
关键词 个性化 智能检索系统 MySpy 智能代理 信息检索 分词 向量空间模型 全文检索 因特网
下载PDF
基于本体的Web文本挖掘与信息检索 被引量:8
16
作者 艾伟 孙四明 张峰 《计算机工程》 CAS CSCD 北大核心 2010年第22期75-77,80,共4页
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。... 针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。 展开更多
关键词 本体 WEB文本挖掘 向量空间模型 信息检索
下载PDF
基于语义的信息检索模型 被引量:6
17
作者 陈锐 张蕾 胡艳华 《计算机工程与应用》 CSCD 北大核心 2009年第26期141-143,共3页
由于查询与文档中词语的不匹配现象导致一些相关的文档不能被成功地检索出来,在信息检索的研究与实现中,这是影响检索效果的一个很关键的问题。把概念图和知网结合起来,提出对应的相关反馈算法,重新计算词项权重,利用向量空间模型和语... 由于查询与文档中词语的不匹配现象导致一些相关的文档不能被成功地检索出来,在信息检索的研究与实现中,这是影响检索效果的一个很关键的问题。把概念图和知网结合起来,提出对应的相关反馈算法,重新计算词项权重,利用向量空间模型和语义相似度进行语义检索,并给出了语义检索模型。实验结果显示该方法取得了良好的效果。 展开更多
关键词 信息检索 相似度 向量空间模型 知网 相关反馈
下载PDF
个性化Web信息代理的研究与开发 被引量:6
18
作者 陈世平 丁山山 +1 位作者 胡成梅 游方强 《上海理工大学学报》 CAS 北大核心 2004年第6期575-579,共5页
介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用... 介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用户关注程度和关注领域不断变化而调整信息反馈的能力,并在此设计基础上实现了一个原型系统. 展开更多
关键词 信息AGENT 个性化检索 元搜索引擎 向量空间模型 机器学习
下载PDF
词性标注对信息检索系统性能的影响 被引量:8
19
作者 苏祺 昝红英 +1 位作者 胡景贺 项锟 《中文信息学报》 CSCD 北大核心 2005年第2期58-65,共8页
在信息检索中引入NLP技术是信息检索发展的主要趋势 ,本文将NLP中较为成熟的词性标注技术加入信息检索 ,采用大规模TREC数据集 ,试图发现词性标注对检索系统性能的影响。笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检... 在信息检索中引入NLP技术是信息检索发展的主要趋势 ,本文将NLP中较为成熟的词性标注技术加入信息检索 ,采用大规模TREC数据集 ,试图发现词性标注对检索系统性能的影响。笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检索实验。实验表明 ,在信息检索中加入词性标注信息可能会对某些特定Topic和Document的检索效果有所改进 ,但词性标注的影响能力弱于索引项权重选择的影响能力。词性标注对检索性能的影响涉及到Topic和Document中的具体用词 ,普遍规律有待进一步研究。 展开更多
关键词 人工智能 自然语言处理 信息检索 向量空间模型 词性标注 SMART
下载PDF
网络信息过滤和个性化信息服务 被引量:8
20
作者 汪琴 安贺意 秦颖 《情报科学》 CSSCI 北大核心 2007年第6期858-863,共6页
本文在比较安全过滤和用户过滤两种应用的基础上,着重讨论了用户过滤及其相关技术,文章认为,影响过滤系统性能的关键因素在于用户建模的准确性、对信息内容的语义理解以及匹配算法的选择,并就此提出针对性的解决思路。
关键词 信息过滤 个性化信息服务 用户兴趣文件 向量空间模型
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部