期刊文献+
共找到88,255篇文章
< 1 2 250 >
每页显示 20 50 100
基于融合矩阵的文本相似度计算实现检索结果聚类 被引量:1
1
作者 赵悦阳 崔雷 《医学信息学杂志》 CAS 2024年第3期58-64,共7页
目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分... 目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分组,随后生成类别标签,描述每一类簇文档的含义。结果/结论基于融合矩阵的聚类效果较好,提取出描述类别的高频词能很好地区分类别含义,对检索结果文本聚类任务有效。 展开更多
关键词 文献检索 文本聚类 融合矩阵 文本相似度
下载PDF
指纹库容量对指纹检索结果的影响
2
作者 韩文强 罗亚平 《刑事技术》 2024年第4期367-374,共8页
近年来,指纹库容量的快速增长导致指纹比对难度加大,尤其体现在检索结果中相似异源指纹对比中同源指纹的干扰上。为了探究不同指纹库容量对同源指纹与相似异源指纹出现情况的影响,本实验建立600万人级、1000万人级和1亿人级数据库,对箕... 近年来,指纹库容量的快速增长导致指纹比对难度加大,尤其体现在检索结果中相似异源指纹对比中同源指纹的干扰上。为了探究不同指纹库容量对同源指纹与相似异源指纹出现情况的影响,本实验建立600万人级、1000万人级和1亿人级数据库,对箕型纹三角区域各部分发起查询并讨论检索结果。结果显示:指纹库容量增长幅度越大,同源指纹出现率降低越明显,同时其排位显著降低,而相似异源指纹数量显著增加,当相似异源指纹排在同源指纹之前时,会对指纹鉴定人员造成干扰。此外,还发现特征点密度可以影响相似异源指纹的出现数量,特征点密度越大,特征组合的特定性越小,越容易产生相似异源指纹。本研究旨在增强大数据条件下指纹鉴定人员的风险意识。 展开更多
关键词 指纹自动识别系统 指纹库容量 同源指纹 相似异源指纹 检索结果
下载PDF
人工干预对CJFD库检索结果影响
3
作者 李芳 《中国科技信息》 2023年第3期16-18,共3页
随着专利审查智能检索系统的上线和使用,其语义检索的功能相较于传统S系统检索为审查员的检索与浏览提供了较大的便利,下面通过实际案例简单介绍一下使用智能检索系统人工干预对CJFD数据库语义检索结果的影响。语义检索及其人工干预方... 随着专利审查智能检索系统的上线和使用,其语义检索的功能相较于传统S系统检索为审查员的检索与浏览提供了较大的便利,下面通过实际案例简单介绍一下使用智能检索系统人工干预对CJFD数据库语义检索结果的影响。语义检索及其人工干预方式简介语义检索的人工干预方式包括调整语义基准、调整语义分词、布尔检索+语义排序。 展开更多
关键词 人工干预 语义检索 智能检索系统 专利审查 语义排序 分词 数据库语义 布尔检索
下载PDF
一种层次化的检索结果聚类方法 被引量:15
4
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果聚类 层次化聚类 文本聚类 聚类
下载PDF
基于ontology抽取优化初始选择的检索结果聚类 被引量:8
5
作者 陈毅恒 秦兵 +2 位作者 宋凡 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期166-170,156,共6页
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结... 本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高. 展开更多
关键词 检索结果聚类 ONTOLOGY 标签
下载PDF
搜索引擎检索结果的组织技术 被引量:12
6
作者 赵荣 黄燕云 张露 《情报学报》 CSSCI 北大核心 2004年第1期69-72,共4页
本文综合分析了几种主要的搜索引擎检索结果排序组织技术的原理及应用,包括关键词词频和位置原理、网页链接级别算法和结果分类组织等。
关键词 搜索引擎 信息检索 检索结果 组织技术 信息相关度 关键词 词频 网页链接
下载PDF
一种网络展现文献检索结果的理论模型 被引量:4
7
作者 孙笑明 崔文田 林军 《情报学报》 CSSCI 北大核心 2011年第2期146-154,共9页
考虑到目前文献检索结果存在的两个问题:信息冗余或信息缺失以及文献顺序排列对文献之间关系的忽略,本研究采用统一数字化标度方法,构建了一种基于文献检索项和检索词匹配、网络展现文献检索结果的理论模型,并给出了应用实例.实例研究表... 考虑到目前文献检索结果存在的两个问题:信息冗余或信息缺失以及文献顺序排列对文献之间关系的忽略,本研究采用统一数字化标度方法,构建了一种基于文献检索项和检索词匹配、网络展现文献检索结果的理论模型,并给出了应用实例.实例研究表明,在检索条件约束较弱的情况下,对检索结果应用该模型生成相应的文献网络,经过社会网络分析和ABC分类方法处理后,检索者可以用最快的速度、直观地了解文献的等级分布以及文献之间的相互联系,较大程度上减少检索文献的时间,提高文献检索的效率. 展开更多
关键词 社会网络分析 展现 文献检索 检索结果 理论模型 RESULTS SEARCH LITERATURE 信息冗余 信息缺失 相互联系 条件约束 顺序排列 实例研究 检索文献 度方法 等级分布 ABC分类 数字化 检索
下载PDF
常用中文期刊数据库药学文献比较与检索结果自动处理 被引量:4
8
作者 孙华君 张明华 +1 位作者 胡晋红 姚春芳 《中国药房》 CAS CSCD 北大核心 2006年第17期1351-1353,共3页
目的:为药学工作者利用“中国生物医学文摘数据库”、“清华同方中国期刊网”、“重庆维普信息数据库”进行文献检索提供参考。方法:以医院药学常见研究课题为研究范围,采用期刊收载分析和检索分析,对数据库抽样检索结果进行初步的对比... 目的:为药学工作者利用“中国生物医学文摘数据库”、“清华同方中国期刊网”、“重庆维普信息数据库”进行文献检索提供参考。方法:以医院药学常见研究课题为研究范围,采用期刊收载分析和检索分析,对数据库抽样检索结果进行初步的对比分析,并编写程序利用计算机自动对检索结果进行汇总分析。结果:3个数据库均未收全测试的药学类79种专业期刊,未收载期刊有差异,仅个别品种相同。检索词的检索结果中有相当比例的重复,而计算机实现了相同文献的合并。结论:3个数据库各自收载的文献各有特色,多个数据库相结合才能提高文献查全率。利用计算机程序可以对检索结果进行自动汇总分析,减少重复工作量。 展开更多
关键词 文献数据库 比较研究 检索结果 自动处理
下载PDF
基于潜在语义索引和自组织映射网的检索结果聚类方法 被引量:4
9
作者 陈毅恒 秦兵 +2 位作者 刘挺 王平 李生 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检... 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高. 展开更多
关键词 检索结果聚类 潜在语义索引 自组织映射网 标签 边界划分
下载PDF
基于主题模型的检索结果聚类应用研究 被引量:14
10
作者 阮光册 夏磊 《情报杂志》 CSSCI 北大核心 2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语... [目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。 展开更多
关键词 LDA 检索结果聚类 聚类标签 概率分布 语义挖掘 K-MEANS
下载PDF
一种新型最优检索结果的发现与论证 被引量:2
11
作者 洪宇 康杨杨 +2 位作者 姚建民 朱巧明 周国栋 《计算机学报》 EI CSCD 北大核心 2013年第3期643-653,共11页
该文基于量化数据证明如下观点:检索结果中,本源正确的检索结果应为最佳(即蕴含的信息符合客观逻辑和自然规律的检索结果).在此基础上,提出了一种新型基于正确性的信息检索评测方法.文中讨论的信息正确性是一种事实性的客观正确性,不随... 该文基于量化数据证明如下观点:检索结果中,本源正确的检索结果应为最佳(即蕴含的信息符合客观逻辑和自然规律的检索结果).在此基础上,提出了一种新型基于正确性的信息检索评测方法.文中讨论的信息正确性是一种事实性的客观正确性,不随用户主观判断产生正确性的变化,与依赖用户满意度的相关结果具有显著差异.当前,信息检索方向的研究尚未关注检索结果本源正确性的自动检测与应用,且尚未提出相应的排序优化算法.文中即针对这一问题进行量化的科学验证,并给出相关研究的评测框架. 展开更多
关键词 信息检索 满意度 正确检索结果 评测标准
下载PDF
一种支持检索结果多元化的数据融合算法 被引量:3
12
作者 李洁玉 黄春兰 +2 位作者 袁润 王秀红 吴胜利 《情报理论与实践》 CSSCI 北大核心 2015年第10期130-132,121,共4页
为满足用户查询多样化需求,检索结果的多元化成为信息检索领域一个新的研究热点。文章提出一种支持搜索结果多元化的数据融合技术,采用权威的TREC文本检索会议(针对Web检索多元化任务的)数据,对提出的方法进行了实验验证,结果表明所提... 为满足用户查询多样化需求,检索结果的多元化成为信息检索领域一个新的研究热点。文章提出一种支持搜索结果多元化的数据融合技术,采用权威的TREC文本检索会议(针对Web检索多元化任务的)数据,对提出的方法进行了实验验证,结果表明所提出的数据融合方法有效地提高了多元化性能,融合结果显著地优于最佳的成员检索系统,实验表明运用数据融合技术可以在由当今最先进的检索技术所产生的结果基础之上,进一步提高检索性能,该算法有较高的应用价值。 展开更多
关键词 信息检索 数据融合 检索结果多元化
下载PDF
基于关键词共现分析的检索结果聚类研究 被引量:9
13
作者 李枫林 何洲芳 《情报学报》 CSSCI 北大核心 2011年第8期819-825,共7页
随着互联网规模的急剧扩张,提升信息检索的效用变得相当困难。本文首先通过特定算法提取每篇文档的关键词,然后运用统计方法计量不同文档的共现关键词并形成相应的共现关键词标签矩阵,最后利用层次聚类算法对共现关键词标签进行聚类并... 随着互联网规模的急剧扩张,提升信息检索的效用变得相当困难。本文首先通过特定算法提取每篇文档的关键词,然后运用统计方法计量不同文档的共现关键词并形成相应的共现关键词标签矩阵,最后利用层次聚类算法对共现关键词标签进行聚类并形成相应的层次标签树来构造文档聚类束。该方法可以对源搜索引擎返回的结果进行有效的分类,使用户在更高主题层次上查看检索词的相关信息,准确地找到感兴趣的信息。通过与Lingo算法的比较,显示本文算法所得的标签更具可读性和概括性,同时F-measure评价指标也表明本算法在文本聚类的质量上有了一定的提升。 展开更多
关键词 共现 聚类 检索结果
下载PDF
拟写科技查新报告中检索结果的精细化研究 被引量:5
14
作者 刘琼 田稷 缪家鼎 《现代情报》 北大核心 2007年第6期178-180,共3页
本文参照《文后参考文献著录规则》的标准,结合查新工作的实际,对科技查新报告中检索结果的文献著录格式和内容的拟写进行了精细化地研究和讨论,并给出了各种类型文献的著录示范。
关键词 科技查新 检索结果 著录
下载PDF
基于XML的检索结果聚类方法 被引量:5
15
作者 余宏 万常选 《计算机工程》 CAS CSCD 北大核心 2010年第1期85-86,90,共3页
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传... 针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。 展开更多
关键词 XML检索结果聚类 结构语义相似度 内容相似度 聚类算法
下载PDF
信息资源检索结果质量影响机制研究——用户满意度评价视角 被引量:5
16
作者 马费成 莫祖英 《信息资源管理学报》 2013年第2期4-11,共8页
本文基于顾客满意度理论构建检索结果质量满意度概念模型,并通过数据调研,分析了信息资源检索结果质量的影响机制及其关键影响因素。研究结果发现,用户的总体质量满意度既可作为潜变量由三个观测变量来表示,又可以"总体满意度"... 本文基于顾客满意度理论构建检索结果质量满意度概念模型,并通过数据调研,分析了信息资源检索结果质量的影响机制及其关键影响因素。研究结果发现,用户的总体质量满意度既可作为潜变量由三个观测变量来表示,又可以"总体满意度"为观测变量直接衡量。两种模型中各要素的影响机制相似,但影响程度和被解释的变异量不同,总体满意度作为潜变量能更好地解释其影响因素。 展开更多
关键词 信息资源质量 用户满意度模型 检索结果质量 影响机制
下载PDF
搜索引擎检索结果的网页组织技术及其优化策略 被引量:3
17
作者 张海涛 高松 《情报科学》 CSSCI 北大核心 2006年第6期900-903,共4页
本文分析了搜索引擎检索结果的组织技术及其存在的不足,并对检索结果的组织技术进行了优化处理,最后分析了搜索引擎检索结果中提高网页排名的优化策略。
关键词 搜索引擎 检索结果 组织技术 优化策略
下载PDF
有效的XML检索结果的相似性度量 被引量:3
18
作者 刘喜平 万常选 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第5期629-637,共9页
相似性度量是聚类等问题中的核心问题.本文研究了XML检索结果的相似性度量,提出了一种新的结构的和内容的XML检索结果相似性度量.首先,在结构方面,提出了两个结构相似性度量:纵向结构相似度和横向结构相似度,它们基于不同的特征集,体现... 相似性度量是聚类等问题中的核心问题.本文研究了XML检索结果的相似性度量,提出了一种新的结构的和内容的XML检索结果相似性度量.首先,在结构方面,提出了两个结构相似性度量:纵向结构相似度和横向结构相似度,它们基于不同的特征集,体现了结构的不同方面的相似度.在内容方面,提出用带有结构的内容模型来描述内容,基于这一内容模型提出了内容相似度.最后进行了实验,在实际数据集和合成数据集上的实验结果都显示,结构相似度和内容相似度都具有很好的准确性. 展开更多
关键词 XML检索结果 相似性度量 结构相似度 内容相似度
下载PDF
基于检索结果聚类的XML伪相关文档查找 被引量:1
19
作者 钟敏娟 万常选 +1 位作者 刘德喜 廖述梅 《计算机科学》 CSCD 北大核心 2013年第10期172-177,共6页
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML... 传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。 展开更多
关键词 信息检索 XML伪相关反馈 XML检索结果聚类 簇标签 排序模型
下载PDF
关系型数据库信息资源检索结果分类方法仿真 被引量:5
20
作者 姚丽华 于广州 《计算机仿真》 北大核心 2019年第1期445-448,共4页
针对当前数据库信息资源检索结果分类方法准确率和查全率较低的问题,提出基于协同微粒群的关系型数据库信息资源检索结果分类方法,将信息资源检索结果进行标准化,计算标准化后检索结果的协方差,并将其最大值定义为数据库信息资源检索结... 针对当前数据库信息资源检索结果分类方法准确率和查全率较低的问题,提出基于协同微粒群的关系型数据库信息资源检索结果分类方法,将信息资源检索结果进行标准化,计算标准化后检索结果的协方差,并将其最大值定义为数据库信息资源检索结果预处理目标函数。将方差最大值的求解转换成对样本最大值进行求解,引入拉格朗日系数对目标函数求解,期间融合了数据过滤器,实现检索结果预处理。初始化微粒群,通过骨干微粒群法对微粒位置进行更新。计算微粒适应度值,对微粒群之间的相似性进行判断,将相似的微粒群合并。检测当前运行状态满足终止条件与否和信息资源检索结果流结束与否,对未结束的检索结果数据流类中心变化位置进行预测,一直到不再接收资源检索结果,将最终分类结果输出。实验结果表明,所提方法分类准确性和查全性均较为理想,可行性也高于当前相关方法。 展开更多
关键词 关系型数据库 信息资源 检索结果 分类
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部