期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于概念的论文相似性检索 被引量:5
1
作者 李信利 吕月娥 《计算机工程与应用》 CSCD 北大核心 2007年第21期177-179,241,共4页
Web上越来越多的论文给我们提出了一个新的课题:如何检索满足需求的论文。传统的基于查询项匹配检索方法往往无法准确地检索出满足用户需求的论文。这里给出了一种基于概念的论文相似性检索方法,有效地改进了传统的论文检索方法。介绍... Web上越来越多的论文给我们提出了一个新的课题:如何检索满足需求的论文。传统的基于查询项匹配检索方法往往无法准确地检索出满足用户需求的论文。这里给出了一种基于概念的论文相似性检索方法,有效地改进了传统的论文检索方法。介绍了一种对论文关键词进行层次聚类的算法,首先把论文关键词聚类为概念,从而生成一个概念树,然后用概念向量表示论文,每篇论文对应一个概念子树。在相似性检索时,采用改进的余弦相似性方法,根据概念向量计算论文的相似性,把与给定论文最相似的论文返回给用户。用这种算法,能很好地对论文进行基于概念的相似性检索。算法克服了基于查询项匹配检索的缺点,实验证明其有较高的查全率和查准率。 展开更多
关键词 论文检索 层次聚类 概念树 相似性检索
下载PDF
一种用于交通轨迹数据的时空R树索引结构 被引量:1
2
作者 王智广 申思 鲁强 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2019年第3期317-323,共7页
对于包含有时空属性信息的海量交通轨迹数据进行存储、检索等具有重要的实际意义.针对交通轨迹数据的时空特性、无序性以及采样率高等特点,提出一种基于时空距离进行聚类的数据项构造方法;同时针对数据的时空特性和传统R树的节点重叠率... 对于包含有时空属性信息的海量交通轨迹数据进行存储、检索等具有重要的实际意义.针对交通轨迹数据的时空特性、无序性以及采样率高等特点,提出一种基于时空距离进行聚类的数据项构造方法;同时针对数据的时空特性和传统R树的节点重叠率较高导致检索效率慢的情况,提出增加时间维度且基于改进的层次聚类算法的R树构造方法.解决了传统方法中树过高以及节点重复率高导致的检索效率问题.实验结果表明,该构造方法得到的R树结构在检索效率方面性能优于传统方法. 展开更多
关键词 R树 交通轨迹数据 检索 层次聚类
下载PDF
基于层次聚类的论文相似性检索
3
作者 李信利 聂志强 吕月娥 《微计算机信息》 北大核心 2007年第21期246-248,共3页
web上越来越多的论文给我们提出了一个新的课题:如何检索满足需求的论文。传统的基于查询项匹配检索方法往往无法准确的检索出满足用户需求的论文。这里给出了一种基于概念的论文相似性检索方法,有效地改进了传统的论文检索方法。本文... web上越来越多的论文给我们提出了一个新的课题:如何检索满足需求的论文。传统的基于查询项匹配检索方法往往无法准确的检索出满足用户需求的论文。这里给出了一种基于概念的论文相似性检索方法,有效地改进了传统的论文检索方法。本文介绍了一种对论文关键词进行层次聚类的算法,首先把论文关键词聚类为概念,从而生成一个概念树,然后用概念向量表示论文,每篇论文对应一个概念子树。在相似性检索时,采用改进的余弦相似性方法,根据概念向量计算论文的相似性,把与给定论文最相似的论文返回给用户。用这种算法,能很好的对论文进行基于概念的相似性检索。 展开更多
关键词 层次聚类 论文检索 相似性检索 概念树
下载PDF
以词为本的编码方案的探讨
4
作者 程元斌 《江汉大学学报(自然科学版)》 2013年第2期47-52,共6页
语言是人进行思维的主要工具,词是语言处理的基本单位。在计算机信息处理中,目前是按字设计编码。随着计算机信息处理技术的发展,这种完全按字编码的不足也日益显示出来。从信息处理的基本需求以及词的基本特性出发,提出字词综合考虑且... 语言是人进行思维的主要工具,词是语言处理的基本单位。在计算机信息处理中,目前是按字设计编码。随着计算机信息处理技术的发展,这种完全按字编码的不足也日益显示出来。从信息处理的基本需求以及词的基本特性出发,提出字词综合考虑且以词为本的统一编码方案。该方案以现行的主要编码标准UTF-16为基础,维持现有的字编码,增加词编码;词编码以包括一定语义信息及语义关系的概念空间树进行逻辑组织,以适应聚类检索及语种间代码转换的原则进行空间组织。最后指出了需要进一步深入研究的几个疑难问题。 展开更多
关键词 词编码 UTF-16 聚类检索 概念空间树 自然语言处理
下载PDF
中文科技期刊数据库文献分类与检索
5
作者 吕月娥 《临沂师范学院学报》 2008年第6期104-107,共4页
介绍了一种对文献关键词进行层次聚类的算法,首先把文献关键词聚类为概念,从而生成一个概念树,然后用概念向量表示文献,每篇文献对应一个概念子树.在检索时,采用改进的余弦相似性方法,根据概念向量计算文献的相似性,把与给定文献最相似... 介绍了一种对文献关键词进行层次聚类的算法,首先把文献关键词聚类为概念,从而生成一个概念树,然后用概念向量表示文献,每篇文献对应一个概念子树.在检索时,采用改进的余弦相似性方法,根据概念向量计算文献的相似性,把与给定文献最相似的文献返回给用户.用这种算法能很好地对文献进行相似性检索. 展开更多
关键词 中文科技期刊数据库 文献分类 层次聚类 概念树 相似性检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部