期刊文献+
共找到280篇文章
< 1 2 14 >
每页显示 20 50 100
Research and Application on Web Information Retrieval Based on Improved FP-Growth Algorithm 被引量:2
1
作者 JIAO Minghai YAN Ping JIANG Huiyan 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1065-1068,共4页
A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each n... A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each node are kept. Route information of different nodes in a same item are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. An example of Web key words retrieval is given to analyze and verify the frequent pattern algorithm in this paper. 展开更多
关键词 data mining CHAINS FP-growth algorithm frequent pattern aggregative information retrieval
下载PDF
Optimization in the Migration Problem of Mobile Agents in Distributed Information Retrieval Systems 被引量:1
2
作者 HeYan-xiang ChenYi-feng +1 位作者 HeJing CaoJian-nong 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第2期153-160,共8页
In this paper, we employ genetic algorithms to solve the migration problem (MP). We propose a new encoding scheme to represent trees, which is composed of two parts: the pre-ordered traversal sequence of tree vertices... In this paper, we employ genetic algorithms to solve the migration problem (MP). We propose a new encoding scheme to represent trees, which is composed of two parts: the pre-ordered traversal sequence of tree vertices and the children number sequence of corresponding tree vertices. The proposed encoding scheme has the advantages of simplicity for encoding and decoding, ease for GA operations, and better equilibrium between exploration and exploitation. It is also adaptive in that, with few restrictions on the length of code, it can be freely lengthened or shortened according to the characteristics of the problem space. Furthermore, the encoding scheme is highly applicable to the degree-constrained minimum spanning tree problem because it also contains the degree information of each node. The simulation results demonstrate the higher performance of our algorithm, with fast convergence to the optima or sub-optima on various problem sizes. Comparing with the binary string encoding of vertices, when the problem size is large, our algorithm runs remarkably faster with comparable search capability. Key words distributed information retrieval - mobile agents - migration problem - genetic algorithms CLC number TP 301. 6 Foundation item: Supported by the National Natural Science Foundation of China (90104005), the Natural Science Foundation of Hubei Province and the Hong Kong Polytechnic University under the grant G-YD63Biography: He Yan-xiang (1952-), male, Professor, research direction: distributed and parallel processing, multi-agent systems, data mining and e-business. 展开更多
关键词 distributed information retrieval mobile agents migration problem genetic algorithms
下载PDF
Enhanced Neuro-Fuzzy-Based Crop Ontology for Effective Information Retrieval
3
作者 K.Ezhilarasi G.Maria Kalavathy 《Computer Systems Science & Engineering》 SCIE EI 2022年第5期569-582,共14页
Ontology is the progression of interpreting the conceptions of the information domain for an assembly of handlers.Familiarizing ontology as information retrieval(IR)aids in augmenting the searching effects of user-req... Ontology is the progression of interpreting the conceptions of the information domain for an assembly of handlers.Familiarizing ontology as information retrieval(IR)aids in augmenting the searching effects of user-required relevant information.The crux of conventional keyword matching-related IR utilizes advanced algorithms for recovering facts from the Internet,mapping the connection between keywords and information,and categorizing the retrieval outcomes.The prevailing procedures for IR consume considerable time,and they could not recover information proficiently.In this study,through applying a modified neuro-fuzzy algorithm(MNFA),the IR time is mitigated,and the retrieval accuracy is enhanced for trouncing the above-stated downsides.The proposed method encompasses three phases:i)development of a crop ontology,ii)implementation of the IR system,and iii)processing of user query.In the initial phase,a crop ontology is developed and evaluated by gathering crop information.In the next phase,a hash tree is constructed using closed frequent patterns(CFPs),and MNFA is used to train the database.In the last phase,for a specified user query,CFP is calculated,and similarity assessment results are retrieved using the database.The performance of the proposed system is measured and compared with that of existing techniques.Experimental results demonstrate that the proposed MNFA has an accuracy of 92.77% for simple queries and 91.45% for complex queries. 展开更多
关键词 ONTOLOGY crop ontology information retrieval(IR) k-medoids algorithm neuro-fuzzy algorithm(NFA) modified NFA(MNFA)
下载PDF
Research on the Multimedia Information Retrieval Algorithm based on Information Restructuring and Image Reconstruction
4
作者 Nian Li 《International Journal of Technology Management》 2016年第3期36-39,共4页
In this paper, we conduct research on the multimedia information retrieval algorithm based on the information restructuring and image reconstruction. With the massive growth of information resources, people through va... In this paper, we conduct research on the multimedia information retrieval algorithm based on the information restructuring and image reconstruction. With the massive growth of information resources, people through various retrieval tools for too much information, led directly to information overload. In vector space model and probability retrieval model based on information retrieval tools rarely consider the user' s personalized information needs and features, has resulted in a large amount of information retrieval result and correlation information the user' s information demand is not big. In order to improve the existing retrieval system, in recent years, scholars to study looked that context information retrieval context factors need to be considered, such as the retrieval time, place and the interactive history, mission, environment and other factors stated or implied in the retrieval process. At present, the context research has become the information behavior, information search process and the research hotspot in the field of information retrieval interaction. 展开更多
关键词 Multimedia information retrieval Algorithm Image Reconstruction Data Analysis.
下载PDF
A Study on Indexing Efficiency and Retrieval Accuracy for Author Name Search of Academic Papers
5
作者 Heejun Han Heeseok Choi Jaesoo Kim 《Computer Technology and Application》 2015年第2期57-63,共7页
Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant ... Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant information. Most web data are composed of a title, an author, and contents. A paper which is under the academic information category has metadata including a title, an author, keyword, abstract, data about publication, place of publication, ISSN, and the like. A patent has metadata including the title, an applicant, an inventor, an attorney, IPC, number of application, and claims of the invention. Most web-based academic information services enable users to search the information by processing the meta-information. An important element is to search information by using the author field which corresponds to a personal name. This study suggests a method of efficient indexing and using the adjacent operation result ranking algorithm to which phrase search-based boosting elements are applied, and thus improving the accuracy of the search results of author name. This method can be effectively applied to providing accurate search results in the academic information services. 展开更多
关键词 Author name search information retrieval INDEXING search algorithm boosting.
下载PDF
基于PATRICIA tree的汉语自动分词词典机制 被引量:30
6
作者 杨文峰 陈光英 李星 《中文信息学报》 CSCD 北大核心 2001年第3期44-49,共6页
分词词典是汉语信息处理系统的一个基本组成部分 ,其查询和更新效率将直接影响汉语信息处理系统的性能。本文采用PATRICIAtree的数据结构 ,设计了一种可以对词典词条进行快速查询、更新的分词词典机制 ,并从理论上初步分析了它的性能。... 分词词典是汉语信息处理系统的一个基本组成部分 ,其查询和更新效率将直接影响汉语信息处理系统的性能。本文采用PATRICIAtree的数据结构 ,设计了一种可以对词典词条进行快速查询、更新的分词词典机制 ,并从理论上初步分析了它的性能。最后通过实验 ,在时间效率上与逐字二分的分词词典机制进行了比较。结果表明 ,基于PATRICIAtree的分词词典机制具有更高的查询速度和更新效率 ,能满足大规模、开放文本处理系统的需求。 展开更多
关键词 信息检索 PATRICA tree 汉语自动分词 信息处理
下载PDF
基于PAT TREE统计语言模型与关键词自动提取 被引量:12
7
作者 杨文峰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第15期17-19,35,共4页
未登录关键词的识别是中文信息处理中的一个关键问题。文章利用PAT TREE实现了一种可变长统计语言模型,由于不存在n元统计语言模型的截断效应,从而对待提取的关键词的长度没有限制。在该模型的基础上,通过相关性检测,从540M汉语语... 未登录关键词的识别是中文信息处理中的一个关键问题。文章利用PAT TREE实现了一种可变长统计语言模型,由于不存在n元统计语言模型的截断效应,从而对待提取的关键词的长度没有限制。在该模型的基础上,通过相关性检测,从540M汉语语料中自动提取出了12万个关键词候选字串。最后,经过分析和筛选,候选字串的准确度由82.3%上升到96.1%。实验表明,基于PAT TREE的统计语言模型是实现未登录词提取的有力工具。 展开更多
关键词 信息检索 统计语言模型 关键词 自动提取 PATtree INTERNET
下载PDF
基于PAT-tree的中文关键词自动检索模式的研究 被引量:4
8
作者 柳佳刚 陈山 《计算技术与自动化》 2009年第2期119-123,共5页
利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模... 利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模型对中文文档中的关键词进行识别。在该模型基础上进行相关性检测实验。实验结果表明基于PAT-tree的改进语言模型能更好的识别关键词。 展开更多
关键词 PAT—tree 信息检索 语言模型 交互信息
下载PDF
Decision-tree induction from self-mapping space based on web
9
作者 张树瑜 朱仲英 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2007年第1期134-139,共6页
An improved decision tree method for web information retrieval with self-mapping attributes is proposed.The self-mapping tree has a value of self-mapping attribute in its internal node,and information based on dissimi... An improved decision tree method for web information retrieval with self-mapping attributes is proposed.The self-mapping tree has a value of self-mapping attribute in its internal node,and information based on dissimilarity between a pair of mapping sequences.This method selects self-mapping which exists between data by exhaustive search based on relation and attribute information.Experimental results confirm that the improved method constructs comprehensive and accurate decision tree.Moreover,an example shows that the self-mapping decision tree is promising for data mining and knowledge discovery. 展开更多
关键词 Web information retrieval self-mapping space decision tree
下载PDF
基于互信息量均方差提取关键帧的激光视频图像检索研究 被引量:1
10
作者 胡秀 王书爱 《激光杂志》 CAS 北大核心 2024年第3期145-149,共5页
为保证激光视频图像检索结果中不存在重复性冗余图像,提出了基于互信息量均方差提取关键帧的激光视频图像检索方法。基于互信息量均方差的关键帧提取方法,以激光视频图像颜色的互信息量均方差最大化,为激光视频图像关键帧的聚类中心设... 为保证激光视频图像检索结果中不存在重复性冗余图像,提出了基于互信息量均方差提取关键帧的激光视频图像检索方法。基于互信息量均方差的关键帧提取方法,以激光视频图像颜色的互信息量均方差最大化,为激光视频图像关键帧的聚类中心设置标准,以此聚类提取不重复的视频图像关键帧;通过基于关键帧的激光视频图像检索方法,将所提取关键帧作为激光视频图像检索的核心判断内容,提取与所需图像关键帧相似度显著的激光视频图像,完成激光视频图像检索。实验结果显示:此方法使用后,提取的激光视频图像关键帧冗余度仅有0.01,激光视频图像检索结果的MAP指标测试值高达0.98,检索结果中不存在重复性冗余图像。 展开更多
关键词 互信息量 均方差 提取关键帧 激光视频 图像检索 聚类算法
下载PDF
基于激光点云的橡胶树参数反演与数字孪生构建 被引量:1
11
作者 胡云帆 张怀清 +1 位作者 安锋 云挺 《西北林学院学报》 CSCD 北大核心 2024年第2期1-12,共12页
基于激光雷达(Light Detection And Ranging,LiDAR)数据重建树体三维模型并精准获取林木空间枝干结构参数对林木性状评价、森林动态经营管理与可视化研究具有重要意义。为此提出一种基于骨架细化提取的树木模型重建方法。首先,采用Focus... 基于激光雷达(Light Detection And Ranging,LiDAR)数据重建树体三维模型并精准获取林木空间枝干结构参数对林木性状评价、森林动态经营管理与可视化研究具有重要意义。为此提出一种基于骨架细化提取的树木模型重建方法。首先,采用FocusS350/350 PLUS三维激光扫描仪获取3块不同树龄橡胶树的样地数据。然后,作为细化建模的重点,将枝干点云从原始树点中分离出来,再将其过度分割为若干点云簇,通过相邻点云簇判断是否有分枝以及动态确定骨架点间距,并将其运用在空间殖民算法以此来生成树的三维骨架点和骨架点连通性链表,根据连通链表结构自动识别树木中的主枝干和各个一级分枝,再通过广义圆柱体生成树干完成树木三维重建。最后,利用数字孪生技术对这3块不同树龄样地树木进行三维实景建模,使其穿越时空在同一空间中重现,以便更为直观地观察树木在生长过程中的形态变化。该算法得到的橡胶树胸径与实测值比对为,决定系数(R^(2))>0.91,均方根误差(root mean square Error,RMSE)<1.00 cm;主枝干与一级枝干的分枝角为,R^(2)>0.91,RMSE<2.93;一级枝干直径为,R^(2)>0.90,RMSE<1.41 cm;将3个树龄放在一起计算其生长参数,并与实测值进行对比,发现该算法同样适用于异龄林样地的各个生长参数计算。同时发现橡胶树的一级枝条的直径越大,其相对应的叶团簇体积就越大。运用人工智能的理论模型来处理林木的激光点云数据,旨在为森林的可视化以及树木骨架结构的智能化分析与处理等研究领域提供有价值的参考。 展开更多
关键词 地基激光点云 点云簇过分割 空间殖民算法 树木骨架重建 林木参数提取 数字孪生
下载PDF
基于子空间关系学习的跨模态哈希检索方法
12
作者 赵永晖 胡海根 《计算机应用与软件》 北大核心 2024年第10期304-313,共10页
为了提升检索精度,降低计算成本,提出一种基于子空间关系学习的跨模态哈希检索方法。通过优化哈希码与关系信息之间的距离,将类标签转换为子空间的关系信息,从而保留了模态关系、离散约束和非线性结构。设计一个对称的框架来生成统一的... 为了提升检索精度,降低计算成本,提出一种基于子空间关系学习的跨模态哈希检索方法。通过优化哈希码与关系信息之间的距离,将类标签转换为子空间的关系信息,从而保留了模态关系、离散约束和非线性结构。设计一个对称的框架来生成统一的二进制码检索数据库,并提出一种离散优化散列算法来解决目标函数不放松离散约束,有效地提高训练效率。两个跨模态检索实验结果证明了该方法检索精度较高,计算时间较少。 展开更多
关键词 跨模态 哈希算法 检索 二进制码
下载PDF
基于模糊C均值聚类的异构数据信息检索仿真
13
作者 刘亮龙 牛秦洲 《计算机仿真》 2024年第10期482-486,共5页
不同数据库系统可能使用不同查询语义和查询表达方式,为了获取高质量的异构数据库信息检索结果,提出一种混合云环境下异构数据库信息检索算法。优先建立局部本体,在局部本体的基础上形成信息领域本体,抽取局部信息。在信息领域本体的指... 不同数据库系统可能使用不同查询语义和查询表达方式,为了获取高质量的异构数据库信息检索结果,提出一种混合云环境下异构数据库信息检索算法。优先建立局部本体,在局部本体的基础上形成信息领域本体,抽取局部信息。在信息领域本体的指导下对局部信息展开集成,获取全局信息,完成混合云环境下异构数据库信息集成。通过对全部信息展开检索特征匹配,组建异构数据库空间规划模型,采用模糊C均值聚类算法对信息聚类,最终实现混合云环境下异构数据库信息检索。实验结果表明,采用所提算法展开异构数据库信息检索的精度更高,且相对检索增益较高,说明其检索效果较好。 展开更多
关键词 混合云 异构数据库 信息检索 模糊聚类算法
下载PDF
基于树结构的代码检索方法
14
作者 糜伊杨 余芊瞳 魏念青 《计算机应用文摘》 2024年第7期125-127,共3页
随着软件项目规模的不断增大和开源代码库的日益丰富,快速、准确的代码检索变得至关重要。传统基于关键词的搜索方法存在效率低和准确性不高等问题,因此文章提出了一种基于树结构的项目源代码检索方法,结合代码和注释构建多层次树结构,... 随着软件项目规模的不断增大和开源代码库的日益丰富,快速、准确的代码检索变得至关重要。传统基于关键词的搜索方法存在效率低和准确性不高等问题,因此文章提出了一种基于树结构的项目源代码检索方法,结合代码和注释构建多层次树结构,以帮助开发者更好地理解代码关系,进而准确定位所需代码。通过汇聚相似代码元素、过滤非相关代码,该方法可有效提高代码检索的准确性。实验结果显示,基于树结构的代码检索方法在准确率、召回率和F1值方面显著优于传统的文本匹配和图嵌入方法,可提供高效、准确的代码检索工具,从而提高开发效率和代码重用质量,有望在软件开发中产生积极影响。 展开更多
关键词 代码检索 多层次树结构 信息检索
下载PDF
基于哈希算法的互联网平台数据中台资源检索方法
15
作者 梁艳春 阮宜龙 +1 位作者 李晨阳 张宏俊 《现代传输》 2024年第2期37-40,共4页
由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输... 由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输入数据进行清洗、去重、分词等预处理操作的基础上,使用词袋模型的方法,将文本转化为向量,再借助主成分分析法实现对向量的降维。在检索阶段,将与检索请求相似度最高(欧氏距离最小的)资源作为最终的检索输出结果。在测试结果中,资源检索方法面对不同类型的资源检索请求,对应的查准率稳定在91.0%以上,查全率稳定在90.0%以上。 展开更多
关键词 哈希算法 互联网平台 数据中台 资源检索 信息跨域检索 降维处理 词袋模型 主成分分析法 欧氏距离
下载PDF
三角模糊集算法在电子信息分布式多模块检索仿真中的应用研究
16
作者 段文宣 董志松 +2 位作者 孙红生 于银蕾 贾胜中 《信息与电脑》 2024年第8期173-175,共3页
三角模糊集算法,作为一种基于模糊逻辑的数学工具,能够有效处理不确定性和模糊性问题,因此在信息检索中显示出巨大的潜力。三角模糊集是模糊数学中的基本概念,通过定义隶属函数为三角形的模糊集合,能够简化模糊信息的处理过程,提高算法... 三角模糊集算法,作为一种基于模糊逻辑的数学工具,能够有效处理不确定性和模糊性问题,因此在信息检索中显示出巨大的潜力。三角模糊集是模糊数学中的基本概念,通过定义隶属函数为三角形的模糊集合,能够简化模糊信息的处理过程,提高算法的效率和检索的准确性。本文深入探讨了三角模糊集算法在电子信息分布式多模块检索中的具体应用,包括模糊化处理和相似度计算等关键技术。最后,通过仿真研究,验证了该算法在提高检索系统性能方面的有效性。 展开更多
关键词 三角模糊集算法 电子信息分布式 多模块检索
下载PDF
全文检索模型综述 被引量:12
17
作者 申展 江宝林 +2 位作者 陈祎 唐磊 胡运发 《计算机科学》 CSCD 北大核心 2004年第5期61-64,共4页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。 展开更多
关键词 信息检索 文档数据库 全文检索模型 倒排表 Pat-树 互关联后继树 位图 署名文件
下载PDF
基于语义理解的文本相似度算法 被引量:80
18
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网
下载PDF
元搜索引擎系统合成算法的约束条件 被引量:18
19
作者 阳小华 刘振宇 +2 位作者 谭敏生 刘杰 张敏捷 《软件学报》 EI CSCD 北大核心 2002年第7期1264-1270,共7页
合成是元搜索引擎系统中一个重要的技术问题.给出了搜索引擎和元搜索引擎的形式化定义,对各种可能的元搜索引擎合成类型进行了划分.在此基础上,提出了元搜索引擎合成的一般性约束条件以及针对特殊类型的特殊约束条件.这些约束条件为构... 合成是元搜索引擎系统中一个重要的技术问题.给出了搜索引擎和元搜索引擎的形式化定义,对各种可能的元搜索引擎合成类型进行了划分.在此基础上,提出了元搜索引擎合成的一般性约束条件以及针对特殊类型的特殊约束条件.这些约束条件为构造好的元搜索引擎合成策略提供了基本保障. 展开更多
关键词 元搜索引擎系统 合成算法 约束条件 因特网 信息检索系统
下载PDF
一种基于拓扑连接图的三维模型检索方法 被引量:22
20
作者 潘翔 张三元 +1 位作者 张引 叶修梓 《计算机学报》 EI CSCD 北大核心 2004年第9期1250-1255,共6页
提出了一种基于分割技术的拓扑连接图构造方法 ,并用于三维模型检索 .首先构造多层邻域计算用于度量每个三角片平坦度的信号值 ,根据这些信号值采用一种改进的分水岭方法把模型分割成不同的曲面片 .然后利用这些曲面片之间的连接关系构... 提出了一种基于分割技术的拓扑连接图构造方法 ,并用于三维模型检索 .首先构造多层邻域计算用于度量每个三角片平坦度的信号值 ,根据这些信号值采用一种改进的分水岭方法把模型分割成不同的曲面片 .然后利用这些曲面片之间的连接关系构造拓扑连接图 .最后通过比较不同模型的拓扑连接图相似性来得到它们的匹配度 ,根据匹配度进行三维模型检索 . 展开更多
关键词 拓扑连接图 三维模型检索 模型分割 信号值 分水岭分割 REEB图
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部