期刊文献+
共找到462篇文章
< 1 2 24 >
每页显示 20 50 100
Query Expansion for Chinese Information Retrieval by Using a Decaying Co-occurrence Model 被引量:3
1
作者 贺宏朝 何丕廉 +1 位作者 高剑峰 黄昌宁 《Transactions of Tianjin University》 EI CAS 2002年第3期183-186,共4页
Query expansion with thesaurus is one of the useful techniques in modern information retrieval (IR). In this paper, a method of query expansion for Chinese IR by using a decaying co-occurrence model is proposed and re... Query expansion with thesaurus is one of the useful techniques in modern information retrieval (IR). In this paper, a method of query expansion for Chinese IR by using a decaying co-occurrence model is proposed and realized. The model is an extension of the traditional co-occurrence model by adding a decaying factor that decreases the mutual information when the distance between the terms increases. Experimental results on TREC-9 collections show this query expansion method results in significant improvements over the IR without query expansion. 展开更多
关键词 query expansion chinese language information retrieval
下载PDF
An Exploratory Data Analysis of Mazu Culture Research Based on Diaolong-Full-Text Database of Ancient Chinese and Japanese Books
2
作者 QIN Yeqi YU Hongyan 《Cultural and Religious Studies》 2023年第6期286-296,共11页
Mazu is the most famous goddess of canal transport in China,and one of the three folk beliefs in China.Japan is our neighbor across the sea.As early as 1000 years ago,Japan was influenced by the Mazu ceremonial cultur... Mazu is the most famous goddess of canal transport in China,and one of the three folk beliefs in China.Japan is our neighbor across the sea.As early as 1000 years ago,Japan was influenced by the Mazu ceremonial culture.Through big data analysis,this study conducted database counting,screening,and analysis on the Mazu culture in Diaolong,the full-text database of Chinese and Japanese ancient books.Besides,it explored the hot topics of concern and emotional attitudes,and then analyzed the important role of Mazu culture in the cultural exchange and mutual learning between China and Japan in the new era,with a view to completing the contemporary task of“people-to-people bond”and achieving common development. 展开更多
关键词 Mazu culture JAPAN Diaolong—full-text database of ancient chinese and Japanese books
下载PDF
Hierarchical Approximate Matching for Retrieval of Chinese Historical Calligraphy Character 被引量:4
3
作者 章夏芬 庄越挺 +1 位作者 吴江琴 吴飞 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第4期633-640,共8页
As historical Chinese calligraphy works are being digitized, the problem of retrieval becomes a new challenge. But, currently no OCR technique can convert calligraphy character images into text, nor can the existing H... As historical Chinese calligraphy works are being digitized, the problem of retrieval becomes a new challenge. But, currently no OCR technique can convert calligraphy character images into text, nor can the existing Handwriting Character Recognition approach does not work for it. This paper proposes a novel approach to efficiently retrieving Chinese calligraphy characters on the basis of similarity: calligraphy character image is represented by a collection of discriminative features, and high retrieval speed with reasonable effectiveness is achieved. First, calligraphy characters that have no possibility similar to the query are filtered out step by step by comparing the character complexity, stroke density and stroke protrusion. Then, similar calligraphy characters axe retrieved and ranked according to their matching cost produced by approximate shape match. In order to speed up the retrieval, we employed high dimensional data structure - PK-tree. Finally, the efficiency of the algorithm is demonstrated by a preliminary experiment with 3012 calligraphy character images. 展开更多
关键词 chinese calligraphy approximate matching character retrieval
原文传递
基于本体推理和语义网检索的中西药相互作用知识发现研究
4
作者 杨乐乐 龙海 +2 位作者 姚克宇 刘丽红 朱彦 《中华中医药学刊》 CAS 北大核心 2024年第9期13-17,共5页
中西药物联用是国内医疗界和学术界共同关注的焦点问题之一。目前,中西药相互作用信息化研究基本处于数据库构建探索阶段,相关研究成果较少;中西药相互作用类别及途径信息不完整,相关数据来源单一,检索结果缺乏证据评价;存在信息分散、... 中西药物联用是国内医疗界和学术界共同关注的焦点问题之一。目前,中西药相互作用信息化研究基本处于数据库构建探索阶段,相关研究成果较少;中西药相互作用类别及途径信息不完整,相关数据来源单一,检索结果缺乏证据评价;存在信息分散、缺乏统一语义参照等问题,难以满足本领域理论研究与临床合理用药的需要。在大语言模型的技术背景下,探讨基于本体推理和语义网检索的中西药相互作用知识发现方法。首先,解析中西药相互作用领域概念及关系,构建中西药相互作用本体;其次,在中西药联合使用时,根据设定的中西药相互作用规则发现隐含的中西药相互作用信息知识,利用语义检索获得的中西药相互作用结果,制定评价指标,通过对中西药相互作用结果的证据等级推荐,对中西药联用场景进行风险预警提示;最后,构建中西药相互作用知识图谱并开发应用示范系统。同时,积极探索借助大语言模型的多任务处理功能,辅助信息抽取、结构化和知识表示,知识发现结果智能输出。 展开更多
关键词 中西药物相互作用 本体推理 语义网检索 知识发现
下载PDF
面向中医药大模型的知识增强方法研究
5
作者 吉祥宇 王鑫 +5 位作者 张鹤译 孟昭鹏 张俊华 庄朋伟 贾勇哲 徐大为 《计算机科学与探索》 CSCD 北大核心 2024年第10期2616-2629,共14页
近年来,大语言模型(LLM)在各个领域取得了许多重大成果。由于缺乏专业知识,以及中医和现代医学的思想不同,大模型在中医药领域的应用仍是一项挑战。现有的知识增强方法难以保持中医方剂具有的自身结构性。为了解决以上问题,提出了一种... 近年来,大语言模型(LLM)在各个领域取得了许多重大成果。由于缺乏专业知识,以及中医和现代医学的思想不同,大模型在中医药领域的应用仍是一项挑战。现有的知识增强方法难以保持中医方剂具有的自身结构性。为了解决以上问题,提出了一种新的知识增强方法。该方法由模型训练、图谱构建和知识增强三部分组成。在模型训练阶段,通过对基础大模型在中医药数据集上进行预训练和微调两阶段训练,得到中医药领域大模型。在图谱构建阶段,基于中医十万首经典方剂和古籍中的方剂,利用清洗后的数据集构建中医药图谱。在知识增强阶段,基于对知识图谱上信息的计算,利用检索图谱中的专业知识和图谱结构计算检索结果,中医药方剂中的结构特性得以保留。在中医药方剂配伍任务上,针对于任务特性提出了一组评价标准,包括主观指标和客观指标,用于评估模型在该任务上的表现。实验表明,该方法相对于基准测试模型,在主观指标和客观指标上均获得了较大提升,BLEU-1最高提升0.09,ROUGE-1最高提升0.21。消融实验表明,该方法对于模型在该任务上具有较大作用,未使用知识增强的模型BLEU-1相比于使用知识增强下降约37%。 展开更多
关键词 大语言模型(LLM) 中医药 方剂优化 检索增强生成
下载PDF
基于知识图谱的中医古方交互式检索研究
6
作者 叶丁菱 牟丽君 许鑫 《数字图书馆论坛》 CSSCI 2024年第2期24-33,共10页
以中医古方为研究对象,利用命名实体识别、关系抽取等构建基于深度学习的中医古方知识图谱,并通过Neo4j图数据库实现中医古方知识与检索结果的可视化。在此基础上结合交互式检索技术,设计人机交互式检索架构,实现中医古方知识检索、知... 以中医古方为研究对象,利用命名实体识别、关系抽取等构建基于深度学习的中医古方知识图谱,并通过Neo4j图数据库实现中医古方知识与检索结果的可视化。在此基础上结合交互式检索技术,设计人机交互式检索架构,实现中医古方知识检索、知识问答、知识浏览以及知识推理。利用知识图谱对中医古方进行知识结构重组,结合交互式检索增强知识关联和提升检索效率,为中医古方相关知识组织和知识服务提供数据支持及方法借鉴。 展开更多
关键词 知识图谱 命名实体识别 交互式检索 中医古方
下载PDF
浅谈中文代码库的检索实践
7
作者 杜克奎 《科学与信息化》 2024年第15期38-41,共4页
在专利审查过程中,针对权利要求中涉及属于计算比较分析类,或者偏向计算机工程技术应用类的专利申 请,由于在专利库的检索中其关键词不易扩展,不容易找到或者不能快速找出对比文件,导致检索效率低,而且不 能高效地筛选出对比文件。针对... 在专利审查过程中,针对权利要求中涉及属于计算比较分析类,或者偏向计算机工程技术应用类的专利申 请,由于在专利库的检索中其关键词不易扩展,不容易找到或者不能快速找出对比文件,导致检索效率低,而且不 能高效地筛选出对比文件。针对上述问题,代码库检索可以作为一种需要重视的专利检索新途径。基于此,本文对 中文代码库开源中国社区检索方式进行了分析,并结合具体的实际检索案例,详细分析了开源中国社区检索特点与 检索技巧,为今后的审查提供了一种新的审查思路。 展开更多
关键词 中文代码库 检索 开源中国社区 专利审查
下载PDF
数字化藏书激光存贮检索信息类目映射方法
8
作者 罗征 张县 孙雨 《信息技术》 2024年第3期122-127,共6页
数字化藏书存贮检索受到信息映射影响,导致覆盖率与准确率值偏低,提出数字化藏书激光存贮检索信息类目映射方法。通过映射系统统计中图法和杜威十进分类法中的USMARC记录实例,构建类号映射关系,规范化处理中图法和DDC的数据,构造类目数... 数字化藏书存贮检索受到信息映射影响,导致覆盖率与准确率值偏低,提出数字化藏书激光存贮检索信息类目映射方法。通过映射系统统计中图法和杜威十进分类法中的USMARC记录实例,构建类号映射关系,规范化处理中图法和DDC的数据,构造类目数据结构,划分检索数据表,抽取检索特征词;依据双序列比对,计算特征词、复合词汇类目和所处环境的相似度,实现数字化藏书激光存贮检索信息类目映射。实验结果表明,映射方法的覆盖率达到98.38%,准确率达到97.48%,该方法实现了覆盖率与准确率的双重提升。 展开更多
关键词 数字化藏书 激光存贮检索系统 信息类目映射 复合词汇 中图法
下载PDF
一种基于上下文的中文信息检索查询扩展 被引量:25
9
作者 贺宏朝 何丕廉 +1 位作者 高剑峰 黄昌宁 《中文信息学报》 CSCD 北大核心 2002年第6期32-37,45,共7页
在中文信息检索的研究和实践中 ,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来 ,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象 ,然而 ,实验表... 在中文信息检索的研究和实践中 ,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来 ,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象 ,然而 ,实验表明 ,通常简单的查询扩展并不能稳定地提高中文信息检索的检索效果。本论文中提出并实现了一种基于上下文的查询扩展方法 ,可以根据查询的上下文对扩展词进行选择 ,是一种相对“智能”的查询扩展方法。在TREC - 9中文信息检索测试集上进行的实验表明 ,相对于通常简单的查询扩展 ,基于上下文的查询扩展方法取得了具有统计意义提高的检索效果。 展开更多
关键词 查询扩展 上下文 中文信息检索 测试集 扩展方法 信息检索系统
下载PDF
跨语言信息检索研究进展 被引量:17
10
作者 张俊林 曲为民 +1 位作者 杜林 孙玉芳 《计算机科学》 CSCD 北大核心 2004年第7期16-19,共4页
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际... 随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。 展开更多
关键词 跨语言信息检索 汉英跨语言检索 中文信息处理 受控词汇检索
下载PDF
汉语自动分词研究及其在信息检索中的应用 被引量:18
11
作者 曹倩 丁艳 +1 位作者 王超 潘金贵 《计算机应用研究》 CSCD 北大核心 2004年第5期71-74,91,共5页
汉语自动分词问题是中文信息检索的基础问题,也是阻碍其向前发展的“瓶颈”问题。介绍了分词技术的发展状况,分析了分词技术在信息检索过程中的应用,并讨论了信息检索和分词技术结合的方式和需要以及解决的关键技术问题。
关键词 汉语分词 分词模型 歧义分析 中文信息检索
下载PDF
基于PATRICIA tree的汉语自动分词词典机制 被引量:30
12
作者 杨文峰 陈光英 李星 《中文信息学报》 CSCD 北大核心 2001年第3期44-49,共6页
分词词典是汉语信息处理系统的一个基本组成部分 ,其查询和更新效率将直接影响汉语信息处理系统的性能。本文采用PATRICIAtree的数据结构 ,设计了一种可以对词典词条进行快速查询、更新的分词词典机制 ,并从理论上初步分析了它的性能。... 分词词典是汉语信息处理系统的一个基本组成部分 ,其查询和更新效率将直接影响汉语信息处理系统的性能。本文采用PATRICIAtree的数据结构 ,设计了一种可以对词典词条进行快速查询、更新的分词词典机制 ,并从理论上初步分析了它的性能。最后通过实验 ,在时间效率上与逐字二分的分词词典机制进行了比较。结果表明 ,基于PATRICIAtree的分词词典机制具有更高的查询速度和更新效率 ,能满足大规模、开放文本处理系统的需求。 展开更多
关键词 信息检索 PATRICA TREE 汉语自动分词 信息处理
下载PDF
中文Google和百度的排序方式与检索效率比较分析 被引量:10
13
作者 谈大军 林明茵 叶赛 《现代情报》 北大核心 2005年第3期87-89,92,共4页
中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素,因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采... 中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素,因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采用的三种结果排序规则地点和频率法、人气质量定律、自信心定律的基础上,比较分析了中文Google和百度的排序技术。最后笔者通过检索实践得出结论,中文Google和百度各有所长,但是在检索效率上尤其是检索结果的有效性上,中文Goole比百度要好。 展开更多
关键词 信息检索 搜索引擎 排序技术 中文Google 百度 检索效率
下载PDF
根据形状相似性的书法内容检索 被引量:13
14
作者 章夏芬 庄越挺 +1 位作者 鲁伟明 吴飞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2005年第11期2565-2569,共5页
提出了一种根据形状相似性来检索书法字的算法:将扫描的书法作品先切分成单个书法字,并提取轮廓特征;接着由形状相似性算法计算相似度,然后按相似程度大小显示同一字不同的书法风格.实验证明,该算法具有很好的效果.
关键词 书法内容检索 页面切分 形状相似性
下载PDF
中文搜索引擎的原理剖析及开发实现技术 被引量:19
15
作者 李志蜀 李果 《计算机应用研究》 CSCD 北大核心 2001年第11期96-99,共4页
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展 ,剖析了中文搜索引擎采用的核心技术—全文检索与中文分词技术 ,探讨了编程中应注意的问题和部分实现技术 。
关键词 中文搜索引擎 中文分词 信息查询 INTERNET 中文信息处理
下载PDF
基于表现手法的国画分类方法研究 被引量:12
16
作者 高峰 聂婕 +2 位作者 黄磊 段凌宇 李晓明 《计算机学报》 EI CSCD 北大核心 2017年第12期2871-2882,共12页
传统国画的数字化是信息时代对国画有效保存和有效分享的重要手段.海量的数字化国画已成为数字博物馆乃至现代图书馆重要的组成部分.如何实现对数字化国画的高效检索和管理已成为一个亟需解决的问题.针对该问题,文中探索研究基于表现手... 传统国画的数字化是信息时代对国画有效保存和有效分享的重要手段.海量的数字化国画已成为数字博物馆乃至现代图书馆重要的组成部分.如何实现对数字化国画的高效检索和管理已成为一个亟需解决的问题.针对该问题,文中探索研究基于表现手法的国画分类方法.根据表现手法的不同,国画可以分为工笔画和写意画两种基本形式.画作的对象内容不同及不同画家的画法、风格不同等因素对工笔画和写意画的计算机分类带来了重大挑战.通过对国画表现手法的研究及对大量国画的分析,文中首先提出一种国画关键区域检测方法,通过融合Scale Invariant Feature Transform(SIFT)特征检测子和边缘检测得到国画关键区域.然后,提出国画关键区域描述方法,通过对关键区域视觉特征及内部邻域差异性的描述,有效捕获工笔画和写意画在绘画技法上的不同.最后,提出一种级联分类策略,融合不同维度特征,实现对国画的分类.在文中所构建的包含1718幅古代、现代、当代国画大家作品的数据集上的实验结果表明,文中所提方法在工笔画和写意画分类上取得了很好的效果,分类正确率比现有最好方法提高了3.4%以上. 展开更多
关键词 国画 工笔 写意 图像分类 图像检索
下载PDF
试析中文搜索引擎的评价标准 被引量:34
17
作者 宛玲 杨秀丹 杜晓静 《情报科学》 CSSCI 2000年第1期28-31,38,共5页
搜索引擎是一种网络检索工具,本文主要针对中文搜索引擎评价标准进行探讨。笔者认为对它的检索功能的评价主要应从收录范围、查询结果反馈信息的质量、检索款目的信息量、查错率、更新与报道速度、查询功能、检索界面的友好性、精品推... 搜索引擎是一种网络检索工具,本文主要针对中文搜索引擎评价标准进行探讨。笔者认为对它的检索功能的评价主要应从收录范围、查询结果反馈信息的质量、检索款目的信息量、查错率、更新与报道速度、查询功能、检索界面的友好性、精品推荐、与其它搜索引擎的友情链接、响应速度等多方面进行。 展开更多
关键词 搜索引擎 评价标准 中文 信息检索 检索工具
下载PDF
搜索引擎查询推荐技术综述 被引量:29
18
作者 李亚楠 王斌 李锦涛 《中文信息学报》 CSCD 北大核心 2010年第6期75-84,共10页
查询推荐技术,其用于找出与初始查询或关键词相关的其他查询或关键词,被广泛用于搜索引擎和广告检索系统中。作为当今搜索引擎的必备技术之一,查询推荐技术研究正受到越来越多的关注,近几年出现了很多验证查询推荐可用性及改进其算法的... 查询推荐技术,其用于找出与初始查询或关键词相关的其他查询或关键词,被广泛用于搜索引擎和广告检索系统中。作为当今搜索引擎的必备技术之一,查询推荐技术研究正受到越来越多的关注,近几年出现了很多验证查询推荐可用性及改进其算法的研究工作。为此,该文对查询推荐的发展过程、技术方法、评价体系等方面进行了归纳和总结,分析了查询推荐面临的挑战并讨论了现有解决方法及未来研究思路,希望能对相关研究人员有所帮助。 展开更多
关键词 计算机应用 中文信息处理 综述 查询推荐 信息检索
下载PDF
隐含语义索引及其在中文文本处理中的应用研究 被引量:41
19
作者 周水庚 关佶红 胡运发 《小型微型计算机系统》 CSCD 北大核心 2001年第2期239-243,共5页
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得... 信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得文档之间的语义关系更为明晰 .实验和理论结果证实了隐含语义索引能够取得更好的检索效果 .本文论述了隐含语义索引的理论基础 ,研究了隐含语义索引在中文文本处理中的应用 ,包括中文文本检索、中文文本分类和中文文本聚类等 . 展开更多
关键词 信息检索 隐含语义索引 中文文本处理 中文信息处理
下载PDF
汉语分词对中文搜索引擎检索性能的影响 被引量:6
20
作者 金澎 刘毅 王树梅 《情报学报》 CSSCI 北大核心 2006年第1期21-24,共4页
针对中文网页的特点。研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用啊页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,... 针对中文网页的特点。研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用啊页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,就各种分词算法对查全率和查准率的影响进行了实验比较,结果表明分词性能和检索性能没有正比关系。 展开更多
关键词 汉语分词 信息检索 中文搜索引擎
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部