期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
A Study on Indexing Efficiency and Retrieval Accuracy for Author Name Search of Academic Papers
1
作者 Heejun Han Heeseok Choi Jaesoo Kim 《Computer Technology and Application》 2015年第2期57-63,共7页
Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant ... Most academic information has its creator, that is, a subject who has created the information. The subject can be an individual, a group, or an institution, and can be a nation depending on the nature of the relevant information. Most web data are composed of a title, an author, and contents. A paper which is under the academic information category has metadata including a title, an author, keyword, abstract, data about publication, place of publication, ISSN, and the like. A patent has metadata including the title, an applicant, an inventor, an attorney, IPC, number of application, and claims of the invention. Most web-based academic information services enable users to search the information by processing the meta-information. An important element is to search information by using the author field which corresponds to a personal name. This study suggests a method of efficient indexing and using the adjacent operation result ranking algorithm to which phrase search-based boosting elements are applied, and thus improving the accuracy of the search results of author name. This method can be effectively applied to providing accurate search results in the academic information services. 展开更多
关键词 Author name search information retrieval INDEXING search algorithm boosting.
下载PDF
基于ElasticSearch的地名地址搜索技术研究
2
作者 邓淑丹 《测绘标准化》 2024年第4期44-48,共5页
本文以福建省地名地址数据为研究对象,以搭建高并发、高可用、高准确性、高便捷的地名地址搜索服务为目标,基于ElasticSearch全文搜索服务器引擎,研究地名地址的数据组织、数据同步、中文分词设置、同义词设置与搜索结果排序等关键技术... 本文以福建省地名地址数据为研究对象,以搭建高并发、高可用、高准确性、高便捷的地名地址搜索服务为目标,基于ElasticSearch全文搜索服务器引擎,研究地名地址的数据组织、数据同步、中文分词设置、同义词设置与搜索结果排序等关键技术,以实现关键字搜索、分类搜索、视野范围搜索与周边搜索等智能化地名地址搜索服务接口。本研究技术成果应用于“天地图·福建”,优化了用户体验,提升了福建省互联网地理信息服务能力,提高了社会影响力。 展开更多
关键词 地名地址 搜索服务 Elasticsearch 集群式部署
下载PDF
英、拉、汉树木名称电子词典TreeName的研制 被引量:1
3
作者 郑勇奇 张川红 +2 位作者 郑洪涛 郑志华 李伯菁 《林业科学研究》 CSCD 北大核心 2004年第2期231-236,共6页
英、拉、汉树木名称电子词典第1版(TreeName1 0)具有树种的英文、拉丁文和中文名称的相互翻译查询功能。软件包含了1 5万余条英、拉、中树木名称词条,能够进行快速有效的检索查询,为工作提供极大的帮助。整个软件采用基于对话框模式的... 英、拉、汉树木名称电子词典第1版(TreeName1 0)具有树种的英文、拉丁文和中文名称的相互翻译查询功能。软件包含了1 5万余条英、拉、中树木名称词条,能够进行快速有效的检索查询,为工作提供极大的帮助。整个软件采用基于对话框模式的查询界面和基于文件系统的数据库作为整个查询系统的框架。本系统在设计中采用了比较灵活的功能模块设计,利于软件的更新。与印刷版的各种词典相比,电子词典系统具有无法比拟的优点,它能够及时进行修改、补充,使系统不断得到完善,及时根据用户的反馈信息进行改进,有利于软件质量的提高和功能的完善。 展开更多
关键词 树木名称 电子词典 Treename 英文 拉丁文 中文 翻译 查询 软件开发
下载PDF
Identification of Categorical Registration Data of Domain Names in Data Warehouse Construction Task
4
作者 Rasim Alguliev Rena Gasimova 《Intelligent Control and Automation》 2013年第2期227-234,共8页
This work is dedicated to formation of data warehouse for processing of a large volume of registration data of domain names. Data cleaning is applied in order to increase the effectiveness of decision making support. ... This work is dedicated to formation of data warehouse for processing of a large volume of registration data of domain names. Data cleaning is applied in order to increase the effectiveness of decision making support. Data cleaning is ap- plied in warehouses for detection and deletion of errors, discrepancy in data in order to improve their quality. For this purpose, fuzzy record comparison algorithms are for clearing of registration data of domain names reviewed in this work. Also, identification method of domain names registration data for data warehouse formation is proposed. Deci- sion making algorithms for identification of registration data are implemented in DRRacket and Python. 展开更多
关键词 DOMAIN DOMAIN name System Registrar Registrant Category DATA DATA WAREHOUSE DATA CLEARING Fuzzy search Algorithms Damerau-Levenstein Distance Decision Tree
下载PDF
基于互联网的中文问答系统 被引量:9
5
作者 张永奎 赵辄谦 +1 位作者 白丽君 陈鑫卿 《计算机工程》 CAS CSCD 北大核心 2003年第15期84-85,F003,共3页
搜索引擎(如Google等)返回的是与用户查询相关的文档集,并不是所提出的问题的答案。该文提出了一个基于互联网的中文问答系统,用来增强已有的搜索引擎的功能,使它们能够支持自然语言的回答。
关键词 问答系统 搜索引擎 命名实体
下载PDF
基于Lucene的地名数据库快速检索系统 被引量:20
6
作者 张文元 周世宇 谈国新 《计算机应用研究》 CSCD 北大核心 2017年第6期1756-1761,共6页
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器... 针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。 展开更多
关键词 LUCENE 地名 全文检索 数据库 中文分词 相关度排序
下载PDF
基于GIS的承德乡村地名文化景观空间分布特征 被引量:73
7
作者 孙百生 郭翠恩 +1 位作者 杨依天 葛伟 《地理科学》 CSSCI CSCD 北大核心 2017年第2期244-251,共8页
将承德地区乡村地名作为离散点,以GIS中移动搜索法的点距离空间平滑分析法为支撑,从地理区域这一角度分析地名文化景观空间分布特征。研究发现:承德地区自然类景观,以"山"、"水文"、"动植物"命名的地名... 将承德地区乡村地名作为离散点,以GIS中移动搜索法的点距离空间平滑分析法为支撑,从地理区域这一角度分析地名文化景观空间分布特征。研究发现:承德地区自然类景观,以"山"、"水文"、"动植物"命名的地名分布主要位于中低海拔高度的平坦地区;承德地区乡村地名文化景观划分为军事活动类、经济活动类、房屋建筑类、美愿与纪念类、满蒙少数民族语言及方言类,其空间分布特征与当地历史时期的军事、生产生活、社会变迁的相对频繁程度以及人口稠密情况基本上相符合。 展开更多
关键词 地名 文化景观 移动搜索法 点距离法 空间平滑 承德
下载PDF
基于查询扩展的人名消歧 被引量:7
8
作者 杨欣欣 李培峰 朱巧明 《计算机应用》 CSCD 北大核心 2012年第9期2488-2490,2507,共4页
针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并... 针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并返回前k个文档,最后对这些文档使用文档频率(DF)方法进行特征选择,并将选择的特征加入到原文档中。实验证明,该方法能显著提高人名消歧系统的性能,平均F值由76%增加到81%。 展开更多
关键词 查询扩展 搜索引擎 人名消歧 命名实体
下载PDF
搜索日志中中文人名自动识别 被引量:1
9
作者 王玥 吕学强 +1 位作者 李卓 舒燕 《中文信息学报》 CSCD 北大核心 2015年第3期162-168,176,共8页
搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方... 搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方法将搜索日志中人名内部用字的概率特征引入条件随机场,再根据搜索日志的特点计算人名可信度提取搜索日志中的中文人名。在搜狗查询日志上进行实验,正确率平均达到了81.97%、召回率平均达到了85.81%,综合指标F值平均达到了83.79%。 展开更多
关键词 人名识别 搜索日志 条件随机场 可信度
下载PDF
机读目录中丛书名检索点的制作 被引量:2
10
作者 邓福泉 《图书馆论坛》 CSSCI 北大核心 2004年第6期217-218,共2页
介绍了利用机读目录制作丛书名检索点中存在的问题 ,详细分析了造成做法不正确的原因 ,明确指出了正确的制作方法。
关键词 检索点 丛书 机读目录 书名 制作方法 细分 录制 做法 原因 问题
下载PDF
海量空间信息隐形搜索的研究 被引量:4
11
作者 张建兵 杨崇俊 《计算机工程》 EI CAS CSCD 北大核心 2006年第22期58-60,共3页
提出了利用网格技术实现分布式海量空间信息搜索的方法,基于网格开发工具ProActive开发了海量空间信息网格调度服务。利用鼠标屏幕取词、中文地名识别和基于网格的海量空间信息搜索技术,设计并实现了一个海量空间信息隐形搜索引擎,实现... 提出了利用网格技术实现分布式海量空间信息搜索的方法,基于网格开发工具ProActive开发了海量空间信息网格调度服务。利用鼠标屏幕取词、中文地名识别和基于网格的海量空间信息搜索技术,设计并实现了一个海量空间信息隐形搜索引擎,实现了即时、隐性、动态获取中国300个城市的空间信息。为海量空间信息服务提供了一种全新的技术。 展开更多
关键词 空间信息搜索 地名识别 网格 PROACTIVE
下载PDF
Internet中文个人信息搜索 被引量:7
12
作者 沈达阳 孙茂松 《中文信息学报》 CSCD 北大核心 1999年第2期24-32,共9页
本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分... 本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分别为97.8%和61.9%、100%和64.5%、94.5%和92.1%,对电子邮件地址和电话传真号码的召回率和精确率均为100%。鉴于Internet上的信息检索以及自然语言处理这两个领域都互向对方提出了要求,我们相信,面向大规模真实文本的汉语分析技术与Internet的结合。 展开更多
关键词 中文姓名辨识 个人信息搜索 INTERNET 信息处理
下载PDF
空间信息隐形搜索引擎研究 被引量:2
13
作者 张建兵 刘冬林 《计算机工程与应用》 CSCD 北大核心 2008年第9期165-167,189,共4页
基于三层B/S结构,结合鼠标屏幕取词、快速中文地名识别和网络地图服务技术,设计并实现了一个空间信息隐形搜索引擎,实现即时、隐性的空间信息(文字和图形)动态获取。该引擎扩展了地理信息系统的应用模式,为空间信息服务提供了一种全新... 基于三层B/S结构,结合鼠标屏幕取词、快速中文地名识别和网络地图服务技术,设计并实现了一个空间信息隐形搜索引擎,实现即时、隐性的空间信息(文字和图形)动态获取。该引擎扩展了地理信息系统的应用模式,为空间信息服务提供了一种全新的技术。 展开更多
关键词 空间信息搜索 地名识别 地图服务
下载PDF
基于通用搜索引擎实现站内搜索的二次开发 被引量:1
14
作者 徐芳 《现代图书情报技术》 CSSCI 北大核心 2009年第5期81-85,共5页
介绍一种新的站内搜索引擎实现,它是基于Google、Baidu等大型通用搜索引擎实现站内搜索的二次开发。与其他类似应用相比其优点是:搜索结果页面干净、无其他广告、推广信息等附加内容;能同时指定多个域名,达到在主网站、子网站及类网站... 介绍一种新的站内搜索引擎实现,它是基于Google、Baidu等大型通用搜索引擎实现站内搜索的二次开发。与其他类似应用相比其优点是:搜索结果页面干净、无其他广告、推广信息等附加内容;能同时指定多个域名,达到在主网站、子网站及类网站间同时搜索的目的。 展开更多
关键词 搜索引擎 站内搜索 多域名搜索 二次开发
下载PDF
基于类语言模型的中文机构名称自动识别 被引量:3
15
作者 尹继豪 樊孝忠 于江德 《计算机科学》 CSCD 北大核心 2006年第11期212-214,共3页
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件... 提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。 展开更多
关键词 类语言模型 中文机构名称识别 启发信息 VITERBI算法
下载PDF
中文网页搜索日志中的特殊命名实体挖掘 被引量:5
16
作者 张磊 王斌 +1 位作者 靖红芳 吴丽辉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第5期119-122,共4页
利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方... 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. 展开更多
关键词 特殊命名实体 数据挖掘 信息检索 网页搜索日志
下载PDF
基于学术社区的学术搜索引擎设计 被引量:13
17
作者 陈国华 汤庸 +1 位作者 彭泽武 李建国 《计算机科学》 CSCD 北大核心 2011年第8期171-175,共5页
学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,... 学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题。针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法。在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性。 展开更多
关键词 学术社区 学术搜索引擎 文献整合算法 中文姓名分词
下载PDF
从检索角度谈410字段和461字段的著录规则 被引量:1
18
作者 陈立红 《晋图学刊》 2005年第6期49-51,共3页
通过介绍计算机编目中有关丛书名检索的功能字段,分析225丛编题名字段与410字段—丛编和461字段—总集这连接字段的关系,谈谈如何对410字段和461字段著录进行规范统一。
关键词 计算机编目 丛书名著录 检索 连接点
下载PDF
搜商在图书馆中文名称规范工作中的运用 被引量:3
19
作者 宋芸芳 《图书馆建设》 CSSCI 北大核心 2010年第8期64-66,70,共4页
搜商是一种与智商、情商相并列的人类智力因素,是指人类通过某种手段获取新知识的能力。图书馆中文名称规范工作要求编目员具备较强的信息搜索与辨别能力。将搜商引入图书馆中文名称规范工作中,能够为提高工作质量和工作效率问题提供一... 搜商是一种与智商、情商相并列的人类智力因素,是指人类通过某种手段获取新知识的能力。图书馆中文名称规范工作要求编目员具备较强的信息搜索与辨别能力。将搜商引入图书馆中文名称规范工作中,能够为提高工作质量和工作效率问题提供一种新思路。可以通过养成良好的搜索习惯、运用合理的搜索技巧、准确辨认搜索结果等方式培养编目员的搜商。 展开更多
关键词 搜商 中文名称规范 编目员
下载PDF
《所罗门之歌》:“追寻”的故事 被引量:11
20
作者 张颖 《四川外语学院学报》 2001年第4期27-29,共3页
美国黑人女作家托妮·莫里森的第三部长篇小说《所罗门之歌》使她跻身于美国当代最伟大作家的行列。该书被认为是在《看不见的人》之后内容最扎实的一部美国黑人小说。通过分析主人公奶人的成长过程 ,探讨小说“追寻”的主题 :对真... 美国黑人女作家托妮·莫里森的第三部长篇小说《所罗门之歌》使她跻身于美国当代最伟大作家的行列。该书被认为是在《看不见的人》之后内容最扎实的一部美国黑人小说。通过分析主人公奶人的成长过程 ,探讨小说“追寻”的主题 :对真实姓名、文化传统及人性的追寻。 展开更多
关键词 追寻 真实姓名 文化传统 人性
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部