期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
A Study on Indexing Efficiency and Retrieval Accuracy for Author Name Search of Academic Papers
1
作者 Heejun Han Heeseok Choi Jaesoo Kim 《Computer Technology and Application》 2015年第2期57-63,共7页
关键词 学术论文 检索效率 学术信息 搜索结果 精度 名称 网络数据 信息服务
下载PDF
英、拉、汉树木名称电子词典TreeName的研制 被引量:1
2
作者 郑勇奇 张川红 +2 位作者 郑洪涛 郑志华 李伯菁 《林业科学研究》 CSCD 北大核心 2004年第2期231-236,共6页
英、拉、汉树木名称电子词典第1版(TreeName1 0)具有树种的英文、拉丁文和中文名称的相互翻译查询功能。软件包含了1 5万余条英、拉、中树木名称词条,能够进行快速有效的检索查询,为工作提供极大的帮助。整个软件采用基于对话框模式的... 英、拉、汉树木名称电子词典第1版(TreeName1 0)具有树种的英文、拉丁文和中文名称的相互翻译查询功能。软件包含了1 5万余条英、拉、中树木名称词条,能够进行快速有效的检索查询,为工作提供极大的帮助。整个软件采用基于对话框模式的查询界面和基于文件系统的数据库作为整个查询系统的框架。本系统在设计中采用了比较灵活的功能模块设计,利于软件的更新。与印刷版的各种词典相比,电子词典系统具有无法比拟的优点,它能够及时进行修改、补充,使系统不断得到完善,及时根据用户的反馈信息进行改进,有利于软件质量的提高和功能的完善。 展开更多
关键词 树木名称 电子词典 Treename 英文 拉丁文 中文 翻译 查询 软件开发
下载PDF
A Fast and Memory-Efficient Approach to NDN Name Lookup 被引量:4
3
作者 Dacheng He Dafang Zhang +2 位作者 Ke Xu Kun Huang Yanbiao Li 《China Communications》 SCIE CSCD 2017年第10期61-69,共9页
For name-based routing/switching in NDN, the key challenges are to manage large-scale forwarding Tables, to lookup long names of variable lengths, and to deal with frequent updates. Hashing associated with proper leng... For name-based routing/switching in NDN, the key challenges are to manage large-scale forwarding Tables, to lookup long names of variable lengths, and to deal with frequent updates. Hashing associated with proper length-detecting is a straightforward yet efficient solution. Binary search strategy can reduce the number of required hash detecting in the worst case. However, to assure the searching path correct in such a schema, either backtrack searching or redundantly storing some prefixes is required, leading to performance or memory issues as a result. In this paper, we make a deep study on the binary search, and propose a novel mechanism to ensure correct searching path without neither additional backtrack costs nor redundant memory consumptions. Along any binary search path, a bloom filter is employed at each branching point to verify whether a said prefix is present, instead of storing that prefix here. By this means, we can gain significantly optimization on memory efficiency, at the cost of bloom checking before each detecting. Our evaluation experiments on both real-world and randomly synthesized data sets demonstrate our superiorities 展开更多
关键词 二进制搜索 冗余存储 搜索路径 搜索策略 回溯搜索 效率优化 转发表 前缀
下载PDF
WEB BASED TRANSLATION OF CHINESE ORGANIZATION NAME
4
作者 Yang Muyun Liu Daxin +2 位作者 Zhao Tiejun Qi Haoliang Lin Kaiming 《Journal of Electronics(China)》 2009年第2期279-284,共6页
A web-based translation method for Chinese organization name is proposed.After ana-lyzing the structure of Chinese organization name,the methods of bilingual query formulation and maximum entropy based translation re-... A web-based translation method for Chinese organization name is proposed.After ana-lyzing the structure of Chinese organization name,the methods of bilingual query formulation and maximum entropy based translation re-ranking are suggested to retrieve the English translation from the web via public search engine.The experiments on Chinese university names demonstrate the validness of this approach. 展开更多
关键词 汉语 翻译方法 英文翻译 最大熵 中文
下载PDF
基于优化CS-SVM算法的DGA域名检测研究
5
作者 卢加奇 吕广旭 +2 位作者 魏先燕 冯燕茹 王小英 《现代信息科技》 2023年第11期77-79,共3页
近年来恶意软件融合域名生成算法,生成大量的恶意域名严重威胁网络安全。目前现有的恶意域名检测方法大多都存在检测效率低等问题。提出一种通过采用优化后的布谷鸟搜索算法(CS)对支持向量机(SVM)进行优化,即BCS-SVM方法,该方法能够适应... 近年来恶意软件融合域名生成算法,生成大量的恶意域名严重威胁网络安全。目前现有的恶意域名检测方法大多都存在检测效率低等问题。提出一种通过采用优化后的布谷鸟搜索算法(CS)对支持向量机(SVM)进行优化,即BCS-SVM方法,该方法能够适应DGA域名检测场景。实验采用开放域名数据作为样本集,对文章提出的DGA域名检测方法进行训练,并通过域名向量转换、检测模型训练、参数调优,最终完成了一种较为高效的DGA域名检测模型。 展开更多
关键词 特征选择 DGA域名 布谷鸟搜索算法 支持向量机
下载PDF
Identification of Categorical Registration Data of Domain Names in Data Warehouse Construction Task
6
作者 Rasim Alguliev Rena Gasimova 《Intelligent Control and Automation》 2013年第2期227-234,共8页
This work is dedicated to formation of data warehouse for processing of a large volume of registration data of domain names. Data cleaning is applied in order to increase the effectiveness of decision making support. ... This work is dedicated to formation of data warehouse for processing of a large volume of registration data of domain names. Data cleaning is applied in order to increase the effectiveness of decision making support. Data cleaning is ap- plied in warehouses for detection and deletion of errors, discrepancy in data in order to improve their quality. For this purpose, fuzzy record comparison algorithms are for clearing of registration data of domain names reviewed in this work. Also, identification method of domain names registration data for data warehouse formation is proposed. Deci- sion making algorithms for identification of registration data are implemented in DRRacket and Python. 展开更多
关键词 DOMAIN DOMAIN name System Registrar Registrant Category DATA DATA WAREHOUSE DATA CLEARING Fuzzy search Algorithms Damerau-Levenstein Distance Decision Tree
下载PDF
基于文件名搜索的NTFS文件恢复方法研究
7
作者 吴淑惠 《计算机时代》 2023年第3期119-123,共5页
NTFS文件系统具有很好的容错性和安全性,是当前应用最为广泛的文件系统。在使用该文件系统的过程中,误删除文件系常见操作。本文针对误删除文件的两种情况(从回收站中删除和按shift+delete组合键删除),研究了在Winhex中通过文件名搜索... NTFS文件系统具有很好的容错性和安全性,是当前应用最为广泛的文件系统。在使用该文件系统的过程中,误删除文件系常见操作。本文针对误删除文件的两种情况(从回收站中删除和按shift+delete组合键删除),研究了在Winhex中通过文件名搜索的恢复方法。因数据恢复过程中经常需要对数据流进行计算,故提供了在Excel中自动计算的公式。另外,本文还涉及了远程数据恢复。 展开更多
关键词 NTFS文件 文件名搜索 data run计算 WINHEX 远程数据恢复
下载PDF
基于混合计数布隆过滤器的高效数据名查找方法 被引量:2
8
作者 许可 李彦彪 +1 位作者 谢高岗 张大方 《计算机研究与发展》 EI CSCD 北大核心 2023年第5期1136-1150,共15页
数据名查找是信息中心网络、内容分发网络、5G核心网中基础功能组件的关键操作,需要面向大规模规则表进行最长前缀匹配,在查找速度、更新开销和存储开销等方面面临严峻挑战.首先设计了混合计数布隆过滤器(HyCBF),将数据名前缀和前缀标... 数据名查找是信息中心网络、内容分发网络、5G核心网中基础功能组件的关键操作,需要面向大规模规则表进行最长前缀匹配,在查找速度、更新开销和存储开销等方面面临严峻挑战.首先设计了混合计数布隆过滤器(HyCBF),将数据名前缀和前缀标记维护在同一个计数布隆过滤器中同时保持二者的逻辑独立性.这样可在不增加额外存储开销和时间开销的情况下提供更丰富的指示信息.基于此,提出HyCBF辅助的二分数据名查找(HyBS)方法以实现高效查找.进一步,为缓解二分查找过程中因回溯导致的性能损失,为HyCBF中每个条目关联一个特征比特位图以降低其假阳性率.实验表明,HyBS相比现有方法在查找性能和更新速度方面具有明显优势,存储效率也有一定提升.此外,将HyBS集成到向量化数据包处理(VPP)框架中进行系统性能评估,结果表明HyBS可用于构建高通量可扩展的数据名查找引擎. 展开更多
关键词 数据名查找 特征比特位图 计数布隆过滤器 二分搜索 向量化数据包处理
下载PDF
基于互联网的中文问答系统 被引量:9
9
作者 张永奎 赵辄谦 +1 位作者 白丽君 陈鑫卿 《计算机工程》 CAS CSCD 北大核心 2003年第15期84-85,F003,共3页
搜索引擎(如Google等)返回的是与用户查询相关的文档集,并不是所提出的问题的答案。该文提出了一个基于互联网的中文问答系统,用来增强已有的搜索引擎的功能,使它们能够支持自然语言的回答。
关键词 问答系统 搜索引擎 命名实体
下载PDF
基于Lucene的地名数据库快速检索系统 被引量:20
10
作者 张文元 周世宇 谈国新 《计算机应用研究》 CSCD 北大核心 2017年第6期1756-1761,共6页
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器... 针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。 展开更多
关键词 LUCENE 地名 全文检索 数据库 中文分词 相关度排序
下载PDF
基于GIS的承德乡村地名文化景观空间分布特征 被引量:69
11
作者 孙百生 郭翠恩 +1 位作者 杨依天 葛伟 《地理科学》 CSSCI CSCD 北大核心 2017年第2期244-251,共8页
将承德地区乡村地名作为离散点,以GIS中移动搜索法的点距离空间平滑分析法为支撑,从地理区域这一角度分析地名文化景观空间分布特征。研究发现:承德地区自然类景观,以"山"、"水文"、"动植物"命名的地名... 将承德地区乡村地名作为离散点,以GIS中移动搜索法的点距离空间平滑分析法为支撑,从地理区域这一角度分析地名文化景观空间分布特征。研究发现:承德地区自然类景观,以"山"、"水文"、"动植物"命名的地名分布主要位于中低海拔高度的平坦地区;承德地区乡村地名文化景观划分为军事活动类、经济活动类、房屋建筑类、美愿与纪念类、满蒙少数民族语言及方言类,其空间分布特征与当地历史时期的军事、生产生活、社会变迁的相对频繁程度以及人口稠密情况基本上相符合。 展开更多
关键词 地名 文化景观 移动搜索法 点距离法 空间平滑 承德
下载PDF
基于查询扩展的人名消歧 被引量:7
12
作者 杨欣欣 李培峰 朱巧明 《计算机应用》 CSCD 北大核心 2012年第9期2488-2490,2507,共4页
针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并... 针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并返回前k个文档,最后对这些文档使用文档频率(DF)方法进行特征选择,并将选择的特征加入到原文档中。实验证明,该方法能显著提高人名消歧系统的性能,平均F值由76%增加到81%。 展开更多
关键词 查询扩展 搜索引擎 人名消歧 命名实体
下载PDF
机读目录中丛书名检索点的制作 被引量:2
13
作者 邓福泉 《图书馆论坛》 CSSCI 北大核心 2004年第6期217-218,共2页
介绍了利用机读目录制作丛书名检索点中存在的问题 ,详细分析了造成做法不正确的原因 ,明确指出了正确的制作方法。
关键词 检索点 丛书 机读目录 书名 制作方法 细分 录制 做法 原因 问题
下载PDF
海量空间信息隐形搜索的研究 被引量:4
14
作者 张建兵 杨崇俊 《计算机工程》 EI CAS CSCD 北大核心 2006年第22期58-60,共3页
提出了利用网格技术实现分布式海量空间信息搜索的方法,基于网格开发工具ProActive开发了海量空间信息网格调度服务。利用鼠标屏幕取词、中文地名识别和基于网格的海量空间信息搜索技术,设计并实现了一个海量空间信息隐形搜索引擎,实现... 提出了利用网格技术实现分布式海量空间信息搜索的方法,基于网格开发工具ProActive开发了海量空间信息网格调度服务。利用鼠标屏幕取词、中文地名识别和基于网格的海量空间信息搜索技术,设计并实现了一个海量空间信息隐形搜索引擎,实现了即时、隐性、动态获取中国300个城市的空间信息。为海量空间信息服务提供了一种全新的技术。 展开更多
关键词 空间信息搜索 地名识别 网格 PROACTIVE
下载PDF
Internet中文个人信息搜索 被引量:7
15
作者 沈达阳 孙茂松 《中文信息学报》 CSCD 北大核心 1999年第2期24-32,共9页
本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分... 本文构造了一个用于自动生成Internet个人信息索引的实验系统PersonIndexer。在CERNET两个网址上进行的初步实验表明,PersonIndexer对中文姓名、拼音人名、中文机构名的召回率和精确率平均分别为97.8%和61.9%、100%和64.5%、94.5%和92.1%,对电子邮件地址和电话传真号码的召回率和精确率均为100%。鉴于Internet上的信息检索以及自然语言处理这两个领域都互向对方提出了要求,我们相信,面向大规模真实文本的汉语分析技术与Internet的结合。 展开更多
关键词 中文姓名辨识 个人信息搜索 INTERNET 信息处理
下载PDF
空间信息隐形搜索引擎研究 被引量:2
16
作者 张建兵 刘冬林 《计算机工程与应用》 CSCD 北大核心 2008年第9期165-167,189,共4页
基于三层B/S结构,结合鼠标屏幕取词、快速中文地名识别和网络地图服务技术,设计并实现了一个空间信息隐形搜索引擎,实现即时、隐性的空间信息(文字和图形)动态获取。该引擎扩展了地理信息系统的应用模式,为空间信息服务提供了一种全新... 基于三层B/S结构,结合鼠标屏幕取词、快速中文地名识别和网络地图服务技术,设计并实现了一个空间信息隐形搜索引擎,实现即时、隐性的空间信息(文字和图形)动态获取。该引擎扩展了地理信息系统的应用模式,为空间信息服务提供了一种全新的技术。 展开更多
关键词 空间信息搜索 地名识别 地图服务
下载PDF
基于通用搜索引擎实现站内搜索的二次开发 被引量:1
17
作者 徐芳 《现代图书情报技术》 CSSCI 北大核心 2009年第5期81-85,共5页
介绍一种新的站内搜索引擎实现,它是基于Google、Baidu等大型通用搜索引擎实现站内搜索的二次开发。与其他类似应用相比其优点是:搜索结果页面干净、无其他广告、推广信息等附加内容;能同时指定多个域名,达到在主网站、子网站及类网站... 介绍一种新的站内搜索引擎实现,它是基于Google、Baidu等大型通用搜索引擎实现站内搜索的二次开发。与其他类似应用相比其优点是:搜索结果页面干净、无其他广告、推广信息等附加内容;能同时指定多个域名,达到在主网站、子网站及类网站间同时搜索的目的。 展开更多
关键词 搜索引擎 站内搜索 多域名搜索 二次开发
下载PDF
基于类语言模型的中文机构名称自动识别 被引量:3
18
作者 尹继豪 樊孝忠 于江德 《计算机科学》 CSCD 北大核心 2006年第11期212-214,共3页
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件... 提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。 展开更多
关键词 类语言模型 中文机构名称识别 启发信息 VITERBI算法
下载PDF
中文网页搜索日志中的特殊命名实体挖掘 被引量:5
19
作者 张磊 王斌 +1 位作者 靖红芳 吴丽辉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第5期119-122,共4页
利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方... 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. 展开更多
关键词 特殊命名实体 数据挖掘 信息检索 网页搜索日志
下载PDF
基于学术社区的学术搜索引擎设计 被引量:13
20
作者 陈国华 汤庸 +1 位作者 彭泽武 李建国 《计算机科学》 CSCD 北大核心 2011年第8期171-175,共5页
学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,... 学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题。针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法。在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性。 展开更多
关键词 学术社区 学术搜索引擎 文献整合算法 中文姓名分词
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部