期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
738
篇文章
<
1
2
…
37
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文搜索引擎的机理及检索技巧
1
作者
龚自振
《情报探索》
2001年第2期30-32,共3页
主要介绍了中文搜索引擎的机理及国内几种常见的中文搜索引擎,从实践运用的角度阐述了 中文搜索引擎的检索技巧和方法,并指出了其存在的不足。
关键词
中文
搜索引擎
检索技巧
类型
中文excite搜索引擎
中文
雅虎
关键字
搜狐
查询工具
下载PDF
职称材料
搜索引擎Excite检索功能详述及评析
被引量:
5
2
作者
王智宇
《现代图书情报技术》
CSSCI
北大核心
2001年第6期30-32,37,共4页
表述的重点在于通过对搜索引擎 Excite工作原理的介绍及各个检索功能的分析 ,获得关于它的整体认识 。
关键词
excite
搜索引擎
概念检索
检索功能
简单检索
高级检索
精确检索
下载PDF
职称材料
中文文本WEB搜索引擎的设计与实现
被引量:
23
3
作者
钟涛
陈新明
+1 位作者
万钧
张世永
《计算机工程与应用》
CSCD
北大核心
2001年第17期149-151,169,共4页
文章主要研究中文文本WEB搜索引擎设计中面临的关键技术以及相应的设计实现。文章首先介绍了WEB搜索引擎的基本系统结构,然后具体讨论了设计时应考虑的问题并且给出了相应的实现。作者希望通过该文能为中文信息搜索引擎的发展提供一些...
文章主要研究中文文本WEB搜索引擎设计中面临的关键技术以及相应的设计实现。文章首先介绍了WEB搜索引擎的基本系统结构,然后具体讨论了设计时应考虑的问题并且给出了相应的实现。作者希望通过该文能为中文信息搜索引擎的发展提供一些有益的参考和经验。
展开更多
关键词
搜索引擎
文本处理
信息检索
中文
分词
中文
文本
Web
Internet
下载PDF
职称材料
中文搜索引擎中的中文信息处理技术
被引量:
35
4
作者
邹海山
吴勇
+1 位作者
吴月珠
陈阵
《计算机应用研究》
CSCD
2000年第12期21-24,共4页
就中文搜索引擎中的若干中文信息处理技术作了较深入地探讨,对诸如中文分词、中文码制转换和中文全半角处理等方面提出了较完整的解决方案。
关键词
中文
搜索引擎
中文
信息处理技术
中文
分词
码制转换
全半角处理
汉字编码
Internet
下载PDF
职称材料
中文搜索引擎概念检索初探
被引量:
20
5
作者
李蕾
王楠
+3 位作者
张剑
钟义信
郭祥昊
贾自燕
《计算机工程与应用》
CSCD
北大核心
2000年第6期1-3,11,共4页
搜索引擎传统的关键词匹配检索模式存在很多问题,概念检索是解决这些问题的关键技术之一。该文简要介绍了概念检索的主要内容,针对中文搜索引擎,探索出了一种基于概念语义网络知识库的概念检索模型。在此基础上,针对计算机这一特定...
搜索引擎传统的关键词匹配检索模式存在很多问题,概念检索是解决这些问题的关键技术之一。该文简要介绍了概念检索的主要内容,针对中文搜索引擎,探索出了一种基于概念语义网络知识库的概念检索模型。在此基础上,针对计算机这一特定领域,创建了一个含有500多个概念节点,包括概念层次关系和近300种概念相关关系的语义网络,初步实现了计算机领域文档的概念检索。实验结果表明,该模型对于提高中文搜索引擎的智能水平是非常有效的。
展开更多
关键词
概念检索
中文
搜索引擎
信息检索
计算机
下载PDF
职称材料
基于中文搜索引擎网络信息用户行为研究
被引量:
12
6
作者
王浩
姚长利
+1 位作者
郭琳
艾国庆
《计算机应用研究》
CSCD
北大核心
2009年第12期4665-4668,共4页
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行...
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行为的一些规律等。研究结果表明,对准确地评测搜索引擎检索的效果以及未来中文搜索引擎设计的改进都有较好的指导意义。
展开更多
关键词
中文
搜索引擎
搜索
日志
用户
搜索
行为
网络用户
下载PDF
职称材料
一种提高中文搜索引擎检索质量的HTML解析方法
被引量:
20
7
作者
宋睿华
马少平
+1 位作者
陈刚
李景阳
《中文信息学报》
CSCD
北大核心
2003年第4期19-26,共8页
中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项 ,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说 ,想在检索或者后处理阶段解决这类问题不仅要付出一定代价 ,而且在大...
中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项 ,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说 ,想在检索或者后处理阶段解决这类问题不仅要付出一定代价 ,而且在大多数情况下是不可能的。在这篇论文中 ,我们提出了网页噪声的概念 ,并针对中文网页的特点 ,实现了一种对网页自动分块并去噪的HTML解析方法 ,从而达到在预处理阶段消除潜在无关项和间接项的目的。实验结果表明 ,该方法能够在不占用查询时间的前提下 10 0 %地消除中文搜索引擎隐藏的间接项 ,以及大约 11%的无法过滤或隐藏的无关项或间接项 ,从而大幅度提高检索结果的查准率。
展开更多
关键词
中文
搜索引擎
检索质量
HTML解析方法
网页噪声
分块模型
网页去噪
中文
信息处理
下载PDF
职称材料
中文搜索引擎现状与展望
被引量:
25
8
作者
都云程
卢献华
《中文信息学报》
CSCD
北大核心
1999年第3期61-64,F003,共5页
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。
关键词
中文
搜索引擎
全文检索
中文
自动分词
搜索引擎
下载PDF
职称材料
中文搜索引擎的原理剖析及开发实现技术
被引量:
19
9
作者
李志蜀
李果
《计算机应用研究》
CSCD
北大核心
2001年第11期96-99,共4页
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展 ,剖析了中文搜索引擎采用的核心技术—全文检索与中文分词技术 ,探讨了编程中应注意的问题和部分实现技术 。
关键词
中文
搜索引擎
中文
分词
信息查询
INTERNET
中文
信息处理
下载PDF
职称材料
支持智能中文分词的互联网搜索引擎的构建
被引量:
8
10
作者
曹羽中
曹勇刚
+1 位作者
金茂忠
刘超
《计算机工程与设计》
CSCD
北大核心
2006年第23期4395-4398,4407,共5页
中文分词技术对中文搜索引擎的查准率及查全率有重大影响。在剖析开源搜索引擎Nutch的源代码结构的基础上,基于JavaCC实现了一个可扩展的词法分析器并将其与Nutch集成,构建了一个支持智能中文分词的互联网搜索引擎Nutch-Enhanced。它可...
中文分词技术对中文搜索引擎的查准率及查全率有重大影响。在剖析开源搜索引擎Nutch的源代码结构的基础上,基于JavaCC实现了一个可扩展的词法分析器并将其与Nutch集成,构建了一个支持智能中文分词的互联网搜索引擎Nutch-Enhanced。它可用作评测各类中文分词算法对搜索引擎的影响的实验平台。对NutchEnhanced的搜索质量与Nutch、Google、百度进行了对比评测。结果表明它远优于Nutch,其查全率达到了0.74,前30个搜索结果的查准率达到了0.86,总体上具有与Google,百度接近的中文搜索质量。
展开更多
关键词
中文
分词
分词算法
搜索引擎
词法分析器
检索精度
下载PDF
职称材料
中文WWW搜索引擎比较研究
被引量:
24
11
作者
任瑞娟
李洪建
《大学图书馆学报》
CSSCI
北大核心
1999年第5期55-57,61,共4页
通过上网实验测试了几种中文WWW 搜索引擎的检索功能,并分析实验数据得出结论,旨在对中文WWW 搜索引擎的建立和完善有所启示。
关键词
INTERNET
WWW
中文
搜索引擎
下载PDF
职称材料
试析中文搜索引擎的评价标准
被引量:
34
12
作者
宛玲
杨秀丹
杜晓静
《情报科学》
CSSCI
2000年第1期28-31,38,共5页
搜索引擎是一种网络检索工具,本文主要针对中文搜索引擎评价标准进行探讨。笔者认为对它的检索功能的评价主要应从收录范围、查询结果反馈信息的质量、检索款目的信息量、查错率、更新与报道速度、查询功能、检索界面的友好性、精品推...
搜索引擎是一种网络检索工具,本文主要针对中文搜索引擎评价标准进行探讨。笔者认为对它的检索功能的评价主要应从收录范围、查询结果反馈信息的质量、检索款目的信息量、查错率、更新与报道速度、查询功能、检索界面的友好性、精品推荐、与其它搜索引擎的友情链接、响应速度等多方面进行。
展开更多
关键词
搜索引擎
评价标准
中文
信息检索
检索工具
下载PDF
职称材料
汉语分词对中文搜索引擎检索性能的影响
被引量:
6
13
作者
金澎
刘毅
王树梅
《情报学报》
CSSCI
北大核心
2006年第1期21-24,共4页
针对中文网页的特点。研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用啊页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,...
针对中文网页的特点。研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用啊页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,就各种分词算法对查全率和查准率的影响进行了实验比较,结果表明分词性能和检索性能没有正比关系。
展开更多
关键词
汉语分词
信息检索
中文
搜索引擎
下载PDF
职称材料
基于字表的中文搜索引擎分词系统的设计与实现
被引量:
15
14
作者
丁承
邵志清
《计算机工程》
CAS
CSCD
北大核心
2001年第2期191-192,F003,共3页
分析了常用的基于词典的汉语分词方法应用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引、查询、排除歧义等方面进行了设计和实现。
关键词
字表
中文
搜索引擎
分词系统
设计
中文
信息处理
INTERNET
下载PDF
职称材料
中文智能搜索引擎现状探析
被引量:
12
15
作者
闫翔
陈远
《情报科学》
CSSCI
北大核心
2002年第12期1326-1328,共3页
随着 Internet的发展 ,传统的搜索引擎暴露出越来越多的弊病 ,导致智能搜索引擎的出现。而中文的特性也必然使中文智能搜索引擎具有其独特的一面。
关键词
搜索引擎
智能
搜索引擎
中文
智能
搜索引擎
网络信息检索
下载PDF
职称材料
中文搜索引擎分类体系的特点、问题及其改进
被引量:
21
16
作者
刘延章
谢琳惠
《郑州大学学报(哲学社会科学版)》
CSSCI
北大核心
2002年第6期146-148,共3页
中文搜索引擎分类体系具有实用性强、易用性好、多维性高等特点 ,但在归类、序类、划分、命名等方面也存在着严重问题 ,完善类目体系、科学编排同位类。
关键词
中文
搜索引擎
分类体系
互联网
下载PDF
职称材料
中文分词算法在搜索引擎应用中的研究
被引量:
20
17
作者
欧振猛
余顺争
《计算机工程与应用》
CSCD
北大核心
2000年第8期80-82,84,共4页
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行...
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。
展开更多
关键词
搜索引擎
中文
自动分词
算法
汉字信息处理
下载PDF
职称材料
基于全文搜索的中文搜索引擎设计技术
被引量:
10
18
作者
陈燕娜
邵志清
《计算机工程与应用》
CSCD
北大核心
2002年第17期196-198,共3页
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对...
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。
展开更多
关键词
全文
搜索
中文
搜索引擎
设计
技术
WWW
中文
分词技术
文档相关性
Internet
下载PDF
职称材料
全文检索搜索引擎中文信息处理技术研究
被引量:
5
19
作者
唐培丽
胡明
+1 位作者
解飞
刘钢
《情报科学》
CSSCI
北大核心
2006年第6期895-899,909,共6页
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以...
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。
展开更多
关键词
全文检索
搜索引擎
中文
分词
信息检索
下载PDF
职称材料
中文搜索引擎的比较研究
被引量:
6
20
作者
赵静萍
张友鹏
《图书与情报》
CSSCI
北大核心
2004年第6期78-82,共5页
通过对典型中文搜索引擎的比较分析 ,指出中文搜索引擎目前存在信息量不足、查询方式单一、采用技术落后、多媒体信息量不足、专题性中文搜索引擎较少和数据库更新不及时等问题 ,提出了中文搜索引擎的元搜索引擎、智能化检索和多媒体检...
通过对典型中文搜索引擎的比较分析 ,指出中文搜索引擎目前存在信息量不足、查询方式单一、采用技术落后、多媒体信息量不足、专题性中文搜索引擎较少和数据库更新不及时等问题 ,提出了中文搜索引擎的元搜索引擎、智能化检索和多媒体检索等发展趋势和发展对策。
展开更多
关键词
搜索引擎
中文
搜索引擎
信息检索
下载PDF
职称材料
题名
中文搜索引擎的机理及检索技巧
1
作者
龚自振
机构
深圳职业技术学院图书馆
出处
《情报探索》
2001年第2期30-32,共3页
文摘
主要介绍了中文搜索引擎的机理及国内几种常见的中文搜索引擎,从实践运用的角度阐述了 中文搜索引擎的检索技巧和方法,并指出了其存在的不足。
关键词
中文
搜索引擎
检索技巧
类型
中文excite搜索引擎
中文
雅虎
关键字
搜狐
查询工具
分类号
G250.73 [文化科学—图书馆学]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
搜索引擎Excite检索功能详述及评析
被引量:
5
2
作者
王智宇
机构
北京大学信息管理系
出处
《现代图书情报技术》
CSSCI
北大核心
2001年第6期30-32,37,共4页
文摘
表述的重点在于通过对搜索引擎 Excite工作原理的介绍及各个检索功能的分析 ,获得关于它的整体认识 。
关键词
excite
搜索引擎
概念检索
检索功能
简单检索
高级检索
精确检索
Keywords
excite
Search engine Intelligence concept search
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
中文文本WEB搜索引擎的设计与实现
被引量:
23
3
作者
钟涛
陈新明
万钧
张世永
机构
复旦大学网络信息工程中心
出处
《计算机工程与应用》
CSCD
北大核心
2001年第17期149-151,169,共4页
基金
上海市科学技术发展资金支持
文摘
文章主要研究中文文本WEB搜索引擎设计中面临的关键技术以及相应的设计实现。文章首先介绍了WEB搜索引擎的基本系统结构,然后具体讨论了设计时应考虑的问题并且给出了相应的实现。作者希望通过该文能为中文信息搜索引擎的发展提供一些有益的参考和经验。
关键词
搜索引擎
文本处理
信息检索
中文
分词
中文
文本
Web
Internet
Keywords
: Search Engine,Text Transact,Info Indexing,Chinese segment
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
中文搜索引擎中的中文信息处理技术
被引量:
35
4
作者
邹海山
吴勇
吴月珠
陈阵
机构
南京大学电子科学与工程系
出处
《计算机应用研究》
CSCD
2000年第12期21-24,共4页
文摘
就中文搜索引擎中的若干中文信息处理技术作了较深入地探讨,对诸如中文分词、中文码制转换和中文全半角处理等方面提出了较完整的解决方案。
关键词
中文
搜索引擎
中文
信息处理技术
中文
分词
码制转换
全半角处理
汉字编码
Internet
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文搜索引擎概念检索初探
被引量:
20
5
作者
李蕾
王楠
张剑
钟义信
郭祥昊
贾自燕
机构
北京邮电大学信息工程系
首都信息发展有限公司网络多媒体实验室
北京工业大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2000年第6期1-3,11,共4页
基金
国家863计划资助!863-306-ZZ01-99-1
文摘
搜索引擎传统的关键词匹配检索模式存在很多问题,概念检索是解决这些问题的关键技术之一。该文简要介绍了概念检索的主要内容,针对中文搜索引擎,探索出了一种基于概念语义网络知识库的概念检索模型。在此基础上,针对计算机这一特定领域,创建了一个含有500多个概念节点,包括概念层次关系和近300种概念相关关系的语义网络,初步实现了计算机领域文档的概念检索。实验结果表明,该模型对于提高中文搜索引擎的智能水平是非常有效的。
关键词
概念检索
中文
搜索引擎
信息检索
计算机
Keywords
search engine, concept-based retrieval, concept network
分类号
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
基于中文搜索引擎网络信息用户行为研究
被引量:
12
6
作者
王浩
姚长利
郭琳
艾国庆
机构
中国地质大学地下信息探测技术与仪器教育部重点实验室
西门子工厂自动化工程有限公司服务部
出处
《计算机应用研究》
CSCD
北大核心
2009年第12期4665-4668,共4页
基金
国家"863"计划资助项目(2007AA06Z134)
高等学校学科创新引智计划资助项目(B07011)
文摘
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行为的一些规律等。研究结果表明,对准确地评测搜索引擎检索的效果以及未来中文搜索引擎设计的改进都有较好的指导意义。
关键词
中文
搜索引擎
搜索
日志
用户
搜索
行为
网络用户
Keywords
Chinese search engine
search log
user search behavior
Web user
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种提高中文搜索引擎检索质量的HTML解析方法
被引量:
20
7
作者
宋睿华
马少平
陈刚
李景阳
机构
清华大学计算机科学与技术系
出处
《中文信息学报》
CSCD
北大核心
2003年第4期19-26,共8页
基金
国家重点基础研究资助项目 (973) (G19980 30 5 0 9)
自然科学基金资助项目 (6 0 2 2 30 0 4 )
86 3高科技资助项目 (2 0 0 1AA114 0 82 )
文摘
中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项 ,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说 ,想在检索或者后处理阶段解决这类问题不仅要付出一定代价 ,而且在大多数情况下是不可能的。在这篇论文中 ,我们提出了网页噪声的概念 ,并针对中文网页的特点 ,实现了一种对网页自动分块并去噪的HTML解析方法 ,从而达到在预处理阶段消除潜在无关项和间接项的目的。实验结果表明 ,该方法能够在不占用查询时间的前提下 10 0 %地消除中文搜索引擎隐藏的间接项 ,以及大约 11%的无法过滤或隐藏的无关项或间接项 ,从而大幅度提高检索结果的查准率。
关键词
中文
搜索引擎
检索质量
HTML解析方法
网页噪声
分块模型
网页去噪
中文
信息处理
Keywords
computer application
Chinese information processing
HTML parser
noise filtering
block model
search engine
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文搜索引擎现状与展望
被引量:
25
8
作者
都云程
卢献华
机构
北京信息工程学院中文信息研究处理中心
出处
《中文信息学报》
CSCD
北大核心
1999年第3期61-64,F003,共5页
文摘
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。
关键词
中文
搜索引擎
全文检索
中文
自动分词
搜索引擎
Keywords
Chinese search engineFull-text retrievalAutomatic words segmentationrelevance Ranking
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
中文搜索引擎的原理剖析及开发实现技术
被引量:
19
9
作者
李志蜀
李果
机构
四川大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2001年第11期96-99,共4页
文摘
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展 ,剖析了中文搜索引擎采用的核心技术—全文检索与中文分词技术 ,探讨了编程中应注意的问题和部分实现技术 。
关键词
中文
搜索引擎
中文
分词
信息查询
INTERNET
中文
信息处理
Keywords
Chinese Search Engine
Full Content Retrieval
Chinese Words Segmentation
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
支持智能中文分词的互联网搜索引擎的构建
被引量:
8
10
作者
曹羽中
曹勇刚
金茂忠
刘超
机构
北京航空航天大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2006年第23期4395-4398,4407,共5页
基金
国家863高技术研究发展计划基金项目(2004AA119030)
文摘
中文分词技术对中文搜索引擎的查准率及查全率有重大影响。在剖析开源搜索引擎Nutch的源代码结构的基础上,基于JavaCC实现了一个可扩展的词法分析器并将其与Nutch集成,构建了一个支持智能中文分词的互联网搜索引擎Nutch-Enhanced。它可用作评测各类中文分词算法对搜索引擎的影响的实验平台。对NutchEnhanced的搜索质量与Nutch、Google、百度进行了对比评测。结果表明它远优于Nutch,其查全率达到了0.74,前30个搜索结果的查准率达到了0.86,总体上具有与Google,百度接近的中文搜索质量。
关键词
中文
分词
分词算法
搜索引擎
词法分析器
检索精度
Keywords
Chinese word segmentation
word segmentation algorithm
search engine
lexical analyzer
precision
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文WWW搜索引擎比较研究
被引量:
24
11
作者
任瑞娟
李洪建
机构
河北大学图书馆
出处
《大学图书馆学报》
CSSCI
北大核心
1999年第5期55-57,61,共4页
文摘
通过上网实验测试了几种中文WWW 搜索引擎的检索功能,并分析实验数据得出结论,旨在对中文WWW 搜索引擎的建立和完善有所启示。
关键词
INTERNET
WWW
中文
搜索引擎
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
试析中文搜索引擎的评价标准
被引量:
34
12
作者
宛玲
杨秀丹
杜晓静
机构
河北大学信息管理系
出处
《情报科学》
CSSCI
2000年第1期28-31,38,共5页
文摘
搜索引擎是一种网络检索工具,本文主要针对中文搜索引擎评价标准进行探讨。笔者认为对它的检索功能的评价主要应从收录范围、查询结果反馈信息的质量、检索款目的信息量、查错率、更新与报道速度、查询功能、检索界面的友好性、精品推荐、与其它搜索引擎的友情链接、响应速度等多方面进行。
关键词
搜索引擎
评价标准
中文
信息检索
检索工具
Keywords
Search engine Evaluating standard Chinese Information retrieval
分类号
G354.4 [文化科学—情报学]
G354.2 [文化科学—情报学]
下载PDF
职称材料
题名
汉语分词对中文搜索引擎检索性能的影响
被引量:
6
13
作者
金澎
刘毅
王树梅
机构
乐山师范学院计算机科学系
南京理工大学计算机科学与技术系
出处
《情报学报》
CSSCI
北大核心
2006年第1期21-24,共4页
基金
四川省教育厅青年基金资助项目(项目编号:2003B035).
文摘
针对中文网页的特点。研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用啊页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,就各种分词算法对查全率和查准率的影响进行了实验比较,结果表明分词性能和检索性能没有正比关系。
关键词
汉语分词
信息检索
中文
搜索引擎
Keywords
Chinese word segmentation, information retrieval, Chinese search engine.
分类号
G354.4 [文化科学—情报学]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于字表的中文搜索引擎分词系统的设计与实现
被引量:
15
14
作者
丁承
邵志清
机构
华东理工大学计算机科学与工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第2期191-192,F003,共3页
文摘
分析了常用的基于词典的汉语分词方法应用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引、查询、排除歧义等方面进行了设计和实现。
关键词
字表
中文
搜索引擎
分词系统
设计
中文
信息处理
INTERNET
Keywords
Chinese;Search engines;Word segmentation;Character table;Query
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文智能搜索引擎现状探析
被引量:
12
15
作者
闫翔
陈远
机构
武汉大学信息管理学院
出处
《情报科学》
CSSCI
北大核心
2002年第12期1326-1328,共3页
文摘
随着 Internet的发展 ,传统的搜索引擎暴露出越来越多的弊病 ,导致智能搜索引擎的出现。而中文的特性也必然使中文智能搜索引擎具有其独特的一面。
关键词
搜索引擎
智能
搜索引擎
中文
智能
搜索引擎
网络信息检索
Keywords
Search engine Intellectual search engine Chinese intellectual search engine Web information search
分类号
G250.73 [文化科学—图书馆学]
G354 [文化科学—情报学]
下载PDF
职称材料
题名
中文搜索引擎分类体系的特点、问题及其改进
被引量:
21
16
作者
刘延章
谢琳惠
机构
郑州大学信息管理系
洛阳大学图书馆
出处
《郑州大学学报(哲学社会科学版)》
CSSCI
北大核心
2002年第6期146-148,共3页
文摘
中文搜索引擎分类体系具有实用性强、易用性好、多维性高等特点 ,但在归类、序类、划分、命名等方面也存在着严重问题 ,完善类目体系、科学编排同位类。
关键词
中文
搜索引擎
分类体系
互联网
Keywords
classification system
searching engine
Chinese language
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文分词算法在搜索引擎应用中的研究
被引量:
20
17
作者
欧振猛
余顺争
机构
中山大学电子系
出处
《计算机工程与应用》
CSCD
北大核心
2000年第8期80-82,84,共4页
文摘
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。
关键词
搜索引擎
中文
自动分词
算法
汉字信息处理
Keywords
Search Engine, Chinese Word Automatic Segmentation, Matching, Markoff process
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于全文搜索的中文搜索引擎设计技术
被引量:
10
18
作者
陈燕娜
邵志清
机构
华东理工大学信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2002年第17期196-198,共3页
基金
上海市青年科技启明星计划(编号:99QD14038)
文摘
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。
关键词
全文
搜索
中文
搜索引擎
设计
技术
WWW
中文
分词技术
文档相关性
Internet
Keywords
WWW,search engine,full-text retrieval,Chinese word segmentation,documental relativity
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
全文检索搜索引擎中文信息处理技术研究
被引量:
5
19
作者
唐培丽
胡明
解飞
刘钢
机构
长春工业大学计算机科学与工程学院
武警吉林省总队通信处
出处
《情报科学》
CSSCI
北大核心
2006年第6期895-899,909,共6页
文摘
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。
关键词
全文检索
搜索引擎
中文
分词
信息检索
Keywords
full - text retrieval
search engine
Chinese word segmentation
information retrieval
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
中文搜索引擎的比较研究
被引量:
6
20
作者
赵静萍
张友鹏
机构
西安文理学院图书馆
西安石油大学图书馆
出处
《图书与情报》
CSSCI
北大核心
2004年第6期78-82,共5页
文摘
通过对典型中文搜索引擎的比较分析 ,指出中文搜索引擎目前存在信息量不足、查询方式单一、采用技术落后、多媒体信息量不足、专题性中文搜索引擎较少和数据库更新不及时等问题 ,提出了中文搜索引擎的元搜索引擎、智能化检索和多媒体检索等发展趋势和发展对策。
关键词
搜索引擎
中文
搜索引擎
信息检索
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文搜索引擎的机理及检索技巧
龚自振
《情报探索》
2001
0
下载PDF
职称材料
2
搜索引擎Excite检索功能详述及评析
王智宇
《现代图书情报技术》
CSSCI
北大核心
2001
5
下载PDF
职称材料
3
中文文本WEB搜索引擎的设计与实现
钟涛
陈新明
万钧
张世永
《计算机工程与应用》
CSCD
北大核心
2001
23
下载PDF
职称材料
4
中文搜索引擎中的中文信息处理技术
邹海山
吴勇
吴月珠
陈阵
《计算机应用研究》
CSCD
2000
35
下载PDF
职称材料
5
中文搜索引擎概念检索初探
李蕾
王楠
张剑
钟义信
郭祥昊
贾自燕
《计算机工程与应用》
CSCD
北大核心
2000
20
下载PDF
职称材料
6
基于中文搜索引擎网络信息用户行为研究
王浩
姚长利
郭琳
艾国庆
《计算机应用研究》
CSCD
北大核心
2009
12
下载PDF
职称材料
7
一种提高中文搜索引擎检索质量的HTML解析方法
宋睿华
马少平
陈刚
李景阳
《中文信息学报》
CSCD
北大核心
2003
20
下载PDF
职称材料
8
中文搜索引擎现状与展望
都云程
卢献华
《中文信息学报》
CSCD
北大核心
1999
25
下载PDF
职称材料
9
中文搜索引擎的原理剖析及开发实现技术
李志蜀
李果
《计算机应用研究》
CSCD
北大核心
2001
19
下载PDF
职称材料
10
支持智能中文分词的互联网搜索引擎的构建
曹羽中
曹勇刚
金茂忠
刘超
《计算机工程与设计》
CSCD
北大核心
2006
8
下载PDF
职称材料
11
中文WWW搜索引擎比较研究
任瑞娟
李洪建
《大学图书馆学报》
CSSCI
北大核心
1999
24
下载PDF
职称材料
12
试析中文搜索引擎的评价标准
宛玲
杨秀丹
杜晓静
《情报科学》
CSSCI
2000
34
下载PDF
职称材料
13
汉语分词对中文搜索引擎检索性能的影响
金澎
刘毅
王树梅
《情报学报》
CSSCI
北大核心
2006
6
下载PDF
职称材料
14
基于字表的中文搜索引擎分词系统的设计与实现
丁承
邵志清
《计算机工程》
CAS
CSCD
北大核心
2001
15
下载PDF
职称材料
15
中文智能搜索引擎现状探析
闫翔
陈远
《情报科学》
CSSCI
北大核心
2002
12
下载PDF
职称材料
16
中文搜索引擎分类体系的特点、问题及其改进
刘延章
谢琳惠
《郑州大学学报(哲学社会科学版)》
CSSCI
北大核心
2002
21
下载PDF
职称材料
17
中文分词算法在搜索引擎应用中的研究
欧振猛
余顺争
《计算机工程与应用》
CSCD
北大核心
2000
20
下载PDF
职称材料
18
基于全文搜索的中文搜索引擎设计技术
陈燕娜
邵志清
《计算机工程与应用》
CSCD
北大核心
2002
10
下载PDF
职称材料
19
全文检索搜索引擎中文信息处理技术研究
唐培丽
胡明
解飞
刘钢
《情报科学》
CSSCI
北大核心
2006
5
下载PDF
职称材料
20
中文搜索引擎的比较研究
赵静萍
张友鹏
《图书与情报》
CSSCI
北大核心
2004
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
37
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部