期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于Nutch的中文搜索引擎的研究与实现
被引量:
3
下载PDF
职称材料
导出
摘要
重点讨论了搜索引擎原理及基于Nutch的搜索引擎的实现架构,同时对网页抓取过程作了深入的研究和分析。最后,给出了基于Nutch的中文搜索引擎的解决方案。
作者
王仕仲
宁龙兵
机构地区
湖南邵阳广播电视大学
邵阳工业学校
出处
《电脑开发与应用》
2009年第7期76-76,79,共2页
Computer Development & Applications
关键词
搜索引擎
抓取器
NUTCH
中文分词
分类号
TP393 [自动化与计算机技术—计算机应用技术]
U693 [交通运输工程—港口、海岸及近海工程]
引文网络
相关文献
节点文献
二级参考文献
10
参考文献
3
共引文献
23
同被引文献
13
引证文献
3
二级引证文献
15
参考文献
3
1
.中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/develst/,2003—1.
2
李志蜀,李果.
中文搜索引擎的原理剖析及开发实现技术[J]
.计算机应用研究,2001,18(11):96-99.
被引量:19
3
李伟超,王兰敬.
论搜索引擎的工作机制和发展趋势[J]
.现代情报,2002,22(12):107-108.
被引量:5
二级参考文献
10
1
http://www.altavista.com[EB]
2
http://www.baidu.com[EB]
3
http://www.google.com[EB]
4
揭春雨,刘源,梁南元.
论汉语自动分词方法[J]
.中文信息学报,1989,3(1):1-9.
被引量:55
5
章琳,张保明.
WWW检索工具比较研究[J]
.情报学报,1998,17(4):273-280.
被引量:43
6
徐建华.
网络搜索引擎原理、特性分析及未来发展趋势[J]
.图书情报工作,2000,44(8):34-38.
被引量:30
7
黄海.
中文搜索引擎核心技术之争[J]
.图书馆杂志,2001,20(3):27-29.
被引量:12
8
徐亚先.
搜索引擎功能概述与研究热点[J]
.情报科学,2001,19(3):269-270.
被引量:19
9
蔡栋.
第二代搜索引擎模式探析[J]
.情报理论与实践,2001,24(3):223-225.
被引量:19
10
唐铭杰.
论搜索引擎的发展概况及发展趋势[J]
.情报杂志,2001,20(5):70-71.
被引量:12
共引文献
23
1
柳婷.
网络蜘蛛的简单设计与研究[J]
.大众商务,2010(16):189-189.
2
王小云.
基于知识服务过程中的分类研究[J]
.现代情报,2004,24(7):187-189.
被引量:1
3
王林.
搜索引擎的原理和发展[J]
.图书馆理论与实践,2004(4):37-38.
被引量:17
4
吴小竹.
基于JAVA的多线程SPIDER的设计与实现[J]
.福建电脑,2004,20(6):62-63.
被引量:1
5
王曙光,张莉,张春元.
中文搜索引擎的原理与改进策略[J]
.福建电脑,2004,20(11):12-13.
6
姜杰,杨晓江.
专业搜索引擎分布式Robot的设计研究[J]
.中国电化教育,2005(6):95-97.
被引量:4
7
姜杰.
分布式Robot系统结构设计[J]
.福建电脑,2005,21(12):77-79.
8
刘琛.
论大众媒介语言的全球化对民族语言的冲击和影响[J]
.河北大学学报(哲学社会科学版),2006,31(1):80-83.
被引量:10
9
袁方,苑俊英.
基于类别核心词的朴素贝叶斯中文文本分类[J]
.山东大学学报(理学版),2006,41(3):111-114.
被引量:12
10
孙静,赵恒永.
搜索引擎网页快照的实现与安全[J]
.中国科技信息,2007(11):138-139.
被引量:2
同被引文献
13
1
高飞,刘云.
Nutch中文分词方法的实现[J]
.网络安全技术与应用,2008(9):71-72.
被引量:2
2
于满泉,陈铁睿,许洪波.
基于分块的网页信息解析器的研究与设计[J]
.计算机应用,2005,25(4):974-976.
被引量:55
3
赵文才.Nutch插件系统浅析[EB/OL].http://www.ibm.com/developerworks/cn/java/j-lo-nutchplugin/?S_TACT=105AGX52&S_CMP=tec-csdn.
4
Page L,Brin S,Motwani R,et al.The PageRank Citation Ranking:Bringing Order to the Web.Standford Digital Library Technologies Project[EB/OL].[1998].http://www-db.stanford.edu/~backrub/pageranksub.ps.
5
吴宝贵,丁振国.
基于Map/Reduce的分布式搜索引擎研究[J]
.现代图书情报技术,2007(8):52-55.
被引量:9
6
李军,黄海宽,曹琦.
基于支持向量机的中药工艺参数优化研究[J]
.计算机工程与应用,2007,43(36):205-207.
被引量:8
7
申晋.
基于Lucene和Nutch的林业垂直搜索引擎的研建[J]
.农业网络信息,2008(4):16-18.
被引量:7
8
李莉,魏进民.
生物医学搜索引擎检索研究[J]
.科技情报开发与经济,2008,18(30):44-45.
被引量:2
9
张锦炘.
基于Nutch的中文搜索引擎的构建[J]
.图书馆研究与工作,2009(1):54-57.
被引量:3
10
徐健,张智雄.
基于Nutch的Web网站定向采集系统[J]
.现代图书情报技术,2009(4):1-6.
被引量:10
引证文献
3
1
王小磊,李立,赵东升.
利用Nutch设计实现生物医学信息垂直搜索引擎[J]
.北京生物医学工程,2010,29(6):638-640.
2
邵秀丽,刘彬,张涛.
基于Nutch的垂直搜索引擎的设计和实现[J]
.计算机工程与设计,2011,32(2):539-542.
被引量:15
3
刘兴邦,赵晓娇.
基于Nutch的物流信息平台网页资源定向采集系统[J]
.物流技术,2012,31(7):367-371.
被引量:1
二级引证文献
15
1
郭晓霞,王磊,席岩,王晓艳,汪瑛.
基于网络的视频内容检索与盗版追踪溯源研究[J]
.广播与电视技术,2011,38(7):60-60.
被引量:2
2
陈建峡,李倩倩,王春枝.
基于Nutch搜索引擎的E-learning系统开发[J]
.湖北工业大学学报,2011,26(5):73-77.
3
王燕平.
基于文献计量的我国搜索引擎研究现状和热点分析[J]
.现代情报,2012,32(7):68-73.
被引量:5
4
陈诚.
基于云计算的智慧城市垂直搜索技术研究[J]
.软件产业与工程,2012(4):24-30.
5
刘兴邦,赵晓娇.
基于Nutch的物流信息平台网页资源定向采集系统[J]
.物流技术,2012,31(7):367-371.
被引量:1
6
王果,戴冬.
基于双向热点跟踪的搜索引擎优化模型[J]
.计算机应用与软件,2013,30(2):144-147.
被引量:3
7
赵鸿萍,蒋宏民.
面向新药研发的垂直搜索引擎研究与设计[J]
.医学信息学杂志,2013,34(10):38-42.
被引量:1
8
王孟頔,邰泳,薛安荣.
基于Hadoop平台的人才发现与推荐系统研究[J]
.软件导刊,2014,13(1):4-6.
被引量:5
9
郭俊军,孟繁疆,张喜海,魏紫京.
大豆主题网页资源采集系统的研究[J]
.农机化研究,2014,36(3):182-185.
被引量:1
10
刘琳.
基于Nutch的医学信息搜索引擎研究与实现[J]
.软件导刊,2014,13(6):21-22.
1
芋芊.
轻松下载被深藏的网络资源[J]
.电脑迷,2006,0(8):92-92.
2
Flash“抓取器”[J]
.网管员世界,2012(14):120-120.
3
叶鹏.
HTTP网址抓取器[J]
.互联网天地,2006(6):34-34.
4
杜旭升.
基于Nutch的搜索引擎的研究[J]
.电子技术与软件工程,2016(6):70-70.
5
贾秀杰.
多功能全自动抓取器的应用[J]
.新技术新工艺,1999(4):18-18.
被引量:2
6
高伟.
双剑合璧 取尽受限下载网站的文件[J]
.电脑迷,2006,0(10):91-91.
7
贺拴运.
隐形文字别多情[J]
.电脑迷,2008,0(6):76-76.
8
胡涛,路红英.
基于Nutch的搜索引擎的研究[J]
.计算机时代,2007(1):57-59.
被引量:16
9
程森,付红阁.
基于Nutch的搜索引擎与HBase的结合 在大数据时代的应用探究[J]
.计算机光盘软件与应用,2014,17(12):59-59.
10
陈艳春,李双平.
基于Lucene的企业级搜索引擎的设计与实现[J]
.现代图书情报技术,2007(8):63-66.
被引量:3
电脑开发与应用
2009年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部