期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
Nutch0.9中二分法中文分词的实现
下载PDF
职称材料
导出
摘要
Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询。Nutch0.9较好地处理了英文分词,但对中文分词处理还不够完善。文章介绍了在Nutch0.9中实现索引及检索的二分法,提出了改进中文分词的方法。
作者
刘高原
何伟娜
郑浩
刘觉夫
机构地区
平顶山学院
华东交通大学
出处
《计算机时代》
2009年第4期28-30,共3页
Computer Era
基金
江西省自然科学基金项目(0311046)
关键词
Nutch0.9
二分法
索引
检索
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
29
参考文献
4
共引文献
45
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
4
1
王莉云,王华,陈刚,姚乃明.
基于Lucene的全文检索系统的设计与实现[J]
.计算机工程与设计,2007,28(24):5959-5961.
被引量:14
2
王继明,杨国林.
基于Lucene的中文文本分词[J]
.内蒙古工业大学学报(自然科学版),2007,26(3):185-188.
被引量:11
3
胡涛,路红英.
基于Nutch的搜索引擎的研究[J]
.计算机时代,2007(1):57-59.
被引量:16
4
陈士杰,张玥杰.
基于Lucene的英汉跨语言信息检索[J]
.计算机工程,2005,31(13):62-64.
被引量:12
二级参考文献
29
1
胡俊华,杨波,李金屏.
自然语言理解研究略述[J]
.济南大学学报(社会科学版),2001,11(5):58-62.
被引量:8
2
曹倩,丁艳,王超,潘金贵.
汉语自动分词研究及其在信息检索中的应用[J]
.计算机应用研究,2004,21(5):71-74.
被引量:18
3
柯和平.
基于全文检索和流媒体技术的素材库设计建设[J]
.计算机工程与设计,2004,25(9):1466-1469.
被引量:8
4
张春霞,郝天永.
汉语自动分词的研究现状与困难[J]
.系统仿真学报,2005,17(1):138-143.
被引量:60
5
[1]李晓明,闰宏飞,王继民.搜索引擎-原理、技术与系统[M].科学出版社,2004.
6
[2]ERIK HATCHER、OTIS GOSPODNETIC.Lucene in Action[M],2005.
7
[3]FELIXJOACHIM.GettingNutchRunningWithWindows.http://wiki.apache.org/nutch/GettingNutchRunningWithWindows,2005.
8
[4]TOM WHITE.Introduction to Nutch.http://today.java.net/pub/a/today/2006/01/10/introduction -to -nutch-1.htnl,2006.
9
[5]李刚,宋伟,邱哲.Ajax+Lucene构建搜索引擎[M].人民邮电出版社,2006.
10
Foo S, Li Hui. Chinese Word Segmentation and Its Effect on Information Retrieval. Information Processing & Management, 2002.
共引文献
45
1
吴家道,赵乃良.
一种基于海量数据的智能信息检索系统实现[J]
.杭州电子科技大学学报(自然科学版),2007,27(5):127-130.
2
张晓卫,朱巧明.
一种基于Lucene的Web全文信息检索系统的设计与实现[J]
.计算机与现代化,2006(12):111-115.
被引量:6
3
缪融.
基于外文数据库的交叉语言信息检索系统的探讨[J]
.情报杂志,2007,26(3):118-120.
被引量:1
4
曹强.
基于Lucene的Web站点站内全文检索系统的设计与实现[J]
.图书情报工作,2007,51(9):124-126.
被引量:10
5
宋佳,诸云强,刘润达.
一种基于Lucene改进的全文检索工具包[J]
.计算机工程与应用,2008,44(4):172-175.
被引量:15
6
杨大全,王斓樾.
利用服务器日志优化搜索引擎[J]
.沈阳工业大学学报,2008,30(1):94-97.
7
徐飞,孙劲光.
中文分词切分技术研究[J]
.计算机工程与科学,2008,30(5):126-128.
被引量:16
8
朱毅华,郭卫兵.
基于本体的教学资源检索、导航平台的设计与实现[J]
.中国教育信息化(高教职教),2008(6):68-71.
被引量:2
9
匡振国,倪宏,嵇智辉,刘磊.
一种基于Lucene的影片搜索引擎的研究和应用[J]
.计算机工程与应用,2008,44(29):8-10.
被引量:3
10
李颖,李志蜀,邓欢.
基于Lucene的中文分词方法设计与实现[J]
.四川大学学报(自然科学版),2008,45(5):1095-1099.
被引量:13
1
刘洋.
Nutch0.9中二分法中文分词的实现[J]
.科技信息,2009(36):171-172.
2
屈培,葛蓁.
Nutch-0.8.1中二分法中文分词的实现[J]
.计算机时代,2007(7):9-11.
被引量:5
3
王一.
SEO优化策略在网站中的应用[J]
.信息系统工程,2015,0(6):36-36.
4
王玉芳,毛晓菊,桑健.
搜索引擎工作原理浅析[J]
.中国电子商务,2010(9):81-82.
5
王姣,徐海霞.
搜索引擎工作原理再探究[J]
.电脑知识与技术,2016,0(9):165-166.
被引量:3
6
曹强.
基于Lucene的Web站点站内全文检索系统的设计与实现[J]
.图书情报工作,2007,51(9):124-126.
被引量:10
7
古丽萍.
完善中的搜索引擎及其发展[J]
.北京电子,2004(7):45-48.
8
李国和,岳翔,吴卫江,洪云峰,刘智渊,程远.
面向文本分类的特征词选取方法研究与改进[J]
.中文信息学报,2015,29(4):120-125.
被引量:7
9
姚艳玲.
www网络信息资源检索工具——搜索引擎[J]
.现代情报,2003,23(9):106-107.
被引量:6
10
喻颖,王成国,邓仲元,蔡志平.
面向人才招聘的搜索引擎优化技术研究[J]
.计算机技术与发展,2014,24(8):35-38.
被引量:1
计算机时代
2009年 第4期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部