期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
中文分词技术及JE中文分词器在Nutch中的运用与实现
被引量:
1
下载PDF
职称材料
导出
摘要
阐述中文分词技术,分析对比Lucene自带的分析器,针对JE中文分词器进行研究,并将JE中文分词器在Nutch中加以运用并改进,实现Nutch的中文分词。
作者
陶荣
机构地区
广西工商职业技术学院
出处
《广西教育》
2013年第7期184-186,共3页
关键词
中文分词技术
NUTCH
搜索引擎
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
27
参考文献
4
共引文献
44
同被引文献
9
引证文献
1
二级引证文献
0
参考文献
4
1
刘汉兴,刘财兴.
主题爬虫的搜索策略研究[J]
.计算机工程与设计,2008,29(12):3160-3162.
被引量:26
2
蔡小艳,寇应展,沈巍,郑伟.
Nutch-0.9中JE中文分词的实现[J]
.科学技术与工程,2008,8(17):4881-4884.
被引量:5
3
付光.
面向招聘信息主题搜索引擎的研究与设计[J]
.广西教育,2011(18):123-125.
被引量:1
4
胡涛,路红英.
基于Nutch的搜索引擎的研究[J]
.计算机时代,2007(1):57-59.
被引量:16
二级参考文献
27
1
郑冬冬,赵朋朋,崔志明.
Deep Web爬虫研究与设计[J]
.清华大学学报(自然科学版),2005,45(S1):1896-1902.
被引量:28
2
赵丰年,刘林,商建云.
基于概念的文本过滤模型[J]
.计算机工程与应用,2006,42(4):186-188.
被引量:11
3
林海霞,原福永,陈金森,刘俊峰.
一种改进的主题网络蜘蛛搜索算法[J]
.计算机工程与应用,2007,43(10):174-176.
被引量:18
4
曹建芳,王鸿斌.
基于SVM和统计的搜索引擎的设计[J]
.计算机工程与设计,2007,28(9):2138-2141.
被引量:2
5
屈培,葛蓁.
Nutch-0.8.1中二分法中文分词的实现[J]
.计算机时代,2007(7):9-11.
被引量:5
6
[1]李晓明,闰宏飞,王继民.搜索引擎-原理、技术与系统[M].科学出版社,2004.
7
[2]ERIK HATCHER、OTIS GOSPODNETIC.Lucene in Action[M],2005.
8
[3]FELIXJOACHIM.GettingNutchRunningWithWindows.http://wiki.apache.org/nutch/GettingNutchRunningWithWindows,2005.
9
[4]TOM WHITE.Introduction to Nutch.http://today.java.net/pub/a/today/2006/01/10/introduction -to -nutch-1.htnl,2006.
10
[5]李刚,宋伟,邱哲.Ajax+Lucene构建搜索引擎[M].人民邮电出版社,2006.
共引文献
44
1
刘高原,何伟娜,郑浩,刘觉夫.
Nutch0.9中二分法中文分词的实现[J]
.计算机时代,2009(4):28-30.
2
王芳,陈海建.
深入解析Web主题爬虫的关键性原理[J]
.微型电脑应用,2011(7):32-34.
被引量:8
3
杨大全,王斓樾.
利用服务器日志优化搜索引擎[J]
.沈阳工业大学学报,2008,30(1):94-97.
4
徐飞,孙劲光.
中文分词切分技术研究[J]
.计算机工程与科学,2008,30(5):126-128.
被引量:16
5
朱毅华,郭卫兵.
基于本体的教学资源检索、导航平台的设计与实现[J]
.中国教育信息化(高教职教),2008(6):68-71.
被引量:2
6
夏小云,吴为波.
AJAX技术的搜索引擎优化问题研究[J]
.江西理工大学学报,2008,29(5):79-82.
被引量:2
7
周鹏,吴华瑞,赵春江,杨宝祝,朱华吉.
基于Nutch农业搜索引擎的研究与设计[J]
.计算机工程与设计,2009,30(3):610-612.
被引量:15
8
顾珺.
基于Nutch的用户行为分析搜索引擎的实现[J]
.科技资讯,2009,7(15):20-20.
被引量:1
9
陈建锋.
Nutch的中文问题研究[J]
.现代计算机,2009,15(7):60-62.
被引量:2
10
张福泉.
人工智能在主题搜索策略中的应用[J]
.重庆科技学院学报(自然科学版),2009,11(4):148-151.
被引量:1
同被引文献
9
1
岳金媛,徐金安,张玉洁.
面向专利文献的汉语分词技术研究[J]
.北京大学学报(自然科学版),2013,49(1):159-164.
被引量:16
2
崔建明,刘建明,廖周宇.
基于SVM算法的文本分类技术研究[J]
.计算机仿真,2013,30(2):299-302.
被引量:83
3
李廷辰,杨艳.
基于分词聚类技术的微博热点问题挖掘[J]
.教学与科技,2013(1):8-13.
被引量:1
4
刘畅,张猛.
中文全文检索系统中基于分词技术的研究[J]
.吉林大学学报(信息科学版),2013,31(3):320-323.
被引量:1
5
卢玲,杨武,唐继强.
伪相关反馈的文本情感分类方法[J]
.计算机仿真,2013,30(11):268-271.
被引量:1
6
蔡荣彦.
面向未登录领域词切分的中文分词技术研究[J]
.信息系统工程,2013,26(11):133-136.
被引量:1
7
吴晓倩,胡学钢.
基于N-最短路径的中文分词技术研究[J]
.安徽理工大学学报(自然科学版),2014,34(1):72-75.
被引量:5
8
孙萌,华却才让,才智杰,姜文斌,吕雅娟,刘群.
基于判别式分类和重排序技术的藏文分词[J]
.中文信息学报,2014,28(2):61-65.
被引量:9
9
孟丽,李葆青,胡玲芳,张跃.
中文分词技术在社会化媒体分析中的应用[J]
.中国教育技术装备,2014(16):50-53.
被引量:2
引证文献
1
1
杨小梅,黎斌.
网络复杂文本的分类优化过程仿真分析[J]
.计算机仿真,2016,33(4):399-402.
1
王巧玲,彭静,王春红.
中文分词技术的研究及在Nutch中的实现[J]
.科技信息,2011(19).
被引量:3
2
打开PHP页面总是变为下载[J]
.电脑爱好者(普及版),2010(6):94-94.
3
余战秋.
中文分词技术及其应用初探[J]
.电脑知识与技术(认证考试),2004(11M):81-83.
被引量:11
4
刘宁.
中文分词技术在搜索引擎中的应用[J]
.商情,2010(23):157-157.
5
徐晓.
智能答疑系统的设计与研究[J]
.微型机与应用,2014,33(5):8-10.
被引量:3
6
顾爱华,赵泉,周塔,彭昱静,卫丽,徐莹莹,邹盛荣.
中文分词技术在搜索引擎中的探讨[J]
.科技信息,2009(35):46-46.
7
上网冲浪[J]
.计算机应用文摘,2009(36):18-18.
8
周满英.
百度和谷歌的中文分词技术浅析[J]
.中国索引,2011,9(2):44-46.
被引量:4
9
张家勇,刘建辉.
基于中文分词技术的信息智能过滤系统[J]
.信息技术,2006,30(12):175-178.
被引量:3
10
张锦炘.
基于Nutch的中文搜索引擎的构建[J]
.图书馆研究与工作,2009(1):54-57.
被引量:3
广西教育
2013年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部