基于Lucene的中英文语言分析器的设计与实现被引量：1

Design and Implementation of Chinese and English Language Analyzer Based on Lucene

导出

摘要分析Lucene的语言分析器结构,针对其只能进行中文单字、双字切分的不足,采用基于词典的正向最大匹配分词算法,设计并实现基于Lucene的中英文语言分析器ZH_CNAnalyzer,实验结果表明其能够对中英文文档进行高效索引,满足实际应用的需要。 This paper introduces the structure of analysis in Lucene, designs and implements the chinese and english language ZH_ CNAnalyzer which uses forwards maximum match algorithm for the disadvantage of one - word and two - words segmentation. It can meet the needs of practical application that can index the documents consist of chinese and english words efficiently.

作者马凤娟吴鹏飞

机构地区石家庄经济学院人文与社科学院石家庄学院图书馆

出处《图书情报工作》 CSSCI 北大核心 2009年第15期118-121,共4页 Library and Information Service

关键词搜索引擎 LUCENE 中英文分词正向最大匹配算法语言分析器 search engine Lucene segmentation forwards maximum match algorithm ZH_CNAnalyzer

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1曹羽中,曹勇刚,金茂忠,刘超.支持智能中文分词的互联网搜索引擎的构建[J].计算机工程与设计,2006,27(23):4395-4398. 被引量：8
2The apache jakarta project : Lucene. [2008 - 09 - 10]. http ://jakarta. apache, org/lueene/.
3Gospodnetic O, Hatcher E. Lucene in action. Manning Publications Co. ,2005 : 10.
4向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
5王继明,杨国林.基于Lucene的中文文本分词[J].内蒙古工业大学学报（自然科学版）,2007,26(3):185-188. 被引量：11
6李庆虎,陈玉健,孙家广.一种中文分词词典新机制——双字哈希机制[J].中文信息学报,2003,17(4):13-18. 被引量：108
7李振星,徐泽平,唐卫清,唐荣锡.全二分最大匹配快速分词算法[J].计算机工程与应用,2002,38(11):106-109. 被引量：39
8Luke.[2008 - 12 - 10 ]. http ://www. getopt, org/luke/.

二级参考文献40

1胡俊华,杨波,李金屏.自然语言理解研究略述[J].济南大学学报（社会科学版）,2001,11(5):58-62. 被引量：8
2彭波.搜索引擎的混合索引技术[J].计算机工程与应用,2004,40(22):16-18. 被引量：6
3孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
4曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
5高琰,谷士文,谭立球,费耀平.基于Lucene的搜索引擎设计与实现[J].微机发展,2004,14(10):27-30. 被引量：23
6孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
7张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
8刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算机工程与应用,2006,42(3):175-177. 被引量：68
9吴胜远.一种汉语分词方法[J].计算机研究与发展,1996,33(4):306-311. 被引量：49
10张国煊.快速书面自动分词系统及其算法设计[J].计算机研究与发展,1993,1.

共引文献170

1段小斌,林雯,阮百尧,陈基漓.一种基于三级索引词库结构的中文分词方法研究[J].计算机与数字工程,2007,35(7):47-49. 被引量：5
2苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
3李丹宁,李丹,王保华,马新强.几种基于词典的中文分词算法评价[J].贵州科学,2008,26(3):1-8. 被引量：4
4刘高原,何伟娜,郑浩,刘觉夫.Nutch0.9中二分法中文分词的实现[J].计算机时代,2009(4):28-30.
5范戈,廖碧成.一种基于词义分析的短信问答系统的设计与实现[J].山东通信技术,2009,29(1):18-21.
6张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
7冯蜀茗,张小真,奚晓霞.支持CSCL中相关度监控的领域词典构建研究[J].西南师范大学学报（自然科学版）,2005,30(3):430-434. 被引量：1
8解析慧聪资讯有限公司的经营策略[J].人才资源开发,2005(8):39-40.
9于源,衣袭.中文全切分快速分词方法[J].大连铁道学院学报,2005,26(2):84-85. 被引量：4
10费洪晓,胡海苗,巩燕玲.基于Hash结构的机械统计分词系统研究[J].计算机工程与应用,2006,42(5):159-161. 被引量：8

同被引文献5

1郎小伟,王申康.基于Lucene的全文检索系统研究与开发[J].计算机工程,2006,32(4):94-96. 被引量：68
2管建和,甘剑峰.基于Lucene全文检索引擎的应用研究与实现[J].计算机工程与设计,2007,28(2):489-491. 被引量：71
3(Otis Gospodnetic Erik Hatcher, Lucene in Action:(中文版)[M].北京:电子工业出版社,2007,7.
4吴代文.基于Lucene全文检索应用研究[J].微计算机应用,2011,32(2):62-65. 被引量：2
5赵珂,逯鹏,李永强.基于Lucene的搜索引擎设计与实现[J].计算机工程,2011,37(16):39-41. 被引量：26

引证文献1

1葛彦强,汪向征,栗青生,宋世桢.基于Lucene的甲骨文全文检索系统构建[J].科技通报,2012,28(4):72-74. 被引量：3

二级引证文献3

1李小涛,胡晓惠,郭晓利,卢卫娜.基于元数据的复杂信息共享技术[J].系统工程与电子技术,2015,37(3):700-706. 被引量：9
2王鸣涛,刘永革.甲骨文研究的机构、作者、热点及前沿分析——基于CiteSpace可视化研究[J].漯河职业技术学院学报,2022,21(2):1-11. 被引量：1
3梁武,苏燕.基于改进互信息函数的文本分类方法研究[J].科技通报,2018,0(11):188-191. 被引量：1

1向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
2吴鹏飞,马凤娟,李文革,郭鹏.开源全文检索引擎Lucene本地化实践研究[J].现代图书情报技术,2009(4):19-22. 被引量：8
3张港."三国"人缘何都是单字名[J].知识窗（教师版）,2001(2).
4热情严谨的李老师[J].少年时代（低年级）,2009(5):44-44.
5白如星,张成昱,王茜.基于缩略语转换的手机图书馆发布信息预处理机制初探[J].现代图书情报技术,2010(3):64-70. 被引量：1
6陈光祚.论单汉字检索系统[J].情报学报,1992,11(1):11-18. 被引量：11
7王逍姚.宁波“湿”报[J].小学生（多元智能大王）,2006(12):41-41.
8张春博,丁堃,刘盛博.科学基金项目视角下的我国图书馆、情报、文献与档案管理学的进展窥探[J].图书馆建设,2014(5):1-5. 被引量：19
9内藤荣介,上田休一,中本秀四郎,杨玉麟.日本文献工作标准化述评[J].现代图书情报技术,1985(3):38-43. 被引量：1
10周锐.大个子老鼠小个子猫[J].学苑创造（A版）,2014,0(5):32-34.

图书情报工作

2009年第15期

浏览历史

内容加载中请稍等...

基于Lucene的中英文语言分析器的设计与实现被引量：1

参考文献8

二级参考文献40

共引文献170

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Lucene的中英文语言分析器的设计与实现 被引量：1

参考文献8

二级参考文献40

共引文献170

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Lucene的中英文语言分析器的设计与实现被引量：1