开源全文检索引擎Lucene本地化实践研究被引量：8

Localization of the Open Source Full-text Retrival Engine Based on Lucene

下载PDF

导出

摘要对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。 This paper introduces the system architecture, indexing and retrieval process, and language analyzer of Lucene. According to the disadvantage of Lueene that it can only make one - word and two - word segmentation, this paper develops a Chinese - English language analyzer -- ZH_CNAnalyzer. At last, an indexing and retrieval example of ZH_ CNAnalyzer is given.

作者吴鹏飞马凤娟李文革郭鹏

机构地区石家庄学院图书馆石家庄经济学院人文与社科学院

出处《现代图书情报技术》 CSSCI 北大核心 2009年第4期19-22,共4页 New Technology of Library and Information Service

基金石家庄学院社会科学重点基金项目"面向学科服务的Web多媒体智能搜索平台"(项目编号:2007032)的研究成果之一

关键词全文检索 Lucene语言分析器数字图书馆开源 Full- text retrival Lucene ZH_CNAnalyzer Digital library Open source

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1The Apache Jakarta Project : Lucene [ EB/OL ]. [ 2008 - 09 - 10 ]. http ://jakarta. apache. org/lucene/.
2Gospodnetlc O, Hatcher E. Lucene in Action [ M ]. Manning Publications Co. ,2005 : 10.
3向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
4王继明,杨国林.基于Lucene的中文文本分词[J].内蒙古工业大学学报（自然科学版）,2007,26(3):185-188. 被引量：11
5李庆虎,陈玉健,孙家广.一种中文分词词典新机制——双字哈希机制[J].中文信息学报,2003,17(4):13-18. 被引量：107
6李振星,徐泽平,唐卫清,唐荣锡.全二分最大匹配快速分词算法[J].计算机工程与应用,2002,38(11):106-109. 被引量：39
7Luke [ E B/OL ]. [ 2008 - 12 - 10]. http ://www. getopt. org/luke/.

二级参考文献28

1胡俊华,杨波,李金屏.自然语言理解研究略述[J].济南大学学报（社会科学版）,2001,11(5):58-62. 被引量：8
2孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
3曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
4高琰,谷士文,谭立球,费耀平.基于Lucene的搜索引擎设计与实现[J].微机发展,2004,14(10):27-30. 被引量：23
5张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
6刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算机工程与应用,2006,42(3):175-177. 被引量：67
7吴胜远.一种汉语分词方法[J].计算机研究与发展,1996,33(4):306-311. 被引量：49
8张国煊.快速书面自动分词系统及其算法设计[J].计算机研究与发展,1993,1.
9夏征农.辞海缩印本[M].上海辞书出版社,1989..
10刘源.信息处理用现代汉词分词规范及自动分词方法[M].清华大学出版社,1992..

共引文献162

1段小斌,林雯,阮百尧,陈基漓.一种基于三级索引词库结构的中文分词方法研究[J].计算机与数字工程,2007,35(7):47-49. 被引量：5
2苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
3李丹宁,李丹,王保华,马新强.几种基于词典的中文分词算法评价[J].贵州科学,2008,26(3):1-8. 被引量：4
4刘高原,何伟娜,郑浩,刘觉夫.Nutch0.9中二分法中文分词的实现[J].计算机时代,2009(4):28-30.
5范戈,廖碧成.一种基于词义分析的短信问答系统的设计与实现[J].山东通信技术,2009,29(1):18-21.
6张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
7冯蜀茗,张小真,奚晓霞.支持CSCL中相关度监控的领域词典构建研究[J].西南师范大学学报（自然科学版）,2005,30(3):430-434. 被引量：1
8解析慧聪资讯有限公司的经营策略[J].人才资源开发,2005(8):39-40.
9于源,衣袭.中文全切分快速分词方法[J].大连铁道学院学报,2005,26(2):84-85. 被引量：4
10费洪晓,胡海苗,巩燕玲.基于Hash结构的机械统计分词系统研究[J].计算机工程与应用,2006,42(5):159-161. 被引量：8

同被引文献57

1张雪英,闾国年.基于字面相似度的地理信息分类体系自动转换方法[J].遥感学报,2008,12(3):433-441. 被引量：15
2谢丽聪,俞建家,张莹.布尔查询的改写算法[J].福州大学学报（自然科学版）,2004,32(4):457-461. 被引量：1
3张校乾,金玉玲,侯丽波.一种基于Lucene检索引擎的全文数据库的研究与实现[J].现代图书情报技术,2005(2):40-43. 被引量：30
4李淑芬,谢亮.国内联合虚拟参考咨询系统的比较分析[J].图书馆建设,2005(3):74-76. 被引量：30
5金毅,黄敏,林皓明,郭晶.CALIS分布式联合虚拟参考咨询系统的开发[J].大学图书馆学报,2005,23(3):30-33. 被引量：60
6王秀坤,李政,简幼良,刘剑.基于Hash方法的机器翻译词典的组织与构造[J].大连理工大学学报,1996,36(3):352-355. 被引量：12
7郎小伟,王申康.基于Lucene的全文检索系统研究与开发[J].计算机工程,2006,32(4):94-96. 被引量：68
8李江波,周强,陈祖舜.汉语词典的快速查询算法研究[J].中文信息学报,2006,20(5):31-39. 被引量：24
9宋明亮.汉语词汇字面相似性原理与后控制词表动态维护研究[J].情报学报,1996,15(4):261-271. 被引量：19
10潘以锋.基于Lucene的网站全文检索系统的开发[J].广西教育学院学报,2006(5):63-66. 被引量：7

引证文献8

1李文江,陈诗琴.基于Lucene.net全文检索在文档管理中的应用[J].现代图书情报技术,2010(11):84-89. 被引量：5
2刘博卿.基于军事的主题搜索引擎研究[J].福建电脑,2011,27(9):57-58.
3吴鹏飞.基于Swing和Lucene的桌面搜索引擎系统设计与实现[J].电脑编程技巧与维护,2012(1):32-34.
4吴鹏飞.基于开源框架SSHL图书馆联合虚拟参考咨询平台研究[J].现代情报,2012,32(1):67-69. 被引量：1
5俞枫,李洁华.金融信息服务系统技术框架研究[J].计算机系统应用,2014,23(7):201-205. 被引量：2
6岳绍敏,李万龙,王璐,光顺利.基于Lucene索引的数据库全文检索[J].吉林大学学报（理学版）,2014,52(5):995-1000. 被引量：5
7叶鹏,张雪英,杜咪.顾及字符特征的中文地名词典查询方法[J].地球信息科学学报,2018,20(7):880-886. 被引量：5
8赵广.Lucene架构下布尔查询的执行计划研究[J].云南民族大学学报（自然科学版）,2019,28(6):606-611. 被引量：1

二级引证文献19

1罗涛,朱莹.图书馆MSN咨询机器人的研究与实现[J].图书情报工作,2012,56(19):105-108. 被引量：16
2李文江,陈诗琴.AIMLBot智能机器人在实时虚拟参考咨询中的应用[J].现代图书情报技术,2012(7):127-132. 被引量：26
3郭年琴,曹建坤.基于Lucene.net的有色冶金信息化服务平台文献检索系统的研究与实现[J].江西理工大学学报,2013,34(1):84-89.
4刘洪秋.近三年国内合作数字参考咨询研究进展[J].农业图书情报学刊,2014,26(1):112-115. 被引量：3
5李光敏.文献搜索引擎中特征项及权重的应用[J].计算机系统应用,2014,23(5):188-191. 被引量：2
6罗涛.图书馆微信公众平台的建设与研究[J].现代图书情报技术,2015(1):96-100. 被引量：30
7郑益.混合型数据管理引擎在金融信息服务系统中的应用[J].计算机时代,2015(11):36-39.
8李全,林松,田俊,刘兴红.面向MOOC的垂直搜索引擎[J].计算机与现代化,2017(4):32-37. 被引量：1
9尚云飞,党倩,孙沛,金铭,宋芳.基于集中应用架构的数字档案馆系统设计与实现[J].电力信息与通信技术,2017,15(7):75-80.
10于超,王璐,程道文.基于本体的教育资源语义检索系统研究[J].吉林大学学报（信息科学版）,2018,36(2):207-212. 被引量：34

1马凤娟,吴鹏飞.基于Lucene的中英文语言分析器的设计与实现[J].图书情报工作,2009,53(15):118-121. 被引量：1
2张港."三国"人缘何都是单字名[J].知识窗（教师版）,2001(2).
3热情严谨的李老师[J].少年时代（低年级）,2009(5):44-44.
4向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
5王泽贤.Lucene中文分析器在书目搜索应用中的比较研究[J].现代情报,2014,34(4):132-136. 被引量：3
6陈光祚.论单汉字检索系统[J].情报学报,1992,11(1):11-18. 被引量：11
7王弘蔚,肖诗斌.一种基于Native XML的全文检索引擎[J].情报学报,2003,22(5):550-556. 被引量：6
8郭俐.导读笔[J].科学启蒙,2004(8):18-18.
9王逍姚.宁波“湿”报[J].小学生（多元智能大王）,2006(12):41-41.
10内藤荣介,上田休一,中本秀四郎,杨玉麟.日本文献工作标准化述评[J].现代图书情报技术,1985(3):38-43. 被引量：1

现代图书情报技术

2009年第4期

浏览历史

内容加载中请稍等...

开源全文检索引擎Lucene本地化实践研究被引量：8

参考文献7

二级参考文献28

共引文献162

同被引文献57

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

开源全文检索引擎Lucene本地化实践研究 被引量：8

参考文献7

二级参考文献28

共引文献162

同被引文献57

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

开源全文检索引擎Lucene本地化实践研究被引量：8