基于Lucene的校园网全文检索系统的研究
摘要
本文通过分析校园网网站信息的特点,采用Nutch网络爬虫和Lucene技术构建一个校园网全文检索系统,解决了中文分词等问题,提高了用户搜索的效率。
出处
《科技信息》
2011年第32期I0122-I0122,共1页
Science & Technology Information
参考文献8
-
1Hadoop MapReduce [EB/OL]. [2010-03-21].http://wiki.apache. org/Hadoop/HadoopMapReduce.
-
2Cutting D. "Map'Reduce in Nutch [EB/OL]. [2010-03-21].http: / Iwww.hadoop.org.cn/mapreduce/nutch-mapreduce.
-
3Hbase. Big*able-like structured storage for Hadoop HDFS IEB/ OL1.[ 2010-03-21 ].http://wiki.apache.org/hadoop/Hbase.ZHAN.
-
4Otis Gospodneti,Erik Hatcher.Lucene in Action 中文版[M].北京:电子工业出版社,2007.
-
5邱哲,符滔滔发自己的搜索引擎[M].北京:人民邮电出版社,2007.
-
6马志强,周长胜,丁维,杨娜.校园网搜索引擎的研究与实现[J].北京机械工业学院学报,2007,22(1):12-15. 被引量:12
-
7李粤,安捷,李星.排序融合算法在校园网搜索引擎中的应用[J].大连理工大学学报,2005,45(z1):257-260. 被引量:2
-
8蔡建超,郭一平,王亮.基于Lucene.Net校园网搜索引擎的设计与实现[J].计算机技术与发展,2006,16(11):73-75. 被引量:14
二级参考文献19
-
1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量:198
-
2孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量:101
-
3张校乾,金玉玲,侯丽波.一种基于Lucene检索引擎的全文数据库的研究与实现[J].现代图书情报技术,2005(2):40-43. 被引量:30
-
4[1]RENDA M E, STRACCIA U. Web Metasearch: Rank vs. score based rank aggregation methods[A]. Proc of the 2003 ACM symposium on Applied computing[C]. Melbourne: ACM Press, 2003:841 -846.
-
5[2]DING C, HE X F, HUSBANDS P, et al. Rank aggregation methods for the web[A]. Proceedings of the 10th International World Wide Web Conference[C]. Hong Kong: ACM Press, 2001:613-622.
-
6[3]FAGIN R, KUMAR R, McCURLEY K, et al. Searching the workplace web[A]. Proceedings of the Twelfth International Conference on World Wide Web[C]. Hungary , Budapest: ACM Press, 2003:366-375.
-
7[4]YOUNG H P , LEVENGLICK A. A Consistent extension of condorcet's election principle[J]. SIAM Journal of Applied Mathematics, 1978, 35: 285-300.
-
8[5]BARTHOLDI J J, TOVEY C A, TRICK M A. Voting schemes for which it can be difficult to tell who won the election[J]. Social Choice and Welfare, 1989, 6(2):157-165.
-
9[6]LANGVILLE A N, MEYER C D. Deeper inside PageRank[J]. Internet Mathematics, 2004, 1(3): 335-400.
-
10[7]KRAAIJ W, WESTERVELD T, HIEMSTRA D. The importance of prior probabilities for entry page search[A]. Proc 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C]. Tampere: ACM Press, 2002: 27-34.
共引文献22
-
1马志强,刘利民,苏依拉,马瑞明.基于Lucene的站内搜索引擎研究[J].内蒙古工业大学学报(自然科学版),2009,28(1):52-57. 被引量:7
-
2孙素芬,罗长寿,张峻峰,于峰,张树亮.农业信息资源整合系统研究与应用[J].安徽农业科学,2007,35(22):6993-6994. 被引量:3
-
3马志强.一种给批量汉字加注带有声调拼音的方法[J].微电子学与计算机,2008,25(4):185-187. 被引量:4
-
4陈烨彬,黄琳.基于Lucene.Net的知识检索系统的设计与实现[J].现代计算机,2008,14(11):124-125. 被引量:3
-
5马志强,赵汐,贾鹏.基于网页的站内信息采集技术的研究与实现[J].内蒙古大学学报(自然科学版),2009,40(2):203-207. 被引量:1
-
6谭文堂,贺明科,李阜.基于Lucene.Net的分布式全文检索系统[J].计算机应用与软件,2009,26(9):142-145. 被引量:11
-
7宋光慧,聂琰,郭建康.基于Nutch的校园网信息检索系统的研究与实现[J].中国教育信息化(高教职教),2010(8):65-66. 被引量:5
-
8王二红,寿永熙,马志强,李静.多线程搜索器的设计与实现[J].内蒙古农业大学学报(自然科学版),2010,31(3):272-276. 被引量:2
-
9张春燕,刘发升.关于Lucene索引工具的性能优化研究[J].计算机技术与发展,2011,21(5):121-123. 被引量:2
-
10周拴龙.Lucene.net中文分词算法分析[J].郑州大学学报(理学版),2011,43(3):73-77. 被引量:3
-
1毕洪宇.利用NoSQL构建高性能全文检索系统[J].计算机与现代化,2012(3):122-124. 被引量:6
-
2全文检索系统与关系型数据库的无缝对接[J].软件,1999,20(7):3-4.
-
3李晶.基于lucene的全文检索系统的开发与实现[J].信息与电脑(理论版),2011(9):81-81.
-
4Web安全问答(1)[J].通信技术,2011,44(7):3-3.
-
5王霞.IE8让你搜索加速[J].大众软件,2009(11):46-46.
-
6张桂英.同步网站信息到您的桌面[J].视窗世界,2003(6):122-122.
-
7孙剑.浅谈计算机网络安全与防范措施[J].黑龙江科技信息,2007(12X):88-88. 被引量:2
-
8钟锋.基于Lucene的全文检索系统研究与实现[J].浙江外国语学院学报,2013(4):77-81. 被引量:1
-
9祝伟华,刘期勇.基于Lucene.Net具有用户权限的全文检索系统的应用[J].云南民族大学学报(自然科学版),2009,18(1):73-76. 被引量:3
-
10周锦程,王丹,余泉,张维.基于Lucene的全文检索系统的研究与实现[J].计算机技术与发展,2011,21(3):67-71. 被引量:10