Nutch搜索引擎在网络舆情管控中的应用
摘要
介绍了搜索引擎的工作原理,详细分析了Nutch的工作机制,并与商业搜索引擎进行了比对分析。实验结果表明,商业搜索引擎在公安应用中存在一定的局限性,在特定的公安应用背景下,在搜索精度、结果排序方面,Nutch要优于商业搜索引擎。
出处
《警察技术》
2015年第3期70-73,共4页
Police Technology
二级参考文献19
-
1车东.Lucene:基于Java的全文检索引擎简介[EB/OL].(2009-03-20)[2009-07-20].http://www.chedong.com/tech/lucene.html.
-
2ERIK HATCHER, OTIS GOSPODNETIC. Lucene In Action[M]. Manning Publications Co. , 2005.
-
3Yates R B,Neto B R.Moderm Information Retrieval[M].New York,USA:Addison Wesley,1999.
-
4Chakrabarti S,Dom B,Gibson D.Hypersearching the Web[Z].http://www.sciam.com/,1999-06.
-
5Brin S,Page L.The Anatomy of a Large-scale Hypertextual Web Search Engine[C].Proceedings of the 7th ACM-WWW International Conference.Brisbane:ACM Press,1998:107-117.
-
6Page L,Brin S.The PageRank Citation Ranking:Bringing Ord-er to the Web[EB/OL].http://www.db.stanford.edu/~backub/PageRanksub.ps,1998~2001.
-
7Kleinberg J.Authoritative Sources in a Hyperlinked Environment[J].Extended Version in Journal of the ACM,1999,46(5):604-632.
-
8Haveliwala T H.Topic-sensitive PageRank[C].Proceedings of the Eleventh International World Wide Web Conference,Hoho Lulu Hawaii,2002.
-
9The Open Directory Project:Web Directory for over 2.5 Million Urls[EB/OL].http://www.dmoz.org/.
-
10Chakrabarti S,Dom B,Gibson D,et al.Automatic Resource Compilation by Analyzing Hyperlink Structure and Associated Text[C].Proceedings of the 7th ACM-WWW International Conference.Brisbane:ACM Press,1998:65-74.
共引文献71
-
1杨格兰,涂立.基于主题相关性和链接权重的PageRank算法[J].华中科技大学学报(自然科学版),2012,40(S1):300-303. 被引量:4
-
2肖萍,申亚鹏.Nutch搜索引擎的公安应用研究[J].中国刑警学院学报,2015(1):39-44.
-
3张玉宝.中文搜索引擎的原理及相关技术分析[J].福建电脑,2008,24(1):7-8. 被引量:3
-
4李村合,吕克强.一种改进PageRank的新方法[J].计算机系统应用,2008,17(3):81-83.
-
5王崝,鞠时光.基于时间维加权TimedWPR算法[J].计算机工程与设计,2008,29(12):3001-3004. 被引量:2
-
6王冬,雷景生,李壮.基于PageRank的页面排序改进算法[J].计算机工程与设计,2008,29(22):5921-5923. 被引量:11
-
7郑国良,叶飞跃,张滨,林国俊.基于网页内容和链接价值的相关度方法的实现[J].计算机工程与设计,2008,29(23):6020-6022. 被引量:4
-
8李村合,吕克强.Nutch搜索引擎的页面排序修改方法研究[J].计算机工程与设计,2009,30(6):1343-1345. 被引量:2
-
9王冬,雷景生.一种基于PageRank的页面排序改进算法[J].微电子学与计算机,2009,26(4):210-213. 被引量:18
-
10王向阳,马军.一个基于PageRank的科技文献质量评价算法[J].广西师范大学学报(自然科学版),2009,27(1):165-168. 被引量:13
-
1肖萍,申亚鹏.Nutch搜索引擎的公安应用研究[J].中国刑警学院学报,2015(1):39-44.
-
2李宇博,张晶.浅谈数据挖掘与电子政务[J].数码世界,2015,0(9):17-18.
-
3李若鹏,李翔,林祥,李建华.基于DK算法的互联网热点主动发现研究与实现[J].计算机技术与发展,2008,18(9):1-4. 被引量:10
-
4王然,程晓荣.基于开源搜索引擎Nutch的研究与实现[J].电脑编程技巧与维护,2015(19):20-20.
-
5黄斐一,孙立军,孔繁盛,刘建东.大数据与互联网的舆情管控[J].移动通信,2014,38(13):19-23. 被引量:3
-
6马睿,黄穗.基于补偿的Nutch搜索引擎的设计与实现[J].科学技术与工程,2011,11(34):8619-8623.
-
7解辉,王丁.基于云技术的公安应用资源管理平台设计[J].数字技术与应用,2013,31(9):148-149.
-
8丁丽萍.论公安应用信息系统开发中的风险控制[J].中国人民公安大学学报(自然科学版),2004,10(2):71-73.
-
9梁正友,潘涛.Nutch中PageRank的并行实现[J].计算机工程与设计,2010,31(20):4354-4356. 被引量:4
-
10潘涛,梁正友.Nutch中网页排序效果的改进方法[J].计算机工程,2010,36(13):42-44. 被引量:6