期刊文献+

基于字符串核函数的热点新闻发现系统 被引量:1

Hot News Discovering System Based on String Kernel
下载PDF
导出
摘要 随着网络新闻类门户网站的不断增多,如何从纷繁复杂的新闻信息中得到当日热点新闻,为用户提供一个方便的访问界面成为当前主要问题。通过对超文本进行聚类分析从而得到热点新闻,采用字符串核函数(string kerne l)来计算文本相似度,并将其应用到超文本聚类分析中。实验表明字符串核对于超文本的聚类分析有较好效果。 With the increase of news portals, how to get the daily hot news from internet and to provide a user-friendly interface for accessing is becoming a big challenge for us. This paper discusses how to get the daily hot news by clustering hypertexts. String kernel is used to measure the similarity between hypertexts for text clustering analysis. The experiment results show that string kernel could help to achieve good clustering performance.
出处 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期212-215,共4页 Journal of Guangxi Normal University:Natural Science Edition
基金 国家863计划基金资助项目(2006AA100208-2) 西北农林科技大学人才基金资助项目(01140402) 西北农林科技大学青年学术骨干支持计划基金资助项目(01140301)
关键词 字符串核函数 文本聚类 文本相似度 string kernel text clustering text similarity
  • 相关文献

参考文献7

  • 1REIS D C,GOLGHER P B,SILVA A S,et al. Automatic Web news extraction using tree edit distance[C]//Proceedings of the 13th International Conference on World Wide Web. New York: ACM Press,2004:502-511.
  • 2LODHI H ,SHAWE-TAYLOR J ,CRISTIANINI N ,et al. Text classification using string kernels[J]. Journal of Machine Learning Research, 2002,2:419-444.
  • 3ZHANG Lei,ZHANG D,SIMOFF S J,et al. Weighted kernel model for text categorization [C]// Proceedings of the Fifth Australasian Conference on Data Mining and Analystics. Darlinghurst : Australian Computer Society,2006:111- 114.
  • 4KARATZOGLOU A, FEINERER I. Text clustering with string kernels in R[EB/OL]. (2006-05-06)[2007-06-30]. http://epub, wu-wien, ac. at/dyn/virlib/wp/mediate/epub-wu-01 _ 96d. pdf? ID=epub-wu-01_96d.
  • 5张 阳,李建良,胡正国.NewsGrouper:一个自动抽取重要新闻的软件工具[J].计算机工程,2002,28(4):83-84. 被引量:3
  • 6THEODORIDIS S,KOUTROUMBAS K.Pattern recognition[M].3rd ed.北京:机械工业出版社,2006.490-550.
  • 7Shawe-Taylor J,Cristianini N.Kernel Methods for Pattern Analysis[M].北京:机械工业出版社,2005.48-68.

二级参考文献3

  • 1[1]Alon Y.Intelligent Internet Systems.http://www.cs.washington.edu/h omes/alon/site/files/aij 00 .ps,2000
  • 2[2]Perkowitz M.Learning to Understand Information on the Intemet:An Example-based Approach.http://cs.sungshin.ac.kr/~jskim/PS/imagedb/ILA-JIIS.ps,1997
  • 3[3]McCallum A,Nigam K,Rennie J.Building Domain-specific SearchEngines with Machine Learning Techniques.http://www.cs.cmu.edu/~mccallum/papers/cora-aaaiss99.ps.gz,1999

共引文献4

同被引文献3

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部