摘要
随着网络新闻类门户网站的不断增多,如何从纷繁复杂的新闻信息中得到当日热点新闻,为用户提供一个方便的访问界面成为当前主要问题。通过对超文本进行聚类分析从而得到热点新闻,采用字符串核函数(string kerne l)来计算文本相似度,并将其应用到超文本聚类分析中。实验表明字符串核对于超文本的聚类分析有较好效果。
With the increase of news portals, how to get the daily hot news from internet and to provide a user-friendly interface for accessing is becoming a big challenge for us. This paper discusses how to get the daily hot news by clustering hypertexts. String kernel is used to measure the similarity between hypertexts for text clustering analysis. The experiment results show that string kernel could help to achieve good clustering performance.
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007年第4期212-215,共4页
Journal of Guangxi Normal University:Natural Science Edition
基金
国家863计划基金资助项目(2006AA100208-2)
西北农林科技大学人才基金资助项目(01140402)
西北农林科技大学青年学术骨干支持计划基金资助项目(01140301)