摘要
随着互联网的高速发展,网络聊天(IM)软件中的上下文广告成为了网络主要赢利模式之一,也是网络营销中的一种重要方式。要精准地提供此类上下文广告就需要正确地提取聊天过程中的关键词。聊天文本不同于普通的文章,它是一种简短的文本,对于这种文本,传统的TFIDF算法存在着缺陷。本文针对传统TFIDF在处理此类文本时的不足之处,利用EFCM聚类算法来提高TFIDF算法对于这类文本的处理能力。
With the high-speed development of Internet, contextual Ads of IM software is attracted more and more researchers. Chat text is different from article text, which only used TFIDF algorithm to extract keywords is not performs well. In this paper, a EFCM based clustering algorithm is introduced to improve the performance of TFIDF in chat text.
出处
《计算机与现代化》
2009年第3期81-83,共3页
Computer and Modernization