摘要
随着信息技术的迅速发展,网络已经逐步成为人们生活当中不可或缺的信息传播工具。由于网络资源的大量使用和信息的大量传输,导致信息过载及安全等问题日益突出。为了解决信息过滤的过滤精度和效率瓶颈等问题,这里详细地对文本信息过滤的主要过程、文本表示方法、特征向量获取、相似度计算等技术进行研究,提出一个基于特征向量的文本信息过滤算法。该过滤算法有效地平衡了计算负载,具有较高的信息过滤性能。
With its rapid development and widely applied,network has become an important tool to transmit information now. So it's important for us to filtrate the information spreading through the network. To help the network information safe guarders control the bad information and identify the bad websites, an algorithm based on the feature vector, and the documents expression and the similar computational are introduced. The work has confirmed the methods which can improve the precision of information filtering.
出处
《现代电子技术》
2010年第4期145-147,151,共4页
Modern Electronics Technique
关键词
文本信息
特征向量
相似度
信息过滤
text information
feature vector
similarity
information filtering