摘要
针对目前网络上不良信息变换不同方式逃脱过滤以及中文分词器分词后存在的问题,提出了基于文本分类技术的信息过滤方法,通过在原有的文本自动分类系统中添加三个过滤模块,以过滤掉无用信息、单个独立字、敏感信息等不良内容,从而保障分类安全高效。
According to the character variety of unhealthy text information escaping from filtering in the Intemet, and open question after word segmentation, the paper presents information filtering method based on the text categorization, it appends three filtering modules to the text auto-categorization system, filters the useless information, single word, sensitive information etc, Thus it guarantees the safety and efficientl classification.
出处
《信息技术》
2007年第12期100-102,共3页
Information Technology
关键词
信息过滤
文本分类
敏感信息
information filtering
text categorization
sensitive information