期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Web内容过滤中的数据预处理模块设计 被引量:1
1
作者 祝佳 李生红 李建华 《通信学报》 EI CSCD 北大核心 2005年第B01期141-144,共4页
Web内容过滤是将模式识别和文本分类的方法应用于通过服务器或个人终端的数据流上,实现不良或无关信息过滤的行为模式。之后介绍了典型的数据预处理技术,指出大量无关或冗余数据以及中文字符集的多样性影响了过滤的效果。提出了改良... Web内容过滤是将模式识别和文本分类的方法应用于通过服务器或个人终端的数据流上,实现不良或无关信息过滤的行为模式。之后介绍了典型的数据预处理技术,指出大量无关或冗余数据以及中文字符集的多样性影响了过滤的效果。提出了改良的数据预处理模块,其中引入了主体文本提取和中文字符集自动识别转换等技术。结合实验和实际系统应用说明了改良模块的作用,并给出了进一步的努力方向。 展开更多
关键词 内容过滤 数据预处理 主体文本提取 字符集识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部