期刊文献+

面向信息内容安全的文本过滤和分类系统研究与实现 被引量:2

Research and Implementation of Text Filter and Categorization System for Content Security
下载PDF
导出
摘要 本文设计并实现了一个面向信息内容安全应用的文本过滤与自动分类系统。系统采取探测器和分类器两个步骤实现高速网络环境下数据截取、还原、分类的功能。探测器采取简单规则匹配和高速字符串匹配算法来提高数据截取和自身的过滤性能,分类器采取基于简单向量空间模型设计,采取自动学习和人工干预相结合的方法来提高系统的查准率和查全率。本文给出了探测器和分类器在实际应用时的技术性能。 A text filter and categorization system is designed and implemented for content security application. We use Detector and Categorizer to capture, reassemble and filter packet stream in high traffic network. The Detector only use simple rules to filter packets. Combining automatic learning and manual processing, The Categorizer use the simple SVM to categorize. The evaluations and results is given.
出处 《计算机科学》 CSCD 北大核心 2005年第7期159-161,共3页 Computer Science
基金 四川省重点科技攻关计划项目 项目编号03GG007-12
  • 相关文献

参考文献4

二级参考文献13

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4D E Knuth, J H Morris, V R Pratt. Fast pattern matching in strings. SIAM Journal Computer, 1977, 6(2): 323~350
  • 5R S Boyer, J S Moore. A fast string searching algorithm. Communications of the ACM, 1977, 20(10): 762~772
  • 6Sunday M Daniel. A very fast substring search algorithm. Communications of the ACM, 1990, 33(8): 132~142
  • 7A V Aho, M J Corasick. Efficient string matching: An aid to bibliographic search. Communications of the ACM, 1975, 18(6): 333~340
  • 8Fan Jang-Jong, Su Keh-Yih. An efficient algorithm for match multiple patterns. IEEE Trans on Knowledge and Data Engineering, 1993, 5(2):339~351
  • 9黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 10鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页

共引文献343

同被引文献22

引证文献2

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部