摘要
文本分类是数据挖掘和机器学习中非常重要的研究领域,将文本分类技术应用于海洋信息处理已经成为海洋领域研究的一个重要问题。主要研究文本分类技术在海洋信息处理领域的应用,给出了文本分类系统的关键技术设计方案,详细介绍了一种改进的χ2特征提取算法以及朴素贝叶斯分类算法,实验结果具有较好的准确率和查全率,满足我国"数字海洋"信息基础建设对信息处理应用的需求。
Text classification is a very important research field of data mining and machine learning,applying text classification technology to marine knowledge becomes an important point. Studied the application of text classification in marine information processing field, gave the design of text category system. Improved feature selection of χ^2 and naive bayesian categorization algorithm were in presented detail. Experiment shows good results and satisfying "Digital Marine" practical applied requiring.
出处
《计算机科学》
CSCD
北大核心
2008年第11期144-146,共3页
Computer Science
基金
国家自然科学基金(No.60573017)
中国‘数字海洋’信息基础框架构建专项项目(908-03-01-13)
关键词
文本分类
信息处理
数字海洋
朴素贝叶斯算法
Text classification, Information processing, Digital marine, Naive bayesian algorithm