-
题名基于《金融档案分类表》的自动分类算法研究
被引量:7
- 1
-
-
作者
刘开瑛
郑家恒
刘静
-
机构
山西大学计算机科学系
-
出处
《情报学报》
CSSCI
北大核心
1997年第5期346-353,共8页
-
基金
国家自然科学基金
-
文摘
本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动分类正确率可达81%以上。
-
关键词
自动分类
金融档案
档案分类
-
Keywords
automatic categorization, financial document, archive categorization.
-
分类号
G275.9
[文化科学—档案学]
G272.5
[文化科学—档案学]
-
-
题名基于《中图法》的自动分类研究现状与展望
被引量:7
- 2
-
-
作者
黄莉
李湘东
-
机构
武汉大学图书馆
武汉大学信息管理学院
武汉大学信息资源研究中心
-
出处
《图书情报知识》
CSSCI
北大核心
2012年第4期30-36,共7页
-
基金
教育部"留学回国人员科研启动基金"项目(教外留司[2009]1341号)的研究成果之一
-
文摘
将人工智能研究领域中的文本自动分类技术应用于信息资源管理领域是当前的研究重点之一,而目前信息资源管理领域具有体系结构严格、类目数量巨大、类目层次众多等特点。本文充分考虑这些特点,针对《中国图书馆图书分类法》分类体系下文本自动分类研究的现状,从研究目的、类目体系、资源类型等方面,参考国外相关研究的成果和方法予以分析和评价;结合国外相关研究的最新成果,提出我国在《中国图书馆图书分类法》分类体系下应用文本自动分类技术时应注意的问题及今后的研究方向。
-
关键词
中图法
自动分类
类目体系
文本类型
语料库
-
Keywords
CLC automatic categorization Category system document type Corpus
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种面向自动化标检的文本分类方法
- 3
-
-
作者
郭泽
焦倩倩
-
机构
北京电子工程总体研究所
-
出处
《现代防御技术》
2020年第5期97-104,共8页
-
文摘
针对自动化标检中的段落文本分类问题,提出一种基于机器学习的改进朴素贝叶斯分类算法。该方法对朴素贝叶斯分类算法进行改进并作为分类器,采用遗传算法作为训练模型对分类器中的所有特征权重进行训练,并采用一种基于图表位置的修正算法优化分类结果。在实际的数据集中进行了实验,结果表明,该方法与传统KNN(K-nearest neighbor)算法和朴素贝叶斯算法相比具有更好的分类结果,能够有效的处理错误样本较多的情况,可大幅提升自动化标检的准确性。
-
关键词
机器学习
文本分类
朴素贝叶斯
遗传算法
自动化标检
-
Keywords
machine learning
text categorization
naive Bayes
genetic algorithm
automatic document review
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-