期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于文本特征识别的电子档案自动归类系统研究 被引量:5
1
作者 王珺 《现代电子技术》 北大核心 2019年第18期45-49,共5页
传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差.因此,提出一种基于文本特征识别的电子档案自动归类系统.该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维... 传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差.因此,提出一种基于文本特征识别的电子档案自动归类系统.该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属.封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高于95%,且不同信噪比环境下,系统平均中断概率为0.17%,低于对比系统. 展开更多
关键词 电子档案 自动归类 特征识别 语料库模块 排版模块 归类测试
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部