期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于聚类和双向门控循环单元-条件随机场的多类型流式文档结构识别
1
作者 王娟 李宁 +1 位作者 姜雨彤 田英爱 《科学技术与工程》 北大核心 2021年第17期7208-7216,共9页
流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用。以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少。针对此现状,使用聚类的方法对文档进行分类,在此基... 流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用。以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少。针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题。实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别。 展开更多
关键词 流式文档 结构识别 聚类 多类型文档
下载PDF
非结构化数据库及其应用分析 被引量:2
2
作者 何淑娟 《信息系统工程》 2009年第7期49-51,共3页
介绍了非结构化数据库的概念。分析了非结构化数据库在存储机制和索引机制上的变革及作用。提出了在多类型文档管理中使用非结构化数据库的思想,并分析了相关应用中的若干关键问题。
关键词 非结构化 数据库 多类型文档
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部