期刊文献+

文档智能:数据集、模型和应用 被引量:8

Document AI:Benchmarks,Models and Applications
下载PDF
导出
摘要 文档智能是指通过计算机进行自动阅读、理解以及分析商业文档的过程,是自然语言处理和计算机视觉交叉领域的一个重要研究方向。近年来,深度学习技术的普及极大地推动了文档智能领域的发展,以文档版面分析、文档信息抽取、文档视觉问答以及文档图像分类等为代表的文档智能任务均有显著的性能提升。该文对于早期基于启发式规则的文档分析技术、基于统计机器学习的算法以及近年来基于深度学习和预训练的方法进行简要介绍,并展望了文档智能技术的未来发展方向。 Document AI,or Document Intelligence,is a relatively new research topic that refers to the techniques to automatically read,understand and analyze business documents.It is an important interdisciplinary study involving natural language processing and computer vision.In recent years,the popularity of deep learning technology has greatly advanced the development of Document AI tasks,such as document layout analysis,document information extraction,document visual question answering,and document image classification etc.This paper briefly introduces the early-stage heuristic rule-based document analysis,statistical machine learning based algorithms,as well as the deep learning-based approaches especially the pre-training approaches.Finally,we also look into the future direction of Document AI.
作者 崔磊 徐毅恒 吕腾超 韦福如 CUI Lei;XU Yiheng;LYU Tengchao;WEI Furu(Natural Language Computing Group,Microsoft Research Asia,Beijing 100080,China)
出处 《中文信息学报》 CSCD 北大核心 2022年第6期1-19,共19页 Journal of Chinese Information Processing
关键词 文档智能 深度学习 多模态自然语言处理 Document AI deep learning multimodal NLP
  • 相关文献

同被引文献25

引证文献8

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部