期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于深度学习的档案文件齐全性检验方法
1
作者 肖雪丽 廖常辉 李惠仪 《信息记录材料》 2024年第3期198-200,204,共4页
本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,Bi... 本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,BiLSTM⁃CRF)对档案文件名进行文本分词,以精准提取出关键词。其次,构建关键词库,并结合预设规则,形成了一种灵活且高效的档案文件齐全性检验策略。再次,通过采用句子级双向编码器的Transformer表示模型(sentence bidirectional encoder representations from transformers,SBERT),计算文本之间的相似度,进行精确的档案文件比对,以便及时发现文件是否存在缺失、重复或超出预期的情况。最后,对档案文件的齐全性进行快速、准确的评估,为档案管理人员提供有力的决策支持。 展开更多
关键词 档案文件齐全性 深度学习 文本匹配 文本分词
下载PDF
文本内容识别技术的研究与实践
2
作者 李惠仪 肖雪丽 廖常辉 《信息记录材料》 2023年第7期98-101,共4页
随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。为此,首先,概... 随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。为此,首先,概述了过往的文本内容识别和感知中的相关技术。其次,介绍了电子档案管理应用中所面临的表格内容电子化还原识别难题。然后提出了基于U2-Net深度学习模型的表格格式提取技术,并通过融合CRNN的文字识别技术,实现了端到端的纸质表格内容的全流程解析。最后,强调了文本内容纸质档案中表格内容电子化技术的重要性,并对后续档案管理工作进行了分析和展望。 展开更多
关键词 档案管理 深度学习 文本内容定位 文本识别 表格内容识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部