本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,Bi...本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,BiLSTM⁃CRF)对档案文件名进行文本分词,以精准提取出关键词。其次,构建关键词库,并结合预设规则,形成了一种灵活且高效的档案文件齐全性检验策略。再次,通过采用句子级双向编码器的Transformer表示模型(sentence bidirectional encoder representations from transformers,SBERT),计算文本之间的相似度,进行精确的档案文件比对,以便及时发现文件是否存在缺失、重复或超出预期的情况。最后,对档案文件的齐全性进行快速、准确的评估,为档案管理人员提供有力的决策支持。展开更多
文摘本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,BiLSTM⁃CRF)对档案文件名进行文本分词,以精准提取出关键词。其次,构建关键词库,并结合预设规则,形成了一种灵活且高效的档案文件齐全性检验策略。再次,通过采用句子级双向编码器的Transformer表示模型(sentence bidirectional encoder representations from transformers,SBERT),计算文本之间的相似度,进行精确的档案文件比对,以便及时发现文件是否存在缺失、重复或超出预期的情况。最后,对档案文件的齐全性进行快速、准确的评估,为档案管理人员提供有力的决策支持。