摘要
数字档案资源融合共享服务的不断推进,方便了用户对档案资源的访问与查阅,提高了档案的利用效率。但是,随着数字档案资源越来越多,也给用户检索和定位档案信息带来了一定的困难。借鉴当前主流互联网搜索引擎的算法和功能,对数字档案资源进行文本化处理,通过分词、索引词提取、权重分析等过程,并使用基于Python语言的Django框架进行系统搭建,构建数字档案资源全文索引数据库,可以实现对数字档案资源的内容检索,从而达到节省用户时间的目的。
作者
许和旭
傅广衡
Xu Hexu;Fu Guangheng
出处
《档案》
2021年第8期50-54,共5页
ARCHIVES
基金
中国索引学会重点课题“基于人工智能的自动索引编制研究”(课题编号CSI20A02)的阶段性研究成果之一。