摘要
甲骨文在汉字发展史上有着极其重要的地位,是当之无愧的现代汉字的鼻祖。在甲骨文发现至今的120余年中,涌现出的大量研究资料极大地推进了甲骨学研究的发展,但由于这些资料浩瀚纷杂,获取难度大,且绝大部分尚未实现网络共享,给研究者查阅资料、对比校勘等造成不便。为解决甲骨学研究面临的难题,一个集甲骨文字库、著录库、文献库为一体的甲骨文大数据平台--《殷契文渊》应运而生,旨在为研究者提供最齐全、最规范、最权威的研究资料,最高效、最便捷、最智能的研究辅助。文献数字化技术作为平台建设的关键技术之一,其所包含的两个重要技术:文档分析技术与字符识别技术是实现甲骨学文献由“独享”走向“共享”的关键步骤。本文重点介绍了这两个技术在文献数字化过程中的应用,分析了相关技术在辅助甲骨学研究与甲骨文普及方面所能提供的智能化服务及运用前景,希望能为甲骨学研究者了解当下甲骨学研究领域的信息化进程提供帮助。
出处
《殷都学刊》
2020年第3期47-53,共7页
Yindu Journal
基金
“甲骨文信息处理”教育部创新团队(2017PT35)
国家社会科学基金重大委托项目:甲骨文大数据云平台技术研究(16@ZH017A3)
教育部、国家语委甲骨文研究与应用专项项目:基于文本和图形语义融合的甲骨文辅助考释研究(YWZ-J010)
国家自然科学基金项目:语境和构形网络驱动的未识甲骨字场景语义预测(项目编号:61806007)
安阳师范学院科研培育基金:文献中隶定字识别与输入研究(AYNUKPY-2019-04)
甲骨文信息处理教育部重点实验室主任基金:基于深度学习的甲骨文文献分析技术(OIP2019M006)。