-
题名对档案著录中的人名处理
- 1
-
-
作者
许歆懿
-
机构
淮阴市城建档案馆
-
出处
《城建档案研究》
2000年第4期40-41,共2页
-
文摘
电子计算机进入城建档案工作领域后,使档案著录、检索、统计等很繁杂的工作实现了自动化,大大提高了工作效率。由于电子计算机对档案的标准化要求较高,在档案前处理过程中,要对数据进行必要的加工,否则,计算机将无法顺利工作。比如,我们在整理城建档案时,离不开与人名打交道,有时还需用人名进行检索,这就需要将人名作为一个要素进行著录。但是,在著录过程中我们却发现,有的一个名字往往有几种写法,如“王维民”又可写成“王为民”。这种情况,如用手工检索问题不大,若用电脑检索则不同,只要一个字不同,它就会回答你:查不到!或NOFIND!因此,对人名的处理一定要慎重,否则,一些档案将因永远检索不出而成为“死档案”。
-
关键词
档案著录
人名处理
城建档案
-
分类号
G272.6
[文化科学—档案学]
G275.3
[文化科学—档案学]
-
-
题名人名、地名、机构名自动识别的形式化策略及意义
被引量:1
- 2
-
-
作者
丁俊苗
-
机构
巢湖学院中文系
-
出处
《乐山师范学院学报》
2009年第2期51-54,共4页
-
基金
2007年度安徽省高校青年教师科研资助计划项目"现代汉语缩略词语的自动识别研究"(项目编号:2007jqw104)
巢湖学院科研启动基金
-
文摘
未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。
-
关键词
中文信息处理人名未登录词书面语专名号
-
分类号
H08
[语言文字—语言学]
-