-
题名长文本武侠小说外号识别研究
被引量:3
- 1
-
-
作者
唐锋
梁循
赵晓磊
张旋
程恒超
-
机构
中国人民大学信息学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第8期132-142,共11页
-
基金
北大方正集团有限公司数字出版技术国家重点实验室开放课题
国家自然科学基金(71531012,71271211)
+1 种基金
北京市自然科学基金(4172032)
中国人民大学科学研究基金(中央高校基本科研业务费专项资金)项目成果(19XNH120)
-
文摘
长文本武侠小说中主人公以侠客和义士为主,人物个性鲜明,外号可以概括人物最显著的特征。传统命名实体识别主要集中在人名、地名、机构名等领域,对于识别外号尚未有相关研究,但作为武侠小说中不可或缺的元素,外号识别对于同义词识别等研究方向具有借鉴意义。鉴于此,该文提出对武侠小说中武侠人名对应的外号的未登录词扩展识别筛选并辅以固定句式法则的识别方法。未登录词扩展识别筛选方法融合了对于左邻字符串的拓展和筛选同时定义了竞争外号子串和候选外号子串等概念,固定句式法则方法是通过外号指示词对观察窗口的候选外号子串进行筛选。经过统计和分类提出了武侠小说高频词表和低频指示字典,用于对竞争外号子串进行筛选。实验证明该文方法可行有效。
-
关键词
外号识别
竞争外号子串
高频词表
固定句式法则
-
Keywords
nickname recognition
competent nickname substring
high frequency word list
fixed sentence principle
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-