-
题名典籍事件触发动词识别研究:基于《左传》的文本实验
被引量:4
- 1
-
-
作者
何琳
马晓雯
喻雪寒
艾毓茜
李章超
高丹
-
机构
南京农业大学信息管理学院
南京农业大学人文与社会计算研究中心
南京医科大学图书馆
-
出处
《图书情报工作》
CSSCI
北大核心
2022年第5期133-141,共9页
-
基金
国家社会科学基金项目“基于典籍的中华传统文化知识表达体系自动构建方法”(项目编号:18BTQ063)研究成果之一。
-
文摘
[目的/意义]事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法。[方法/过程]首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集。在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集。在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证。[结果/结论]结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围。
-
关键词
触发词识别
主题聚类
词集扩展
类别体系构建
典籍文本
-
Keywords
trigger word recognition
topic clustering
word set expansion
classification system construction
ancient classic text
-
分类号
G250
[文化科学—图书馆学]
-