-
题名一种轻量级的汉语语义角色标注规范
被引量:4
- 1
-
-
作者
刘亚慧
杨浩苹
李正华
张民
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第4期10-20,共11页
-
基金
国家自然科学基金(61525205,61876116)
江苏高校优势学科建设工程资助项目
-
文摘
作为主流的浅层语义表示形式,语义角色标注一直是自然语言处理领域的研究热点之一。目前学术界已有的语义角色标注规范(PropBank规范和北大规范)主要存在三个问题:①基于片段的论元表示让标注难度加大;②PropBank中谓词框架的定义难度较大;③北大规范缺乏省略论元的标注。经过充分调研,该文尝试融合已有的中英文语义角色标注规范的优点,同时结合实际标注中遇到的问题,制定了一种轻量级的适合非语言学背景的标注者参与的中文语义角色标注规范。第一,采用基于词的论元表示,避免了片段边界的确定,从而降低标注难度;第二,标注者直接根据句子上下文信息,标注谓词相关论元角色,而无须预先定义每个谓词的所有语义框架;第三,显式标注句子中省略的核心论元,更准确地刻画句子的语义信息。此外,为了保证标注一致性和提高数据标注质量,规范针对各种复杂语言现象,给出了明确的优先级规定和难点分析。
-
关键词
语义角色标注
标注规范
浅层语义分析
论元角色
谓词
-
Keywords
semantic role labeling
annotation guideline
shallow semantic parsing
argument role
predicate
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-