摘要
在自然语言处理中,语义角色标注是一个比较重要的任务。语义角色标注任务以语义角色理论为基础。语义角色标注任务和语言学的相关理论都要求同一个动词在不同语句中相应的语义角色成分保持一致。该文统计了北京大学973课题语义角色标注语料库及中文PropBank中"施事"的语义分布,进而根据该语义分布,加上人工筛选,共找出了85个在"施事"语义角色的标注上无法保持一致的动词。该文指出,这些动词的"施事"语义无法保持一致的原因在于它们是一类有致使语义特征、无自主语义特征的动词。该文的研究对于处理其他语义角色(如"客体")也存在的标注不一致问题有一定的启示。
Semantic role labeling,which is based on the theories of semantic roles,is an important task in natural language processing.In semantic role labeling,it is required that the semantic role of a verb should be consistent in different sentences.We analyzed the semantic distribution of agents in the semantic role labeling corpus.It is revealed that 85 verbs can't meet the requirement of consistency,which may be accounted by their property of causative verbs instead of volitive verbs.This strategy can be extended to other inconsistency issues in semantic role labeling.
作者
陈龙
詹卫东
CHEN Long;ZHAN Weidong(Department of Chinese Language and Literature,Peking University,Beijing 100871,China;Center for Chinese Linguistics,Peking University,Beijing 100871,China;MOE Key Laboratory of Computational Linguistics,Peking University,Beijing 100871,China)
出处
《中文信息学报》
CSCD
北大核心
2019年第1期1-9,共9页
Journal of Chinese Information Processing
基金
国家重点基础研究发展计划(973项目)(2014CB340504)
教育部人文社科基地2015年重大项目(15JJD740002)