目前基于机器学习的中文语义角色标注(Semantic Role Labeling,SRL)方法大致可以分为两类:基于深层句法分析的方法和基于浅层句法分析的方法.由于基于这两种方法的SRL系统在性能和健壮性上各有优缺点,本文试图联合基于这两种方法的SRL...目前基于机器学习的中文语义角色标注(Semantic Role Labeling,SRL)方法大致可以分为两类:基于深层句法分析的方法和基于浅层句法分析的方法.由于基于这两种方法的SRL系统在性能和健壮性上各有优缺点,本文试图联合基于这两种方法的SRL系统的输出,通过一些全局特征训练出联合模型,对候选角色进行过滤,然后解决不满足句子论元结构限制的冲突角色得到最终标注结果,来提高标注的性能.在Chinese PropBank 1.0语料集上,联合模型的F值达到了78.41%,在基于深层句法分析的SRL的F值67.34%和基于浅层句法分析的SRL的F值71.67%基础上有了显著的提高,从而证明我们的联合方法是非常有效的.展开更多
中文命题库(the Chinese Proposition Bank)是在中文树库(the Chinese Treebank)上标注语义角色的语料库。语义角色是语言学研究的重要内容之一,标注了语义角色的命题库不但提供了谓语动词(predicate verb)的论元结构(argument structur...中文命题库(the Chinese Proposition Bank)是在中文树库(the Chinese Treebank)上标注语义角色的语料库。语义角色是语言学研究的重要内容之一,标注了语义角色的命题库不但提供了谓语动词(predicate verb)的论元结构(argument structure),也提供了可谓词(predicative verb)语义角色的句法实现方式,大规模的"词汇语义-句法结构"语料为相关语言学研究提供了大量的真实数据。目前语义角色是以基于特定谓语动词(predicate-specific)的方式进行定义并使用统一的标记进行标注,这个标注方式导致了语义角色标记意义在不同的动词论元结构中的不一致问题,导致在语义上我们无法对动词的论元结构的句法实现做更深入的理解和解释。为了改进这个问题,本文定义了一套全局性语义角色标记并标注到命题库中。结果显示,标注了全局性语义角色的中文命题库解决了语义角色不一致的问题,丰富了动词论元结构模式,并且使得我们可以更好的从语义上理解动词论元的句法表现。本文的工作不是对之前标注工作的否定,而是增加一层标注以形成完整的语义资源,提供了关于论元的语义角色和句法实现之关系的大规模真实数据,使得我们可以更加全面深入的认识动词论元结构的问题。展开更多
文摘目前基于机器学习的中文语义角色标注(Semantic Role Labeling,SRL)方法大致可以分为两类:基于深层句法分析的方法和基于浅层句法分析的方法.由于基于这两种方法的SRL系统在性能和健壮性上各有优缺点,本文试图联合基于这两种方法的SRL系统的输出,通过一些全局特征训练出联合模型,对候选角色进行过滤,然后解决不满足句子论元结构限制的冲突角色得到最终标注结果,来提高标注的性能.在Chinese PropBank 1.0语料集上,联合模型的F值达到了78.41%,在基于深层句法分析的SRL的F值67.34%和基于浅层句法分析的SRL的F值71.67%基础上有了显著的提高,从而证明我们的联合方法是非常有效的.
文摘中文命题库(the Chinese Proposition Bank)是在中文树库(the Chinese Treebank)上标注语义角色的语料库。语义角色是语言学研究的重要内容之一,标注了语义角色的命题库不但提供了谓语动词(predicate verb)的论元结构(argument structure),也提供了可谓词(predicative verb)语义角色的句法实现方式,大规模的"词汇语义-句法结构"语料为相关语言学研究提供了大量的真实数据。目前语义角色是以基于特定谓语动词(predicate-specific)的方式进行定义并使用统一的标记进行标注,这个标注方式导致了语义角色标记意义在不同的动词论元结构中的不一致问题,导致在语义上我们无法对动词的论元结构的句法实现做更深入的理解和解释。为了改进这个问题,本文定义了一套全局性语义角色标记并标注到命题库中。结果显示,标注了全局性语义角色的中文命题库解决了语义角色不一致的问题,丰富了动词论元结构模式,并且使得我们可以更好的从语义上理解动词论元的句法表现。本文的工作不是对之前标注工作的否定,而是增加一层标注以形成完整的语义资源,提供了关于论元的语义角色和句法实现之关系的大规模真实数据,使得我们可以更加全面深入的认识动词论元结构的问题。