句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation,AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论...句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation,AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论元共享问题,成为语言资源建设和句子语义解析的研究热点。本文从AMR概念与规范、解析算法和应用等方面对AMR相关研究进行系统的梳理,特别对AMR的各种解析算法进行了比较深入的分析和比较,指出了现有算法存在的问题和不足,同时介绍了中文AMR的开发进展,最后展望了AMR未来的研究方向。展开更多
省略是汉语中常见的语言现象,在传统的句法语义表示方式中,含有省略信息的语言结构经常被忽视,而且由于其树结构的限制,语言中论元共享的现象也很少能够清晰地表示出来。本研究基于人工标注的抽象语义表示(Abstract Meaning Representat...省略是汉语中常见的语言现象,在传统的句法语义表示方式中,含有省略信息的语言结构经常被忽视,而且由于其树结构的限制,语言中论元共享的现象也很少能够清晰地表示出来。本研究基于人工标注的抽象语义表示(Abstract Meaning Representation,AMR)汉语语料库,通过分析AMR标注中增补的概念节点及其涉及的语言结构,统计省略和论元共享现象在汉语真实语料中对应的基本结构类型及其分布,从省略信息的指称类型、句法位置以及句法成分等角度归纳出各类省略模式,为汉语语义完整表示奠定基础。展开更多
省略作为一种复杂的语言现象,一直是汉语语义研究的重要课题。如何将省略的语义内容补全以还原句子的完整语义也是机器理解自然语言的关键。本文基于AMR(Abstract Meaning Representation)语料统计得到含有语义省略信息的"的"...省略作为一种复杂的语言现象,一直是汉语语义研究的重要课题。如何将省略的语义内容补全以还原句子的完整语义也是机器理解自然语言的关键。本文基于AMR(Abstract Meaning Representation)语料统计得到含有语义省略信息的"的"字结构,针对特指性和泛指性省略类型,采用特殊句式核心谓词对应主宾语和基于谓词框架抽取核心谓词搭配必有论元成分的策略,确定补全的语义类别。研究结果表明,该方法对于省略"的"字结构中心语补全有较好的效果,可为自动理解深层语义奠定基础。展开更多
虚词具有丰富的语法意义,对句子理解起着不可或缺的作用。虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用。为了表示虚词的句法语义信息,该文首先在抽象语义表示(abstract meaning representation,AMR)这种基于概念...虚词具有丰富的语法意义,对句子理解起着不可或缺的作用。虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用。为了表示虚词的句法语义信息,该文首先在抽象语义表示(abstract meaning representation,AMR)这种基于概念图的语义表示方法的基础上,增加了词语和概念关系的对齐信息,使得虚词对应于概念节点或节点之间的关系弧。其次,选取了语言规范的人教版小学语文课本8 587句作为语料,进行AMR的标注。然后,针对语料中24 801个虚词实例进行统计,发现介词、连词、结构助词对应概念间的关系,占虚词总数的58.80%;而语气词和体助词表示概念,占41.20%。这表明AMR可以动态地描写出虚词功能,为整句句法语义分析提供更好的理论与资源。展开更多
文摘句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation,AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论元共享问题,成为语言资源建设和句子语义解析的研究热点。本文从AMR概念与规范、解析算法和应用等方面对AMR相关研究进行系统的梳理,特别对AMR的各种解析算法进行了比较深入的分析和比较,指出了现有算法存在的问题和不足,同时介绍了中文AMR的开发进展,最后展望了AMR未来的研究方向。
文摘省略是汉语中常见的语言现象,在传统的句法语义表示方式中,含有省略信息的语言结构经常被忽视,而且由于其树结构的限制,语言中论元共享的现象也很少能够清晰地表示出来。本研究基于人工标注的抽象语义表示(Abstract Meaning Representation,AMR)汉语语料库,通过分析AMR标注中增补的概念节点及其涉及的语言结构,统计省略和论元共享现象在汉语真实语料中对应的基本结构类型及其分布,从省略信息的指称类型、句法位置以及句法成分等角度归纳出各类省略模式,为汉语语义完整表示奠定基础。
文摘省略作为一种复杂的语言现象,一直是汉语语义研究的重要课题。如何将省略的语义内容补全以还原句子的完整语义也是机器理解自然语言的关键。本文基于AMR(Abstract Meaning Representation)语料统计得到含有语义省略信息的"的"字结构,针对特指性和泛指性省略类型,采用特殊句式核心谓词对应主宾语和基于谓词框架抽取核心谓词搭配必有论元成分的策略,确定补全的语义类别。研究结果表明,该方法对于省略"的"字结构中心语补全有较好的效果,可为自动理解深层语义奠定基础。
文摘虚词具有丰富的语法意义,对句子理解起着不可或缺的作用。虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用。为了表示虚词的句法语义信息,该文首先在抽象语义表示(abstract meaning representation,AMR)这种基于概念图的语义表示方法的基础上,增加了词语和概念关系的对齐信息,使得虚词对应于概念节点或节点之间的关系弧。其次,选取了语言规范的人教版小学语文课本8 587句作为语料,进行AMR的标注。然后,针对语料中24 801个虚词实例进行统计,发现介词、连词、结构助词对应概念间的关系,占虚词总数的58.80%;而语气词和体助词表示概念,占41.20%。这表明AMR可以动态地描写出虚词功能,为整句句法语义分析提供更好的理论与资源。