期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于概念预测和关系预测的AMR解析与对齐方法
1
作者 陈亮 高博飞 +1 位作者 常宝宝 张亦驰 《中文信息学报》 CSCD 北大核心 2024年第7期18-30,共13页
抽象语义表示(Abstract Meaning Representation,AMR)是一种深层次的句子级语义表示形式,其将句子中的语义信息抽象为由概念结点与关系组成的有向无环图,相比其他较为浅层的语义表示形式如语义角色标注、语义依存分析等,AMR因其出色的... 抽象语义表示(Abstract Meaning Representation,AMR)是一种深层次的句子级语义表示形式,其将句子中的语义信息抽象为由概念结点与关系组成的有向无环图,相比其他较为浅层的语义表示形式如语义角色标注、语义依存分析等,AMR因其出色的深层次语义信息捕捉能力,被广泛运用在例如信息抽取、智能问答、对话系统等多种下游任务中。AMR解析过程将自然语言转换成AMR图。虽然AMR图中的大部分概念结点和关系与句子中的词语具有较为明显的对齐关系,但原始的英文AMR语料中并没有给出具体的对齐信息。为了克服对齐信息不足给AMR解析以及AMR在下游任务上的应用造成的阻碍,Li等人[14]提出并标注了具有概念和关系对齐的中文AMR语料库。然而,现有的AMR解析方法并不能很好地在AMR解析的过程中利用和生成对齐信息。因此,该文首次提出了一种可以利用并且生成对齐信息的AMR解析方法,包括了概念预测和关系预测两个阶段。该文提出的方法具有高度的灵活性和可扩展性,实验结果表明,该方法在公开数据集CAMR 2.0和CAMRP 2022盲测集分别取得了77.6(+10.6)和70.7(+8.5)的Align Smatch分数,超过了过去基于序列到序列(Sequence-to-Sequence)模型的方法。该文同时对AMR解析的性能和细粒度指标进行详细的分析,并对存在的改进方向进行了展望。该文的代码和模型参数已经开源到https://github.com/pkunlp-icler/Two-Stage-CAMRP,供复现与参考。 展开更多
关键词 语义解析 抽象语义表示 中文自然语言处理
下载PDF
自然语言句子抽象语义表示AMR研究综述 被引量:19
2
作者 曲维光 周俊生 +3 位作者 吴晓东 戴茹冰 顾敏 顾彦慧 《数据采集与处理》 CSCD 北大核心 2017年第1期26-36,共11页
句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation,AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论... 句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation,AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论元共享问题,成为语言资源建设和句子语义解析的研究热点。本文从AMR概念与规范、解析算法和应用等方面对AMR相关研究进行系统的梳理,特别对AMR的各种解析算法进行了比较深入的分析和比较,指出了现有算法存在的问题和不足,同时介绍了中文AMR的开发进展,最后展望了AMR未来的研究方向。 展开更多
关键词 抽象语义表示 句法语义 语义解析 自然语言处理
下载PDF
融合概念对齐信息的中文AMR语料库的构建 被引量:22
3
作者 李斌 闻媛 +3 位作者 宋丽 卜丽君 曲维光 薛念文 《中文信息学报》 CSCD 北大核心 2017年第6期93-102,共10页
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的... 作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,形成中文AMR语料库,统计得到图和环的比例分别为48%和1%,以及利用对齐信息才能获取的非投影句的比例32%,为中文AMR的理论和自动分析研究奠定基础。 展开更多
关键词 抽象语义表示 语义图 句子语义 语言知识库
下载PDF
基于中文AMR语料库的非投影结构研究 被引量:2
4
作者 闻媛 宋丽 +3 位作者 吴泰中 李斌 周俊生 曲维光 《中文信息学报》 CSCD 北大核心 2018年第12期31-40,共10页
非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了含有非投影结构的句子,并对比展开了相关研究。而汉语的非投影... 非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了含有非投影结构的句子,并对比展开了相关研究。而汉语的非投影结构尚未得到重视,语料库构建过程中也因遵循了投影性原则而缺乏对非投影结构的标注。该文基于概念对齐版的中文AMR语料库,在10 149句语料上统计出带有非投影结构的句子比例为31.62%,其三种主要类型为模态词提升、话题化和成分分离,并提出了相应的自动分析方案,以提高中文AMR自动分析效果。 展开更多
关键词 抽象语义表示 概念对齐 非投影 语义分析 中文信息处理
下载PDF
抽象语义表示解析方法研究综述
5
作者 尹华 卢懿亮 +2 位作者 季跃蕾 吴梓浩 彭亚男 《中文信息学报》 CSCD 北大核心 2024年第3期1-23,共23页
句子级语义分析是自然语言处理(NLP)的核心任务,面临复杂语义的表示问题。抽象语义表示(AMR)突破浅层局限,实现了领域无关的整句通用语义表示,具备准确表征句子完整语义的能力。因为AMR解析效果会影响下游NLP任务的表现,所以解析方法成... 句子级语义分析是自然语言处理(NLP)的核心任务,面临复杂语义的表示问题。抽象语义表示(AMR)突破浅层局限,实现了领域无关的整句通用语义表示,具备准确表征句子完整语义的能力。因为AMR解析效果会影响下游NLP任务的表现,所以解析方法成为近年的国内外研究热点。由于时效性因素,既有AMR综述未涉及新涌现的解析方法,亟需深度聚焦其前沿文献。该文首先采用CiteSpace工具分析了AMR的总体研究情况。相比英文AMR解析研究,中文AMR解析研究成果数量相对较少,尚有较大的发展空间。进而分析了AMR语料库发展和AMR解析面临的概念和概念关系识别、对齐以及融入结构信息等问题。根据不同的解析策略将解析方法分为4类,以问题为驱动,剖析了各类AMR解析方法的演进。最后,选择21个英文AMR解析器、7个中文AMR解析器,比较分析Smatch等各项实验指标。归纳实验结果发现,现有模型在学习复杂多语义关系方面亟待加强。该文通过理论和实证分析为研究者提供AMR解析方法的发展脉络和研究思路。 展开更多
关键词 抽象语义表示 解析方法 语料库 自然语言处理
下载PDF
基于转移神经网络的中文AMR解析 被引量:4
6
作者 吴泰中 顾敏 +3 位作者 周俊生 曲维光 李斌 顾彦慧 《中文信息学报》 CSCD 北大核心 2019年第4期1-11,共11页
抽象语义表示(abstract meaning representation,AMR)是一种领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应的AMR图。目前,中文AMR研究仍然处于起步阶段。该文结合中文AMR特性,... 抽象语义表示(abstract meaning representation,AMR)是一种领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应的AMR图。目前,中文AMR研究仍然处于起步阶段。该文结合中文AMR特性,采用基于转移神经网络的方法对中文AMR解析问题展开了试验性研究。首先,实现了一个基于转移解码方法的增量式中文AMR解析神经网络基线系统;然后,通过引入依存路径语义关系表示学习和上下文相关词语语义表示学习,丰富了特征的表示;最后,模型中应用序列化标注的模型实现AMR概念识别,优化了AMR概念识别效果。实验结果表明,该模型在中文AMR解析任务中达到了0.61的Smatch F1值,明显优于基线系统。 展开更多
关键词 抽象语义表示 转移神经网络 概念识别
下载PDF
基于加权AMR图的语义子图预测摘要算法 被引量:4
7
作者 明拓思宇 陈鸿昶 +1 位作者 黄瑞阳 柳杨 《计算机工程》 CAS CSCD 北大核心 2018年第10期292-297,302,共7页
方法多数停留在挖掘词与词之间的浅层语义关系,没有很好地利用词句之间的完整语义信息,为此,提出一种改进的语义子图预测摘要的算法。将原始文本转化为相应的抽象语义表示(AMR)图,融合成一个AMR总图,基于WordNet语义词典对其进行冗余信... 方法多数停留在挖掘词与词之间的浅层语义关系,没有很好地利用词句之间的完整语义信息,为此,提出一种改进的语义子图预测摘要的算法。将原始文本转化为相应的抽象语义表示(AMR)图,融合成一个AMR总图,基于WordNet语义词典对其进行冗余信息的过滤。在此基础上利用综合统计特征对不具有权值的AMR图节点赋予权值,通过筛选重要性程度高的部分构成语义摘要子图,并基于ROUGE指标和Smatch指标综合衡量生成摘要的质量。实验结果表明,与仅挖掘浅层语义关系的文本摘要基准算法相比,该算法ROUGE值和Smatch值明显提高。 展开更多
关键词 抽象语义表示图 语义摘要子图 语义信息 冗余信息 摘要评价指标
下载PDF
基于多任务预训练的AMR文本生成研究 被引量:2
8
作者 徐东钦 李军辉 +1 位作者 朱慕华 周国栋 《软件学报》 EI CSCD 北大核心 2021年第10期3036-3050,共15页
抽象语义表示(abstract meaning representation,简称AMR)文本生成的任务是给定AMR图,生成与其语义一致的文本.相关工作表明,人工标注语料的规模大小直接影响了AMR文本生成的性能.为了降低对人工标注语料的依赖,提出了基于多任务预训练... 抽象语义表示(abstract meaning representation,简称AMR)文本生成的任务是给定AMR图,生成与其语义一致的文本.相关工作表明,人工标注语料的规模大小直接影响了AMR文本生成的性能.为了降低对人工标注语料的依赖,提出了基于多任务预训练的AMR文本生成方法.特别地,基于大规模自动标注AMR语料,提出与AMR文本生成任务相关的3个预训练任务,分别是AMR降噪自编码、句子降噪自编码以及AMR文本生成任务本身.此外,基于预训练模型,在朴素微调方法的基础上,进一步提出了基于多任务训练的微调方法,使得最终模型不仅适用于AMR文本生成,同时还适用于预训练任务.基于两个AMR标准数据集的实验结果表明:使用0.39M自动标注数据,提出的预训练方法能够大幅度提高AMR文本生成的性能,在AMR2.0和AMR3.0上分别提高了12.27和7.57个BLEU值,性能分别达到40.30和38.97.其中,在AMR2.0上的性能为目前报告的最优值,在AMR3.0上的性能为目前为止首次报告的性能. 展开更多
关键词 amr amr文本生成 多任务预训练 序列到序列模型
下载PDF
AMR文本生成的数据扩充方法
9
作者 付叶蔷 李军辉 《计算机工程》 CAS CSCD 北大核心 2022年第5期91-97,共7页
在抽象语义表示(AMR)文本生成过程中,AMR图到文本形式的转换在很大程度上受语料规模的影响。提出一种简单有效的动态数据扩充方法,在已标注数据集规模有限的情况下提高AMR文本生成性能。将AMR文本生成模型解码端视作一个语言模型,使用... 在抽象语义表示(AMR)文本生成过程中,AMR图到文本形式的转换在很大程度上受语料规模的影响。提出一种简单有效的动态数据扩充方法,在已标注数据集规模有限的情况下提高AMR文本生成性能。将AMR文本生成模型解码端视作一个语言模型,使用单词级别的扩充方法,通过动态地对目标端单词进行随机替换,得到带噪声的数据,从而增强模型的泛化能力。在加载数据时,随机选择目标句子中的部分单词做噪声化处理,利用约束编码器预测被覆盖的单词并还原出原始语句,使模型具有更深层的语言表征能力。基于AMR2.0和AMR3.0英文标准数据集进行实验,结果表明,该方法可有效提升AMR文本生成系统性能,与未引入噪声的基准Transformer模型相比,能够获得更优的BLEU、Meteor和chrF++指标,其中BLEU值在人工标注语料场景下分别提升0.68和0.64,且在大规模自动标注语料场景下也能提升0.60和0.68。 展开更多
关键词 抽象语义表示 语料规模 amr文本生成 动态数据扩充 噪声
下载PDF
第二届中文抽象语义表示解析评测 被引量:1
10
作者 李斌 许智星 +3 位作者 肖力铭 周俊生 曲维光 薛念文 《中文信息学报》 CSCD 北大核心 2023年第6期33-43,共11页
抽象语义表示是近年来国内外句子语义解析领域的研究热点,国际上已举办了CoNLL2019和CoNLL2020两届跨语言的评测。中文抽象语义表示评测是CoNLL2020的五大任务之一,取得了接近英语的解析效果,但是评测数据和评测指标仍有较大改进空间。... 抽象语义表示是近年来国内外句子语义解析领域的研究热点,国际上已举办了CoNLL2019和CoNLL2020两届跨语言的评测。中文抽象语义表示评测是CoNLL2020的五大任务之一,取得了接近英语的解析效果,但是评测数据和评测指标仍有较大改进空间。为了推动中文抽象语义解析研究,该文在第二十一届中国计算语言学大会技术评测任务研讨会上组织了第二届评测,以新设计的Align-smatch指标为排名标准,采用改进的语义标注方案和标注语料库来进行评测。在基础测试集上,封闭模式的最高F1值为80.00%;盲测集上的表现则相比基础测试集下降了7个百分点左右。本次评测的最佳结果在MRP指标下比上届提高了2.66个百分点。统计发现,整体性能提升主要来源于概念之间的语义关系预测准确率的提高,而语义关系的对齐还有待提升。 展开更多
关键词 抽象语义表示 语义解析 评测指标 中文信息处理
下载PDF
汉语V+V序列关系识别研究
11
作者 李胜男 曲维光 +3 位作者 魏庭新 周俊生 顾彦慧 李斌 《计算机工程与应用》 CSCD 北大核心 2023年第5期289-296,共8页
“V+V”是现代汉语中的常见结构,能够形成兼语、连动等多种完全不同的句法结构,给句法和语义解析造成困难。针对“V+V”形成的句法结构类型和序列关系识别问题,设计并制定了一套语料库标注规范,以解决语料库中存在的“V+V”结构的嵌套... “V+V”是现代汉语中的常见结构,能够形成兼语、连动等多种完全不同的句法结构,给句法和语义解析造成困难。针对“V+V”形成的句法结构类型和序列关系识别问题,设计并制定了一套语料库标注规范,以解决语料库中存在的“V+V”结构的嵌套标注问题,并据此构建起一个包含5 381个兼语句子、7 987个连动句子,以及1 212个兼语连动嵌套句子的“V+V”语料库。提出一个基于BiLSTM-CRF和多头注意力机制的模型,能够同时识别结构中的多个动词和名词的句法、语义角色。相比于以往只研究单项识别兼语或者连动结构,该模型不仅可以同时识别兼语结构、连动结构,还可以解决兼语连动嵌套结构的识别问题。实验结果表明:该方法能够很好地解决“V+V”序列关系的识别问题,在测试集语料上达到92.12%的F1值。 展开更多
关键词 V+V序列关系 连动结构 兼语结构 中文抽象语义表示
下载PDF
抽象语义和全局交互的对话关系抽取方法
12
作者 李博博 荆心 仲尧 《西安工业大学学报》 CAS 2023年第5期503-511,共9页
为解决对话关系抽取任务中实体间关联语义信息稀疏、获取核心语义和触发线索困难等问题,提出一种新型的对话关系抽取模型。在对话文本中融入抽象语义表示来增强对话的核心语义,以解决在对话关系提取过程中出现的语义缺失和逻辑纠缠问题... 为解决对话关系抽取任务中实体间关联语义信息稀疏、获取核心语义和触发线索困难等问题,提出一种新型的对话关系抽取模型。在对话文本中融入抽象语义表示来增强对话的核心语义,以解决在对话关系提取过程中出现的语义缺失和逻辑纠缠问题;引入全局对话交互机制,通过对关键线索的捕捉来改善对话中有效信息稀疏的问题;通过增加明确的结构信息来进一步丰富实体间的关系特征,使模型能够更好地理解对话文本。实验结果表明:相较于基线模型BERTs,文中提出的模型在数据集DialogRE上的F 1和F 1C分别提升了5.5%和6.2%;相比于序列模型CNN、LSTM和BiLSTM,在对话关系抽取中准确率提高9%以上,效果显著。文中模型在复杂对话场景中的泛化能力更好,鲁棒性更强。 展开更多
关键词 对话关系抽取 抽象语义表示 全局对话交互 关系特征
下载PDF
基于图卷积神经网络和RoBERTa的物流订单分类 被引量:1
13
作者 王建兵 杨超 +2 位作者 刘方方 黄暕 项勇 《计算机技术与发展》 2023年第10期195-201,共7页
订单信息贯穿于物流供应链的所有环节,高效的订单处理是保障物流服务质量和运营效率的关键。面对日益增长的差异化客户物流订单,人工对订单分类费时、低效,难以满足现代物流要求的效率标准。为了提升物流订单分类的性能,该文提出了一种... 订单信息贯穿于物流供应链的所有环节,高效的订单处理是保障物流服务质量和运营效率的关键。面对日益增长的差异化客户物流订单,人工对订单分类费时、低效,难以满足现代物流要求的效率标准。为了提升物流订单分类的性能,该文提出了一种基于图卷积神经网络(graph convolution network,GCN)和RoBERTa预训练语言模型的订单分类方法。首先,基于物流订单文本的抽象语义表示(abstract meaning representation,AMR)结果和关键词构建全局AMR图,并使用图卷积神经网络对全局AMR图进行特征提取,获取订单文本的全局AMR图表示向量;其次,基于AMR算法构建物流订单文本分句的局部AMR图集合,然后使用堆叠GCN处理图集合得到订单文本局部AMR图表示向量;再次,使用RoBERTa模型处理物流订单文本,得到文本语义表示向量;最后,融合三种类型的文本表示向量完成物流订单分类。实验结果表明:该方法在多项评价指标上优于其他基线方法。消融实验结果也验证了该分类方法各模块的有效性。 展开更多
关键词 订单分类 图卷积神经网络 抽象语义表示 RoBERTa模型 特征提取
下载PDF
基于迁移学习与细粒度文本特征的未见关系链接研究
14
作者 徐红霞 《情报杂志》 北大核心 2023年第12期153-158,167,共7页
[研究目的]在知识海量增长的时代,知识图谱问答面临信息需求与知识图谱加速更新的现实情境,亟需探索关系链接模型在关系类型频繁更新时仍能保持链接效果的方法,实现未见关系类别与用户提问的精准语义匹配。[研究方法]针对模型泛化性不... [研究目的]在知识海量增长的时代,知识图谱问答面临信息需求与知识图谱加速更新的现实情境,亟需探索关系链接模型在关系类型频繁更新时仍能保持链接效果的方法,实现未见关系类别与用户提问的精准语义匹配。[研究方法]针对模型泛化性不足与灾难性遗忘问题,引入Adapter-Bert迁移学习框架;针对模型对辨别性语义部分的捕获能力不足问题,引入实体特征与问题变换,并将稠密向量与问句抽象意义形式化表示两种不同的语义表示方式进行融合。[研究结论]结果表明,方法在未见关系链接任务上的准确率达到98.80%,相较bert基线模型有显著提高,提升了未见关系链接的效果。 展开更多
关键词 自然语言处理 未见关系 迁移学习 细粒度文本特征 抽象意义表示
下载PDF
基于整数线性规划重构抽象语义图结构的语义摘要算法 被引量:3
15
作者 陈鸿昶 明拓思宇 +1 位作者 刘树新 高超 《电子与信息学报》 EI CSCD 北大核心 2019年第7期1674-1681,共8页
针对利用抽象语义(AMR)图来预测摘要子图存在的语义结构不完整问题,该文提出一种基于整数线性规划(ILP)重构AMR图结构的语义摘要算法。首先将数据预处理生成一个AMR总图;然后基于统计特征从AMR总图中抽取出摘要子图重要节点信息;最后利... 针对利用抽象语义(AMR)图来预测摘要子图存在的语义结构不完整问题,该文提出一种基于整数线性规划(ILP)重构AMR图结构的语义摘要算法。首先将数据预处理生成一个AMR总图;然后基于统计特征从AMR总图中抽取出摘要子图重要节点信息;最后利用ILP的方法来对摘要子图中节点关系进行重构,利用完整的摘要子图恢复生成语义摘要。实验结果表明,相比其他语义摘要方法,所提方法的ROUGE值和Smatch值都有显著提高,最多分别提高了9%和14%,该方法有利于提高语义摘要的质量。 展开更多
关键词 抽象语义图 语义摘要 摘要子图 语义结构 整数线性规划
下载PDF
面向中文抽象语义表示的复句研究综述 被引量:2
16
作者 魏庭新 曲维光 +1 位作者 宋丽 戴茹冰 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期849-858,共10页
抽象语义表示(AMR)是一种新型的句子语义表示方式.中文AMR在英文AMR的基础上,针对汉语特点,增加了复句逻辑语义关系的表示.中文AMR以句子为基本标注单位,以层次结构树形式表示各分句间的逻辑关系.由于允许论元共享,因此在树结构基础上... 抽象语义表示(AMR)是一种新型的句子语义表示方式.中文AMR在英文AMR的基础上,针对汉语特点,增加了复句逻辑语义关系的表示.中文AMR以句子为基本标注单位,以层次结构树形式表示各分句间的逻辑关系.由于允许论元共享,因此在树结构基础上形成图结构,从而对复句的语义表示更加完整全面.为了进一步研究中文AMR,对目前复句关系研究现状、复句及篇章关系资源的建设进行了综述,指出目前研究存在的问题,并提出将来工作研究的方向. 展开更多
关键词 中文抽象语义表示 复句 篇章关系
下载PDF
基于神经网络的连动句识别 被引量:1
17
作者 孙超 曲维光 +3 位作者 魏庭新 顾彦慧 李斌 周俊生 《中文信息学报》 CSCD 北大核心 2022年第2期12-21,共10页
连动句是具备连动结构的句子,是汉语中一种特殊的句法结构,在现代汉语中十分常见且使用频繁。连动句语法结构和语义关系都很复杂,在识别中存在许多问题,对此该文针对连动句的识别问题进行了研究,提出了一种基于神经网络的连动句识别方... 连动句是具备连动结构的句子,是汉语中一种特殊的句法结构,在现代汉语中十分常见且使用频繁。连动句语法结构和语义关系都很复杂,在识别中存在许多问题,对此该文针对连动句的识别问题进行了研究,提出了一种基于神经网络的连动句识别方法。该方法分两步:第一步,运用简单的规则对语料进行预处理;第二步,利用文本分类的思想,使用BERT编码,利用多层CNN与BiLSTM模型联合提取特征进行分类,进而完成连动句识别任务。在人工标注的语料上进行实验,实验结果达到92.71%的准确率,F_(1)值为87.41%。 展开更多
关键词 连动句 文本分类 神经网络 抽象语义表示
下载PDF
词汇语义表征编码中的抽象性和像似性关系研究 被引量:1
18
作者 林立红 卢姗 江婷婷 《宁波大学学报(人文科学版)》 2019年第2期68-72,共5页
词汇语义编码中存在抽象性和像似性两种制约关系。主要讨论了与词汇形义关系相关的三个问题:第一,抽象词义的来源问题,认为语言的内在属性和词汇分布规律是抽象词义知识的主要来源;第二,像似性和抽象性在词汇形义关系中的功能差异问题,... 词汇语义编码中存在抽象性和像似性两种制约关系。主要讨论了与词汇形义关系相关的三个问题:第一,抽象词义的来源问题,认为语言的内在属性和词汇分布规律是抽象词义知识的主要来源;第二,像似性和抽象性在词汇形义关系中的功能差异问题,像似性因其形义理据而有助于词汇学习或交际,而抽象性则有助于新范畴或形义关系的构建;第三,词汇形义关系中一直存在像似性和抽象性两种关系的竞争。任意性特征能赋予语言表述更多的抽象意义,抽象性也因此在词汇形义关系发展中占据上风。 展开更多
关键词 像似性 抽象性 语义表征 形义关系
下载PDF
基于概念关系对齐的中文抽象语义表示解析评测方法 被引量:3
19
作者 肖力铭 李斌 +4 位作者 许智星 霍凯蕊 冯敏萱 周俊生 曲维光 《中文信息学报》 CSCD 北大核心 2022年第1期21-30,38,共11页
抽象语义表示(Abstract Meaning Representation,AMR)是一种句子语义表示方法,能够将句子的语义表示为一个单根有向无环图。随着中文AMR语料库规模的扩大,解析系统的研究也相继展开,将句子自动解析为中文AMR。然而,现有的AMR解析评测方... 抽象语义表示(Abstract Meaning Representation,AMR)是一种句子语义表示方法,能够将句子的语义表示为一个单根有向无环图。随着中文AMR语料库规模的扩大,解析系统的研究也相继展开,将句子自动解析为中文AMR。然而,现有的AMR解析评测方法并不能处理中文AMR的重要组成部分——概念对齐和关系对齐信息,尤其是关系对齐中对应到有向弧上的虚词信息。因此,为了弥补中文AMR解析评测在这两个方面上的空缺,该文在Smatch指标的基础上加入了描写概念对齐和关系对齐的三元组,得到用以评测中文AMR的整体性指标Align-Smatch。选取100句人工标注语料与标准语料进行评测对照实验,结果显示,Align-Smatch有效兼容了对齐信息,对有向弧的评测比Smatch更合理。该文还提出了概念对齐指标、关系对齐指标、隐含概念指标共三个分项指标,以进一步评测中文AMR解析器在对齐子任务中的分项性能。 展开更多
关键词 抽象语义表示 评测方法 概念对齐 关系对齐 语义分析
下载PDF
基于关系对齐的汉语虚词抽象语义表示与分析 被引量:3
20
作者 戴玉玲 戴茹冰 +2 位作者 冯敏萱 李斌 曲维光 《中文信息学报》 CSCD 北大核心 2020年第4期21-29,共9页
虚词具有丰富的语法意义,对句子理解起着不可或缺的作用。虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用。为了表示虚词的句法语义信息,该文首先在抽象语义表示(abstract meaning representation,AMR)这种基于概念... 虚词具有丰富的语法意义,对句子理解起着不可或缺的作用。虚词的语言学研究成果丰富,但缺乏形式化表示,无法直接被计算机利用。为了表示虚词的句法语义信息,该文首先在抽象语义表示(abstract meaning representation,AMR)这种基于概念图的语义表示方法的基础上,增加了词语和概念关系的对齐信息,使得虚词对应于概念节点或节点之间的关系弧。其次,选取了语言规范的人教版小学语文课本8 587句作为语料,进行AMR的标注。然后,针对语料中24 801个虚词实例进行统计,发现介词、连词、结构助词对应概念间的关系,占虚词总数的58.80%;而语气词和体助词表示概念,占41.20%。这表明AMR可以动态地描写出虚词功能,为整句句法语义分析提供更好的理论与资源。 展开更多
关键词 虚词 抽象语义表示 关系对齐 语言知识库
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部