期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
融合零指代识别的篇章级机器翻译
1
作者 汪浩 李军辉 贡正仙 《中文信息学报》 CSCD 北大核心 2023年第8期25-33,共9页
在汉语等其他有省略代词习惯的语言中,通常会省略可从上下文信息推断出的代词。尽管以Transformer为代表的的神经机器翻译模型取得了巨大的成功,但这种代词省略现象依旧使神经机器翻译模型面临很大的挑战。该文在Transformer模型基础上... 在汉语等其他有省略代词习惯的语言中,通常会省略可从上下文信息推断出的代词。尽管以Transformer为代表的的神经机器翻译模型取得了巨大的成功,但这种代词省略现象依旧使神经机器翻译模型面临很大的挑战。该文在Transformer模型基础上提出了一个融合零指代识别的翻译模型,并引入篇章上下文来丰富指代信息。具体地,该模型采用联合学习的框架,在翻译模型基础上,联合了一个分类任务,即判别句子中省略代词在句子所表示的成分,使得模型能够融合零指代信息辅助翻译。通过在中英对话数据集上的实验,验证了该文所提出方法的有效性,与基准模型相比,翻译性能提升了1.48个BLEU值。 展开更多
关键词 零指代 篇章级机器翻译 联合学习
下载PDF
基于马尔可夫逻辑的中文零指代消解 被引量:5
2
作者 宋洋 王厚峰 《计算机研究与发展》 EI CSCD 北大核心 2015年第9期2114-2122,共9页
中文零指代消解问题包括零指代项的识别和零指代项的消解2个相互关联的子任务.传统的方法在解决该问题时,往往不考虑2个子任务间的关联关系,比如识别出的零指代项必须被消解以及发生消解的必须是零指代项等约束.基于马尔可夫逻辑网络模... 中文零指代消解问题包括零指代项的识别和零指代项的消解2个相互关联的子任务.传统的方法在解决该问题时,往往不考虑2个子任务间的关联关系,比如识别出的零指代项必须被消解以及发生消解的必须是零指代项等约束.基于马尔可夫逻辑网络模型可以将零指代项的识别和零指代项的消解2个子任务融合在统一的机器学习框架下进行联合推断与联合学习,采用局部规则分别针对零指代项的识别和消解进行预测,采用全局规则描述这2个子任务间的关联关系.基于OntoNotes3.0的中文数据集上的实验结果显示,基于马尔可夫逻辑网络的联合学习模型相比于独立学习模型以及多个baseline方法能够获得更好的实验效果. 展开更多
关键词 马尔可夫逻辑网络 中文零指代消解 零指代项识别 联合学习 全局规则 局部规则
下载PDF
汉语格律诗与其英语译文中的人称照应对比 被引量:7
3
作者 赵宏宇 《外语教学》 CSSCI 北大核心 2006年第4期7-10,共4页
本文通过对比分析汉语格律诗及其英译文中人称照应表现的形式和特点,发现人称照应作为一种衔接手段在汉英诗歌语篇中表现出极大差异。汉语格律诗人称照应一般采用零形式,但在其英译文中人称代词使用频率极高。
关键词 人称照应 人称代词 零形回指 衔接
下载PDF
汉语篇章层级对第三人称回指的影响 被引量:7
4
作者 李榕 《汉语学习》 CSSCI 北大核心 2013年第5期71-77,共7页
本文通过分析真实语料总结出汉语篇章层级和第三人称回指形式之间的对应规律:零形回指一般出现在小句层,而代词或NP出现在篇章句层。本文还提出了第三人称回指形式使用的篇章层级序列,并且讨论了叙述文中常见的回指形式出现顺序。
关键词 第三人称代词回指 零形回指 篇章层级 话题链
下载PDF
指代研究在口译教学中的运用
5
作者 修月祯 《外语教学》 北大核心 2003年第4期62-64,共3页
中英两种语言在指称词运用上存在差异 ,口译课中有必要有针对性地进行训练。本文归纳了中译英中零照应句主语的增补方式和英译汉时指代的处理 。
关键词 口译教学 语境 零照应 指代词
下载PDF
基于中英文可比较语料的中文零指代消解 被引量:3
6
作者 杨紫怡 贡正仙 +1 位作者 孔芳 周国栋 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期279-286,共8页
针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句,重新定义句子间隔,并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进... 针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句,重新定义句子间隔,并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究。在Onto Notes5.0语料上的实验结果表明,与目前性能最好的系统相比,新提出的基于中英对等语料的中文零指代方法取得更好的性能。 展开更多
关键词 中文零指代 双语 对等句 识别 消解
下载PDF
基于树核函数的中文零指代项识别研究 被引量:3
7
作者 黄李伟 孔芳 +1 位作者 朱巧明 周国栋 《计算机科学》 CSCD 北大核心 2011年第1期214-216,250,共4页
介绍了一种基于树核函数的零指代项识别方法,并给出了具体的实现系统。为了能够裁剪出包含零指代项的句法结构树,首先对CTB的语料进行了相关的人工标注,构建了一个基准语料库;然后,提出了3种不同的裁剪策略,获得了零指代项的结构化信息... 介绍了一种基于树核函数的零指代项识别方法,并给出了具体的实现系统。为了能够裁剪出包含零指代项的句法结构树,首先对CTB的语料进行了相关的人工标注,构建了一个基准语料库;然后,提出了3种不同的裁剪策略,获得了零指代项的结构化信息,生成了零指代项分类器;最后,构建了一个基于规则的原型系统,作为研究内容的实验对象。实验结果显示,提出的基于树核函数的零指代项识别方法获得的识别率明显优于基于规则的原型系统。 展开更多
关键词 零指代 零指代项识别 树核函数 机器学习
下载PDF
篇章视角的汉语零指代语料库构建 被引量:1
8
作者 孔芳 葛海柱 周国栋 《软件学报》 EI CSCD 北大核心 2021年第12期3782-3801,共20页
零指代是汉语中普遍存在的一个现象,在汉英机器翻译、文本摘要以及阅读理解等众多自然语言处理任务中都起着重要作用,目前已成为自然语言处理领域的一个研究热点.提出了篇章视角的汉语零指代表示体系,从服务于篇章分析的角度出发,首先... 零指代是汉语中普遍存在的一个现象,在汉英机器翻译、文本摘要以及阅读理解等众多自然语言处理任务中都起着重要作用,目前已成为自然语言处理领域的一个研究热点.提出了篇章视角的汉语零指代表示体系,从服务于篇章分析的角度出发,首先以基本篇章单元为考察对象,判别其是否包含零元素;再根据零元素在基本篇章单元中承担的角色将零元素划分成主干类和修饰类两类;接着以段落对应的篇章修辞结构树为考察指代关系的基本单元,依据先行词与零元素间的位置关系将指代关系分成基本篇章单元内和基本篇章单元间两种,并针对基本篇章单元间的指代关系,根据零元素对应的先行词的状况将指代关系分成实体类、事件类、组合类和其他等4类;最后,基于篇章视角的汉语零指代表示体系,选取汉语树库CTB、连接词驱动的汉语篇章树库CDTB和Onto Notes语料中重叠的325篇文本进行了汉语零指代的标注,构建了服务于篇章分析的汉语零指代语料库.一方面,借助系统检测来说明所提出的表示体系合理有效,构造的语料库质量上乘;另一方面构建了完整的汉语零指代消解基准平台,从可计算的角度验证了所构建的汉语零指代语料库能够为篇章视角的汉语零指代研究提供必要的支撑. 展开更多
关键词 零指代 语料库构建 篇章分析 基本篇章单元 零元素
下载PDF
从认知视角解析指向主语修饰语的零形回指
9
作者 吴秀龙 刘洋 《海外英语》 2013年第9X期263-264,共2页
主语所有格修饰语在话题链中能够以零形代词的形式出现,其中重要的原因之一在于表示所有格的物主代词表达出一种主体和周围世界相互作用和联系的概念内容。物主代词组成的限定词组不仅蕴含(替代)说话的主体,而且还隐喻着主体的基本功能... 主语所有格修饰语在话题链中能够以零形代词的形式出现,其中重要的原因之一在于表示所有格的物主代词表达出一种主体和周围世界相互作用和联系的概念内容。物主代词组成的限定词组不仅蕴含(替代)说话的主体,而且还隐喻着主体的基本功能。由物主代词所激发出的主体信息使得话题链能够继续发展下去。同时先行语引导的名词短语所指示的"部分"附带激活了所有格所代表的整体,进一步推动了话题链的发展。 展开更多
关键词 零形回指 主语修饰语 物主代词 隐喻 转喻
下载PDF
基于栈式降噪自编码和词嵌入表示的维吾尔语零指代消解
10
作者 秦越 禹龙 +4 位作者 田生伟 冯冠军 吐尔根.依布拉音 艾斯卡尔.艾木都拉 赵建国 《中文信息学报》 CSCD 北大核心 2018年第5期56-64,共9页
针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点... 针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点,抽取14项针对零指代消解任务的手工设计特征;然后融合word embedding特征和14项hand-crafted特征作为栈式降噪自编码的输入,最后经过无监督逐层贪婪的预训练和有监督的微调过程,使用softmax进行分类完成维吾尔语零指代消解任务。实验结果表明,与传统栈式自编码、浅层机器学习的支持向量机和人工神经网络相比,栈式降噪自编码的F值分别提高了4.450%、10.032%和8.140%,实验结果验证了该方法的有效性及栈式降噪自编码在任务中具备挖掘高层面鲁棒性语义特征的优势。 展开更多
关键词 维吾尔语 零指代消解 栈式降噪自编码 词嵌入表示
下载PDF
基于深度学习的中文零代词识别
11
作者 王立凯 曲维光 +3 位作者 魏庭新 周俊生 顾彦慧 李斌 《南京师范大学学报(工程技术版)》 CAS 2021年第4期19-26,共8页
针对中文零代词识别任务,提出了一种基于深度神经网络的中文零代词识别模型.首先,通过注意力机制利用零代词的上下文来帮助表示缺省的语义信息.然后,利用Tree-LSTM挖掘零代词上下文的句法结构信息.最后,利用语义信息和句法结构信息的融... 针对中文零代词识别任务,提出了一种基于深度神经网络的中文零代词识别模型.首先,通过注意力机制利用零代词的上下文来帮助表示缺省的语义信息.然后,利用Tree-LSTM挖掘零代词上下文的句法结构信息.最后,利用语义信息和句法结构信息的融合特征识别零代词.实验结果表明,相对于以往的零代词识别方法,该方法能够有效提升识别效果,在中文OntoNotes5.0数据集上的F1值达到63.7%. 展开更多
关键词 深度学习 中文零指代 零代词识别 Tree-LSTM 注意力机制
下载PDF
“第1人称+V+了_2”格式的将然语义解读
12
作者 叶琼 《华文教学与研究》 CSSCI 2014年第3期85-91,共7页
一些动词在进入"第1人称+V+了2"格式后,可以零语境或依托语境表达行为将然,本文概括了此类动词的特点,并揭示了该类动词进入将然义"第1人称+V+了2"格式后所表现出的共通的意象图式。就"第1人称+V+了2"格... 一些动词在进入"第1人称+V+了2"格式后,可以零语境或依托语境表达行为将然,本文概括了此类动词的特点,并揭示了该类动词进入将然义"第1人称+V+了2"格式后所表现出的共通的意象图式。就"第1人称+V+了2"格式整体的将然意义,文章分别从听话人语义解读、说话人语义建构两个立场进行了分析,并阐释了该格式"近时将来"、"意志将来"的将来时特征。 展开更多
关键词 “第1人称+V+了2” 将然 零标记 近时将来 意志将来
下载PDF
英汉前指现象对比 被引量:1
13
作者 钱晗颖 王蕾 《河北理工大学学报(社会科学版)》 2005年第4期156-158,共3页
通过对《围城》及其英译文中前指现象的比较分析,发现英语较多使用代词,起前指作用,而汉语则较多使用零词语,起前指作用;而进一步得出不能把英汉两种语言差异和文化差异的研究割裂开来的结论。
关键词 前指现象 零前指 代词 英汉对比
下载PDF
《围城》中第三人称指称衔接的英汉对比分析 被引量:3
14
作者 徐菲菲 《北京航空航天大学学报(社会科学版)》 2013年第5期95-102,共8页
指称衔接在英语和汉语语篇中普遍存在,但具体使用方式有很大区别。以韩礼德的英语衔接理论和许余龙的汉语衔接理论为基础,结合徐赳赳等对篇章回指的制约因素的探讨,选取《围城》及其英译本第一章为语料,使用AntConc软件做定量分析,系统... 指称衔接在英语和汉语语篇中普遍存在,但具体使用方式有很大区别。以韩礼德的英语衔接理论和许余龙的汉语衔接理论为基础,结合徐赳赳等对篇章回指的制约因素的探讨,选取《围城》及其英译本第一章为语料,使用AntConc软件做定量分析,系统研究了英文第三人称(指人)指称衔接在对应的汉语句子中的处理方式。分析得出,英语使用第三人称代词衔接时,汉语中常常省略人称代词,即采用零回指的衔接手段,这是因为汉语受语言内部的语法限制较少,而英语在语言内部受到严格的语法限制;此外,汉语中零回指和代词指称的选择受到不同制约因素的限制。 展开更多
关键词 《围城》 指称衔接 第三人称代词 英汉对比 零回指
下载PDF
基于预训练语言模型的中文零指代消解
15
作者 申资卓 《信息通信》 2020年第5期41-43,共3页
中文零指代消解是一项具有挑战的自然语言处理任务,其目的是确定文档中零代词真正的指代对象,从而使得机器能够正确理解含有零代词的文本的含义。现有的基于深度学习的中文零指代消解模型受限于训练数据规模的限制,其性能依然较低。该... 中文零指代消解是一项具有挑战的自然语言处理任务,其目的是确定文档中零代词真正的指代对象,从而使得机器能够正确理解含有零代词的文本的含义。现有的基于深度学习的中文零指代消解模型受限于训练数据规模的限制,其性能依然较低。该文则将在大规模语料中训练得到的预训练语言模型的信息融入到中文零指代消解模型中,并通过在OntoNotes-5.0数据集上的实验验证了该文提出的方法的有效性。 展开更多
关键词 深度学习 中文零指代消解 预训练语言模型
下载PDF
零形代词的设定对汉语指代消解的影响 被引量:4
16
作者 孙珊珊 许余龙 段嫚娟 《外国语》 CSSCI 北大核心 2015年第6期12-20,共9页
本文讨论了"零形代词"在汉语中的定义和识别标准,认为零形代词不仅包括谓词和述谓结构中缺省的支配成分和主语,还应包括为保持话题链中的话题延续而省略的零形代词。通过对比分析两种零形代词定义对汉语指代消解结果的影响,... 本文讨论了"零形代词"在汉语中的定义和识别标准,认为零形代词不仅包括谓词和述谓结构中缺省的支配成分和主语,还应包括为保持话题链中的话题延续而省略的零形代词。通过对比分析两种零形代词定义对汉语指代消解结果的影响,本文得出如下结论:添加零形话题后,1)零形代词的消解准确率得到显著提高;2)代词的消解准确率在以小句切分语句时也有显著提高,但在以自然句切分语句时并无影响。原因分析显示,添加零形话题有利于突显话题链中话题的延续,体现局部篇章中的实体连贯,从而有利于零形代词的消解和代词在小句中的消解。 展开更多
关键词 关键词:零形代词 指代消解 向心理论零形代词 指代消解 向心理论 语句
原文传递
先秦汉语的零代词 被引量:3
17
作者 李佐丰 《中国语文》 CSSCI 北大核心 2019年第3期259-277,382,共20页
零代词是先秦汉语一种常见的语法单位,一般属于第三人称代词,可以用作主语、宾语和补语。零代词可以用作"其""之"不能充当的主语;用作宾语和补语时,它跟"之"存在分工,而跟"于是、于此"不同。... 零代词是先秦汉语一种常见的语法单位,一般属于第三人称代词,可以用作主语、宾语和补语。零代词可以用作"其""之"不能充当的主语;用作宾语和补语时,它跟"之"存在分工,而跟"于是、于此"不同。认识零代词对于汉语史的研究有重要启示。 展开更多
关键词 零代词 汉语史研究
原文传递
汉语第三人称回指语形式眼动阅读实验 被引量:10
18
作者 李榕 Pim MAK Ted SANDERS 《中国语文》 CSSCI 北大核心 2016年第1期83-92,127-128,共10页
回指是篇章连贯的主要手段之一,受多种因素影响。前人文献较少关注回指语形式对回指的影响,而这正是汉语篇章的特色之一。本文运用眼动实验的范式考察汉语母语者阅读理解第三人称回指语形式(第三人称代词或零形式)的差异,包括认知加工... 回指是篇章连贯的主要手段之一,受多种因素影响。前人文献较少关注回指语形式对回指的影响,而这正是汉语篇章的特色之一。本文运用眼动实验的范式考察汉语母语者阅读理解第三人称回指语形式(第三人称代词或零形式)的差异,包括认知加工时间的长短以及是否影响回指对象的判定,并对比相关语言学研究,旨在揭示汉语母语者理解篇章回指的机制。实验发现:1)汉语母语者阅读话题接续的篇章时,零形式快于代词;而阅读话题转换的篇章时,代词快于零形式。可见母语者对篇章连贯性和回指语形式之间的对应关系非常敏感,篇章连贯性和回指语形式之间有相互作用。2)不管是零形式还是代词,母语者都倾向认为其回指主语,即回指语形式不影响回指对象的判定,但读者会根据篇章的展开理解并修正对回指的判断,证明篇章回指的理解是一个动态的调整过程。 展开更多
关键词 第三人称代词回指 第三人称零形回指 篇章连贯性 显性代词失利效应
原文传递
汉语论元否定句的类型归属及其库藏背景 被引量:1
19
作者 刘丹青 《语言教学与研究》 CSSCI 北大核心 2022年第1期38-53,共16页
论元否定指以否定形式表达论元(主要是宾语)量化值为零的命题。Kahrel(1996)通过跨语言考察,归纳论元否定的表达手段有5种类型,其中汉语有类型1(John not bought something)和类型5(There is nothing that John bought.),主要依据是&qu... 论元否定指以否定形式表达论元(主要是宾语)量化值为零的命题。Kahrel(1996)通过跨语言考察,归纳论元否定的表达手段有5种类型,其中汉语有类型1(John not bought something)和类型5(There is nothing that John bought.),主要依据是"我没买什么"。本文指出"什么"否定句不是论元零量化句。汉语论元否定句有6种构式,代表性的构式是光杆名词宾语否定句(我没买东西),须补进类型系统。其他5种(我什么都没买;我没买一点儿/一分钱东西;我一点儿都没买;我没买任何东西;我没有买一切东西)各有原因而不能视为论元否定句的代表。文末分析了光杆名词宾语句成为汉语代表性论元否定句的库藏背景。 展开更多
关键词 论元否定句类型 零量化 无指代词 无定代词 任指代词 光杆名词语 库藏背景
原文传递
上古汉语的零形代词
20
作者 魏培泉 《中国语文》 CSSCI 北大核心 2020年第4期413-430,511,共19页
现代汉语是一种代词省略的语言,句子的主语和宾语经常使用零形代词;上古汉语也经常使用零形代词,只是它的零形代词分布与现代汉语颇有不相对应之处。现代汉语零形代词常用为主语和动词的宾语,却很少用作介词宾语;上古汉语零形代词常用... 现代汉语是一种代词省略的语言,句子的主语和宾语经常使用零形代词;上古汉语也经常使用零形代词,只是它的零形代词分布与现代汉语颇有不相对应之处。现代汉语零形代词常用为主语和动词的宾语,却很少用作介词宾语;上古汉语零形代词常用为主语,也常用作介词宾语,但较少用作动词宾语。现代汉语和上古汉语在零形代词的使用只有在主语地位上是比较相似的,只不过上古汉语的主语使用零形代词更为发达。那么是什么样的机制造成这样的不同,上古汉语的代词省略是否在类型上与现代汉语有所分别,这是本文所探讨的问题。本文分别就上古汉语的零形代词作主语、动词宾语、介词宾语来探讨零形代词的分布状况与使用条件,并尝试由此来回答上述的问题。 展开更多
关键词 零形代词 代词 代词省略的语言 回指 上古汉语
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部