期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
融入双语最大名词短语的机器翻译模型 被引量:9
1
作者 李业刚 梁丽君 +2 位作者 孙福振 王绍卿 于潇 《计算机应用研究》 CSCD 北大核心 2017年第5期1316-1320,共5页
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略... 在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。 展开更多
关键词 统计机器翻译 短语翻译模型 大名词短语 双语最大名词短语
下载PDF
基于双语协同训练的最大名词短语识别研究 被引量:5
2
作者 李业刚 黄河燕 +2 位作者 史树敏 鉴萍 苏超 《软件学报》 EI CSCD 北大核心 2015年第7期1615-1625,共11页
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的... 针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的两个不同的视图进行双语协同训练.在协同训练中,把双语对齐标注一致率作为标记置信度估计依据,进行增量标记数据的选择.实验结果表明:该算法显著提高了双语最大名词短语的识别能力,在跨领域测试和同领域测试中,F值分别比目前最好的最大名词短语识别模型提高了4.52%和3.08%. 展开更多
关键词 大名词短语 半监督学习 标注投射 双语协同训练 短语识别
下载PDF
引入混合特征的最大名词短语双向标注融合算法 被引量:4
3
作者 李业刚 黄河燕 鉴萍 《自动化学报》 EI CSCD 北大核心 2015年第7期1274-1282,共9页
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适... 最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适应性.实验证叨,釆用词和基本组块混合标注单元的标注方法对汉语最大名词短语的识别是有效的,并且其i E反向识别结果具有一定的互补性,在此基础上提出的基于"边界分歧"的双向序列标注融合算法恰能发掘双向识别的互补性,并达到较高的融合精度. 展开更多
关键词 大名词短语 双向标注 基本组块 混合特征
下载PDF
基于马尔科夫逻辑网的中文专利最大名词短语识别 被引量:2
4
作者 蔡东风 赵奇猛 +1 位作者 饶齐 王裴岩 《中文信息学报》 CSCD 北大核心 2016年第4期21-28,共8页
缺少标注语料和难以识别动词和名词类是阻碍中文专利最大名词短语识别的主要问题。针对上述问题,该文提出了一种基于马尔科夫逻辑网的中文最大名词短语识别方法。该方法避免对开放类的名词短语的识别,而将主要精力放在了相对封闭的分隔... 缺少标注语料和难以识别动词和名词类是阻碍中文专利最大名词短语识别的主要问题。针对上述问题,该文提出了一种基于马尔科夫逻辑网的中文最大名词短语识别方法。该方法避免对开放类的名词短语的识别,而将主要精力放在了相对封闭的分隔符的识别上,利用句子自身特征、领域迁移特征以及双语对齐特征来识别最大名词短语的边界。结果说明,双语信息较好地促进了动词、介词、连词等MNP边界的识别。MNP识别的F值可达83.27%。 展开更多
关键词 大名词短语 马尔科夫逻辑网 中文专利
下载PDF
从韵律结构看形容词 被引量:39
5
作者 沈家煊 《汉语学习》 CSSCI 北大核心 2011年第3期3-10,共8页
从韵律结构来看,形容词在语法结构中表现出跟名词和动词不一样的组合特点,令人费解。以往研究所存在的问题在于过分看重名、动、形之间的区别,预设汉语里名、动、形跟英语等印欧语一样是三个分立的、互斥的类。其实汉语里首先重视的是&q... 从韵律结构来看,形容词在语法结构中表现出跟名词和动词不一样的组合特点,令人费解。以往研究所存在的问题在于过分看重名、动、形之间的区别,预设汉语里名、动、形跟英语等印欧语一样是三个分立的、互斥的类。其实汉语里首先重视的是"大名词"和"摹状词"的区别,"大名词"里包括动词和形容词,"大名词"通过重叠形成"摹状词"。形容词的双音化是一种"准重叠"手段,双音形容词也具有摹状词的性质。按照这个新认识,在划分形容词内部小类的时候应该拿单音双音的区分作为首要的标准。最后说明汉语的形容词在"词类地图"上表现出来的多重性。 展开更多
关键词 韵律结构 形容词 大名词 摹状词 重叠 词类地图
下载PDF
从唐诗的迭映看汉语的语法
6
作者 孙杰 《当代修辞学》 北大核心 2024年第4期58-73,共16页
本文旨在从唐诗的迭映来重新认识汉语的语法,对迭映的概念、认知结构、句法结构、逻辑结构和形成原因进行考察,从语法学视角对迭映的概念重新进行界说。迭映的认知结构可以用视窗的提取与激活模型来解释,根据视窗的弹性和注意力的广度... 本文旨在从唐诗的迭映来重新认识汉语的语法,对迭映的概念、认知结构、句法结构、逻辑结构和形成原因进行考察,从语法学视角对迭映的概念重新进行界说。迭映的认知结构可以用视窗的提取与激活模型来解释,根据视窗的弹性和注意力的广度可以把迭映分为半句迭映和全句迭映。迭映的句法结构具有断连性、并置性和韵致性等特点。迭映的逻辑结构是“二元相关律逻辑”,属于成对关联词表达的二元倚变。迭映的形成来源于对话,可以看作是听话人对说话人的接话,迭映的前半部分和后半部分还是对言,听话人接续完成了说话人未说完的话,体现了语言的交互主观性。唐诗的迭映不仅可以佐证汉语的名词是“大名词”,而且还让我们认识到汉语的语法是“对言语法(大语法)”。 展开更多
关键词 唐诗 迭映 有序对 大名词 “对言语法”
原文传递
从唐诗的对偶看汉语的词类和语法 被引量:16
7
作者 沈家煊 《当代修辞学》 CSSCI 北大核心 2016年第3期1-12,共12页
本文从唐诗的对偶来反思我们对汉语词类和汉语语法的认识偏差。只有摆脱印欧语语法观念的束缚,重新认识汉语里名词和动词的关系,承认"名词"是包含动词形容词在内的"大名词",才能对唐诗里的词性对偶作出简洁而自洽... 本文从唐诗的对偶来反思我们对汉语词类和汉语语法的认识偏差。只有摆脱印欧语语法观念的束缚,重新认识汉语里名词和动词的关系,承认"名词"是包含动词形容词在内的"大名词",才能对唐诗里的词性对偶作出简洁而自洽的解释。唐诗的对偶不仅佐证汉语的名词是"大名词",而且使我们认识到,汉语的"语法"是个"大语法",它同时是"语义语法"、"语用语法"、"声韵语法",不是印欧语那种单纯的"语法"。 展开更多
关键词 唐诗 对偶 词类 大名词 大语法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部