-
题名动词次范畴英汉论元对应关系获取
被引量:1
- 1
-
-
作者
朱聪慧
赵铁军
韩习武
郑德权
-
机构
教育部-微软语言语音重点实验室
计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2010年第2期91-95,121,共6页
-
基金
国家自然科学基金资助项目(60773069,60973169)
-
文摘
动词次范畴是根据句法行为对动词的进一步划分,它是由核心动词和一系列论元组成。其相关研究在英汉等多种语言方面都取得了较好的成果,但跨语言之间的研究还很少。该文提出了一种基于主动学习策略的英汉动词次范畴论元对应关系自动获取方法,这种方法可以在双语平行语料上,几乎不需要任何先验的语言学知识的情况下,自动获取英汉论元的对应关系。然后我们将这些对应关系加入了统计机器翻译系统。实验结果表明,融合了英汉动词次范畴论元对应关系的SMT系统在性能上有明显的提升,证明了自动抽取的对应关系的有效性,也为SMT提供了新的研究方向。
-
关键词
人工智能
机器翻译
动词次范畴化
跨语言论元对应关系
自动获取
统计机器翻译
-
Keywords
artificial intelligence
machine translation
verb subcategorization
cross-lingual argument crrespon- dence
automatic acquisition
statistical machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉英动词次范畴化对应类型的统计分析
- 2
-
-
作者
韩习武
赵铁军
-
机构
黑龙江大学计算机科学技术学院
哈尔滨工业大学计算机科学技术学院
-
出处
《计算机科学》
CSCD
北大核心
2010年第3期230-233,共4页
-
基金
国家自然科学基金(60773069
60873169)资助
-
文摘
基于大规模句子级,对齐双语语料库进行了统计分析汉英动词次范畴化对应类型的系统性实验。首先以语言学量度为启发,应用双重最大似然检验的统计过滤方法初步估计了654种汉英次范畴化对应类型的概率分布;然后根据汉英句法特点对次范畴化对应类型进行了语言学分类;最后针对每一种对应类型及其背景语料进行了基于支持向量机的语言学类别标注和统计可靠性分析。
-
关键词
汉英动词次范畴化
统计分析
支持向量机
-
Keywords
Chinese-English verb subcategorization, Statistical analysis, SVM
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名动词次范畴化形式描写的语义与句法
- 3
-
-
作者
韩习武
-
机构
黑龙江大学计算语言学研究所
-
出处
《语言文字应用》
CSSCI
北大核心
2008年第4期126-132,共7页
-
基金
国家自然科学基金项目(批准号:60773069)
国家博士后科研基金项目(编号:20060400246)
黑龙江省博士后科研基金项目(编号:LBH-Z06217)
-
文摘
动词次范畴化现象普遍存在于自然语言的语义和句法形式之中,是计算语言学研究的关键性内容之一。恰当的动词次范畴化形式描写将有利于自然语言信息的逻辑表述、计算机自动处理以及动词词汇化知识的获取和应用。本文试从语言认知和言语生成的角度讨论动词次范畴化形式描写中语义和句法的关系,提出属性划分和子类对应的解决方案。
-
关键词
动词次范畴化
形式描写
语义属性
句法属性
-
Keywords
verb subcategorization
formalization
semantic attributes
syntactic attributes
-
分类号
H146
[语言文字—汉语]
-
-
题名汉英动词次范畴化对应关系自动获取
- 4
-
-
作者
韩习武
-
机构
黑龙江大学计算语言学研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第6期9-13,28,共6页
-
基金
国家自然科学基金(the National Natural Science Foundation of Chinaunder Grant No.60773069)
中国博士后一等资助项目(No.20060400246)
黑龙江省博士后资助项目(No.LBH-Z06217)。
-
文摘
动词次范畴化及其自动获取的研究已经在英、汉等很多语种里取得了较好的成果,但跨语言的次范畴化研究仍然很少,并且不成体系。描述了基于汉英双语语料库的统计分析并获取跨语言次范畴化对应关系的系统化实验。首先,根据双语词典和句法相似度识别谓词可能对齐的句对;然后,应用双重最大似然检验的统计过滤方法自动获取了654种次范畴化框架对应类型。实验结果分析表明,这些对应类型具备统计和句法意义上的协调性。
-
关键词
动词次范畴化
跨语言对应关系
自动获取
-
Keywords
verb subcategorization
cross-lingual relations
acquisition
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名词语搭配识别中的动词次范畴问题
- 5
-
-
作者
冯敏萱
-
机构
南京师范大学文学院
-
出处
《南京师范大学文学院学报》
CSSCI
2011年第3期62-65,共4页
-
基金
江苏省哲学社会科学基金项目(项目号:10YYB007)
国家社会科学青年基金项目(项目号:10CYY021)
-
文摘
现代汉语词语搭配识别是汉语信息处理的研究热点。动词次范畴作为一种重要的语法信息,也是词语搭配识别的一种有效的先验知识,将成为统计方法和语义分析的有益补充。本文将动词划分为24个次范畴,并给出了次范畴标记,主张通过清华树库、语法信息词典等现有研究成果,将定性与定量研究相结合,构建搭配专用的动词次范畴信息库,进一步提高语法知识在搭配识别中的利用效率。
-
关键词
词语搭配
动词次范畴
信息处理
-
Keywords
words collocation
sub- categories of verb
information processing
-
分类号
H03
[语言文字—语言学]
-
-
题名基于加权子序列核函数的次范畴论元分析
- 6
-
-
作者
朱聪慧
赵铁军
韩习武
郑德权
-
机构
哈尔滨工业大学教育部-微软语言语音重点实验室
黑龙江大学计算机科学与技术学院
-
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2010年第2期127-132,共6页
-
基金
国家自然科学基金(60773069
60973169)资助项目
-
文摘
为提高汉语动词次范畴化框架(SCFs)的分析性能,提出了一种新的次范畴论元分析方法。该方法引入了基于间隙加权子序列的核函数,以传统规则的右部作为分类类别,将规则左部作为问题输入空间,将原本规则推导的问题转化为机器学习问题。由于间隙加权子序列核函数可以考虑跨距离的词之间的依赖关系,加之机器学习方法的引入,使得论元识别精度从55.16%提到了93.43%,并且极大提高了次范畴整句获取精度。
-
关键词
汉语动词次范畴(SCF)
论元分析
主动学习
间隔加权子序列
-
Keywords
Chinese verb subeategorization frame (SCF), argument analysis, active learning strategies, weighted gap subsequenee kernel
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名俄语副动词在汉语里的类似结构及其英语表达方式
- 7
-
-
作者
刘天贤
-
机构
太原理工大学
-
出处
《山西煤炭管理干部学院学报》
2012年第3期101-102,共2页
-
文摘
副动词是俄语动词的一种特殊形式。它相当于汉语里的连动结构、介词短语"在……时候"、具有原因、目的、条件、让步意义的并列复句和表示行为方式的次动词谓语。英语通常译作分词或分词短语。
-
关键词
俄语
语法
副动词
并列复句
次动词谓语
-
分类号
H35
[语言文字—俄语]
-
-
题名“被”字句的派生问题研究
- 8
-
-
作者
林燕
徐兴胜
-
机构
吉首大学外国语学院
-
出处
《河北北方学院学报(社会科学版)》
2008年第5期29-32,共4页
-
基金
吉首大学科研项目(07JD055)
-
文摘
回顾以往对汉语的"被"字句派生问题的研究,发现相关文献中对"被"字句的假设存在不少问题,文章提出将"被"分析为《最简方案》框架下的次动词的假设,"被"字句通过"被"字的移位而生成,长短被字句以同一模式生成,两者具有类似的句法结构,其派生可通过次动词的基本特征来解释。
-
关键词
长短被字句
“被”字句
移位
次动词
-
Keywords
long and short passive constructions
construction
movement
sub-verb
-
分类号
H146
[语言文字—汉语]
-
-
题名汉语“被”字句句法结构研究综述
- 9
-
-
作者
王世龙
-
机构
华南农业大学外国语学院
-
出处
《现代语文(下旬.语言研究)》
2011年第4期12-14,共3页
-
基金
2008年广东省哲学社会科学十一五规划项目[学科共建项目]:基于语段理论的汉英被动结构生成研究[08GK-02]
-
文摘
本文对汉语"被"字句句法结构研究问题做了比较详尽的概括和总结。不同时期,不同句法学家对"被"字结构有不同的见解。"被"字被认为是介词、动词、不完全动词、次动词、功能语类词等。围绕格的赋予和两种不同的"被"字句式,学界做出了各种解释,这些争论推动了句法理论的发展。
-
关键词
“被”字句
次动词
介词
功能语类
动词
-
分类号
H146
[语言文字—汉语]
-
-
题名中国大学生英语暂时句法歧义加工的定性研究
被引量:5
- 10
-
-
作者
晏小琴
-
机构
北京外国语大学中国外语教育研究中心 北京
-
出处
《山东外语教学》
2007年第5期36-41,共6页
-
文摘
本研究用有声思维和访谈方法研究了6名中国大学生实时加工三类英语暂时句法歧义句的情况,发现三类经典歧义句都引起了强烈的花园路径效应和巨大的加工困难,大部分英语歧义句都无法解歧。学习者主要通过翻译加工句子。二语歧义句加工具有特定的不同特征。动词范畴信息等语言因素、母语思维和学习水平等非语言因素使得二语歧义消解过程十分复杂。
-
关键词
暂时句法歧义
花园路径效应
有声思维
动词次范畴信息
-
Keywords
temporary syntactic ambiguity
garden-path effects
think-aloud
subcategorization
-
分类号
H03
[语言文字—语言学]
-
-
题名哈萨克语中汉语介词“对”(对于)的译法探
被引量:2
- 11
-
-
作者
李绍年
-
出处
《语言与翻译》
1985年第2期49-54,共6页
-
文摘
在翻译实践中,我们会经常碰见由汉语介词“对”(对于)构成的介词结构所组成的句子——“对”字句。它和“被”字句、“把”字句、“是”字句分别构成了汉语常见的几种句型。“对”字句在译成哈语时有哪几种表现形式。
-
关键词
汉语介词
哈萨克语
“把”字句
“被”字句
间接宾语
现代汉语语法
次动词
实用汉语语法
巴金选集
新疆简史
-
分类号
H1
[语言文字—汉语]
-
-
题名“之”的介词说质疑
- 12
-
-
作者
王远维
-
出处
《佛山科学技术学院学报(社会科学版)》
1988年第1期20-24,共5页
-
文摘
古汉语中间于定语和中心词的“之”,在词类的归属问题上,语法界长期存有不同的看法。本文认为,从具休的语言实际出发,“之”的语法意义、语法功能都很不同于一般的介词,它们之间小同大异,把“之”归入介词是勉强的。“之”是结构助词,它相当于现代汉语的结构助词“的“。而不是介词。
-
关键词
结构助词
现代汉语
介宾结构
介字
次动词
语法关系
汉语语法
指示代词
动字
能愿动词
-
分类号
H1
[语言文字—汉语]
-