-
题名树邻接语法
被引量:2
- 1
-
-
作者
冯志伟
-
机构
教育部语言文字应用研究所
杭州师范大学
-
出处
《外语研究》
CSSCI
北大核心
2012年第3期1-6,112,共6页
-
基金
国家社会科学基金"计算语言学研究方法"(项目号03BYY019)的资助
-
文摘
树邻接语法是一种基于树图形的形式语法,本文比较了这种语法与短语结构语法的异同,介绍了树邻接语法的基本组成要素及其操作模式,重点介绍了接插和替换两种操作,并介绍了推导关系树、树集合、串语言等概念,最后介绍树邻接语法的新发展———词汇化树邻接语法。
-
关键词
树邻接语法
词汇化树邻接语法
接插
替换
推导关系树
-
Keywords
Tree Adjoining Grammar(TAG)
Lexicalized Tree-Adjoining Grammar(LTAG)
adjoining
substitution
derivation tree
-
分类号
H087
[语言文字—语言学]
-
-
题名句法分析中基于词汇化树邻接语法的数据增强方法
- 2
-
-
作者
陈鸿彬
张玉洁
徐金安
陈钰枫
-
机构
北京交通大学计算机与信息技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第10期27-37,44,共12页
-
基金
国家自然科学基金(61876198,61976015,61976016)。
-
文摘
句法分析是自然语言处理的基础技术,主流的由数据驱动的神经网络句法分析模型需要大规模的标注数据,但是通过人工标注扩展树库成本很高,因此如何利用现有标注树库进行数据增强成为研究焦点。在汉语句法分析的数据增强任务中,对于给定的标注树库,要求数据增强所生成的句子满足如下条件:第一,要求生成句具有多样化且完整的句法树结构;第二,要求生成句具有合理的语义。对此,我们首次提出基于词汇化树邻接语法的数据增强方法。针对第一个需求,该文设计实现基于词汇化树邻接语法的词汇化树抽取算法与句法树合成算法,基于该语法可以在句法树之间进行“接插”和“替换”的操作,从而推导生成新的句法树,并且用语言学的知识保证生成句符合语法规则且具有完整的句法树结构。针对第二个需求,该文利用语言模型对生成句进行语义合理性评估,选取语义合理的句子作为最终的增强数据,从而获取高质量的标注树库。我们以汉语为例开展研究,在汉语树库CTB5上进行句法分析的数据增强评测实验。实验结果显示,在小样本(CTB5的20%)实验中,通过该方法得到的增强数据使依存句法分析和成分句法分析的精度分别提高1.39%和2.14%。在鲁棒性实验中,该文通过构建扩展测试集进行评测实验,在扩展测试集上,通过该方法得到的增强数据使依存句法分析和成分句法分析的精度分别提高1.43%和0.44%,表现出更好的鲁棒性。
-
关键词
依存句法分析
成分句法分析
词汇化树邻接语法
语言模型
数据增强
-
Keywords
dependency parsing
constituency parsing
lexicalized tree adjoining grammar
language model
data augmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词汇化树邻接语法研究述评及中文应用初探
被引量:1
- 3
-
-
作者
仲夏
张志平
王惠临
-
机构
中国科学技术信息研究所
-
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第5期35-42,共8页
-
基金
国家科技支撑计划项目“多语言信息服务环境关键技术研究与应用”(项目编号:2006BAH03B02)
中国科学技术信息研究所学科建设课题基金项目“语言技术与知识技术”(项目编号:2009DP01-6)的研究成果之一
-
文摘
重点介绍近10年来国外词汇化树邻接语法的新进展和新应用,总结其理论的发展沿革,指出该语法的研究意义及在汉语中的应用价值,并分析说明其在汉语中的研究现状和研究难点,最后探讨和展望该语法在汉语中的应用发展方向。
-
关键词
自然语言处理
词汇化树邻接语法
句法分析
-
Keywords
Natural language processing Lexicalized tree adjoining grammar Parsing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
G252
[文化科学—图书馆学]
-