期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
汉语中介语依存树库偏误标注研究
1
作者 钱隆 王治敏 《国际汉语教学研究》 2024年第1期81-94,共14页
偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理... 偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理念。该方案明确了偏误标注的总体原则和具体标注规则。总体原则包括顺序性原则和自然性原则,二者共同确保了标注过程中语料、依存关系与偏误的真实性、自然性和有效性。具体标注规则涵盖了字、词、句层面的偏误问题,方案为每个层面都提供了相应的标注策略。特别是在句层面,偏误标记在依存关系句法标注体系的基础上改编而来,确保了正确信息赋码和偏误信息赋码之间具有一定的一致性和逻辑关系。研究发现:句层面的偏误通常出现在修饰语与中心语的组合上,这一现象在“状语”“谓语”“定语”“补语”等依存关系上尤为突出;偏误会对依存语法分析产生影响,影响有横纵之分,纵向影响与偏误的类型直接相关,而横向影响则与词汇的结合力紧密相连。 展开更多
关键词 汉语中介语语料 依存语法 依存树库 偏误分析 偏误标注
下载PDF
多领域中文依存树库构建与影响统计句法分析因素之分析 被引量:7
2
作者 邱立坤 史林林 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第5期69-75,共7页
为提升依存分析并分析影响其精度的相关因素,该文构建了大规模中文通用依存树库和中等规模领域依存树库。基于这一系列树库,通过句法分析实验考察质量、规模、领域差异等因素对中文依存分析的影响,实验结果表明:(1)树库规模和质量均与... 为提升依存分析并分析影响其精度的相关因素,该文构建了大规模中文通用依存树库和中等规模领域依存树库。基于这一系列树库,通过句法分析实验考察质量、规模、领域差异等因素对中文依存分析的影响,实验结果表明:(1)树库规模和质量均与句法分析精度成正相关关系,质量应先于规模因素被优先考虑;(2)通用树库和领域树库之间的差异程度与前者对后者的替代性成相关关系;(3)两种树库混合使用的效果同样与领域差异有关。 展开更多
关键词 依存树库 领域迁移 依存句法分析
下载PDF
中英平行短语依存树库构建 被引量:1
3
作者 曹井香 黄德根 +1 位作者 王伟 王帅军 《大连理工大学学报》 EI CAS CSCD 北大核心 2014年第1期91-99,共9页
提出了面向翻译研究的融合短语结构树和依存分析的短语依存树库(phrase dependency treebank,PDT)的构建思想,阐述了中英平行PDT的构建方法.PDT采用"扁平结构优先"的短语结构树和"基于语义"的依存句法功能标注原则... 提出了面向翻译研究的融合短语结构树和依存分析的短语依存树库(phrase dependency treebank,PDT)的构建思想,阐述了中英平行PDT的构建方法.PDT采用"扁平结构优先"的短语结构树和"基于语义"的依存句法功能标注原则,有别于传统依存分析的完全二分法.大连理工大学中英平行PDT(DUT-CEPDT)的生语料取自文本质量较高的政府工作报告和白皮书及其官方译文.首先,对文本进行分词和词性标注之后,利用专为语言学家开发的辅助工具LingTreeConstructor构建中文和英文的单语PDT;之后,在两个单语PDT之间从篇章到词的节点进行对齐,这种多层次的立体对齐比只有词、短语或句子的单层对齐能提供更丰富的翻译知识;最后,依据FrameNet进行双语平行的框架语义角色标注.DUTCEPDT将为译员培训和机器翻译研究提供所需的标准语料. 展开更多
关键词 短语依存树库 机器翻译 节点对齐 句法功能 语义角色
下载PDF
基于依存树库的文本聚类研究 被引量:3
4
作者 高松 冯志伟 《中文信息学报》 CSCD 北大核心 2011年第3期59-63,共5页
文本聚类是信息检索的重要内容。为了避免使用计算过程复杂的聚类算法,并能从语言学角度对聚类特征和聚类结果进行分析和解释,该文提出了采用句法分布信息进行文本聚类的方法。在汉语依存树库中,得出10种具有显著差异的词类依存关系,以... 文本聚类是信息检索的重要内容。为了避免使用计算过程复杂的聚类算法,并能从语言学角度对聚类特征和聚类结果进行分析和解释,该文提出了采用句法分布信息进行文本聚类的方法。在汉语依存树库中,得出10种具有显著差异的词类依存关系,以其中5种依存关系作为聚类特征,访谈会话类和新闻播报类文本的相似度分别为71.98%和83.13%。实验结果验证了该方法利用依存关系对文本聚类的可行性和有效性。 展开更多
关键词 文本聚类 聚类特征 依存树库 依存关系 词类
下载PDF
面向机器翻译的句类依存树库构建及应用 被引量:4
5
作者 王慧兰 张克亮 《中文信息学报》 CSCD 北大核心 2015年第1期75-81,共7页
该文以汉英机器翻译为应用目标,以概念层次网络理论的语义网络和句类分析方法为理论基础,探讨了句类依存树库构建的理论和标注实践等问题,描述了构建树库所需的概念类别标注集和句类关系标注集。并通过与已有汉语树库进行对比,以汉语显... 该文以汉英机器翻译为应用目标,以概念层次网络理论的语义网络和句类分析方法为理论基础,探讨了句类依存树库构建的理论和标注实践等问题,描述了构建树库所需的概念类别标注集和句类关系标注集。并通过与已有汉语树库进行对比,以汉语显性轻动词句的标注为例,分析了汉语句类依存树库的特点。该文在应用层面定义了面向汉英机器翻译的融句法语义信息于一体的"句类依存子树到串"双语转换模板,尝试基于汉语句类依存树库提取汉英转换模板。 展开更多
关键词 机器翻译 概念层次网络理论 句类依存树库
下载PDF
基于依存树库的汉语句法计量研究 被引量:16
6
作者 刘海涛 《长江学术》 CSSCI 2008年第3期120-128,共9页
利用五个汉语依存句法树库,对汉语的依存距离和依存方向等句法属性进行了计量分析。结果表明:汉语的依存距离均值约为2.84,即在构成依存关系的两个词之间平均有1.84个词;汉语中40%—50%的依存关系不是在相邻的词之间形成的;在语言类型方... 利用五个汉语依存句法树库,对汉语的依存距离和依存方向等句法属性进行了计量分析。结果表明:汉语的依存距离均值约为2.84,即在构成依存关系的两个词之间平均有1.84个词;汉语中40%—50%的依存关系不是在相邻的词之间形成的;在语言类型方面,汉语是一种支配词置后略占优势的混合型语言,一种SV、VO和AdjN语言;汉语支配词居前的依存距离均值要明显大于支配词置后的依存距离均值。 展开更多
关键词 依存树库 汉语 依存距离 依存方向 语言类型 计量语言学
下载PDF
基于依存树库的现代汉语名词语法功能的计量研究 被引量:4
7
作者 高松 《华文教学与研究》 CSSCI 2010年第2期54-60,共7页
现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语名词的句法功能进行了计量研究。文章把名词各句法功能,按其出现频率的高低,区分出典型功能和非典型功能,给出了名词句法功能... 现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语名词的句法功能进行了计量研究。文章把名词各句法功能,按其出现频率的高低,区分出典型功能和非典型功能,给出了名词句法功能的关联标记模式和概率配价模式,从而从定量分析的角度,对前人的研究结论进行了验证和补充,有助于更清晰地认识汉语名词的句法功能,并对对外汉语语法教学提供参考。 展开更多
关键词 名词 句法功能 依存树库 概率配价模式 关联标记模式 对外汉语教学
下载PDF
汉语句类依存树库的构建研究 被引量:3
8
作者 王慧兰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期25-30,共6页
以机器翻译领域为应用目标,以概念层次网络理论的语义网络和句类分析方法为理论基础,探讨句类依存树库构建的理论和标注实践等问题。详细描述了构建树库所需的概念类别标注集和句类关系标注集,并给出了句类依存树样例。
关键词 汉语 概念层次网络理论 句类依存树库
下载PDF
维吾尔语依存树库构建及统计分析 被引量:1
9
作者 麦热哈巴.艾力 吐尔根.依布拉音 加米拉.吾守尔 《中文信息学报》 CSCD 北大核心 2018年第11期8-15,共8页
本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计... 本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计与实现。然后根据《维吾尔语依存树库标注手册》人工标注了3 400多条句子并从三个角度对依存树库信息做了统计分析。 展开更多
关键词 依存句法 依存树库 维吾尔语
下载PDF
依存树库在语言学理论中的应用 被引量:1
10
作者 高松 《学术交流》 CSSCI 北大核心 2014年第1期145-148,共4页
基于语料库的研究方法是现代语言学的基础研究方法。依存树库这种带有词类和句法信息的语料库,不仅是计算语言学的资源,更是语言学理论研究的宝贵资源。依存树库在分析和理解句子的结构方面具有较大的优势,借助依存树库资源优势来进行... 基于语料库的研究方法是现代语言学的基础研究方法。依存树库这种带有词类和句法信息的语料库,不仅是计算语言学的资源,更是语言学理论研究的宝贵资源。依存树库在分析和理解句子的结构方面具有较大的优势,借助依存树库资源优势来进行语言学理论研究具有可行性和有效性。目前,学者们已初步摸索出将依存树库应用于语言学理论研究中的实现路径,随着对依存树库资源认识的不断深入,该资源的应用领域还需进一步拓展。 展开更多
关键词 汉语 依存树库 语言学理论
下载PDF
基于依存树库的汉英语码转换中形容词的句法差异研究
11
作者 王琳 《外语研究》 CSSCI 北大核心 2020年第6期9-15,95,共8页
采用汉英语码转换的依存树库,以依存距离为测量指标。本研究考察汉英语码转换中形容词的句法差异并探究其原因,揭示形容词在真实汉英混杂话语中的句法特征。研究发现:作为支配词,汉英形容词主要支配主语和状语关系;作为从属词,主要充当... 采用汉英语码转换的依存树库,以依存距离为测量指标。本研究考察汉英语码转换中形容词的句法差异并探究其原因,揭示形容词在真实汉英混杂话语中的句法特征。研究发现:作为支配词,汉英形容词主要支配主语和状语关系;作为从属词,主要充当宾语、定语和状语;汉英形容词在单语和混杂依存中结合力存在差异;汉英形容词存在以依存距离为测量指标的句法差异,引起句法差异的主要原因在于:(1)语码转换的边缘性特征;(2)语块作为整体参与语码转换;(3)汉英状语和定语线性位置的差异。 展开更多
关键词 汉英语码转换 依存树库 形容词 依存距离 句法差异 语块
下载PDF
基于依存树库的中国英语学习者时间状语从句语序习得发展研究
12
作者 李雯雯 龙怡君 《Chinese Journal of Applied Linguistics》 2022年第4期551-565,612,613,共17页
本研究以依存句法为理论基础,考察初阶、中阶和高阶中国英语学习者时间状语从句的语序分布,研究发现:1)中国英语学习者倾向于将时间状语从句前置于主句,但随着二语水平的提升,学习者时间状语从句的后置率不断上升,趋近于目标语的语序分... 本研究以依存句法为理论基础,考察初阶、中阶和高阶中国英语学习者时间状语从句的语序分布,研究发现:1)中国英语学习者倾向于将时间状语从句前置于主句,但随着二语水平的提升,学习者时间状语从句的后置率不断上升,趋近于目标语的语序分布。2)中国英语学习者时间状语从句从属连词的语序分布与目标语一致,呈现100%前置的分布特征,这与从属连词在英语中使用频率高的凸显性特征有关。3)平均依存距离是中国英语学习者时间状语从句呈现前置倾向的动因之一。作为一种自然语言,中介语具有一种区别于母语和目标语的独特认知机制。本研究可为不同二语水平的学习者了解和学习时间状语从句提供更为全面的理论参考,为教师教学提供来自实证研究的数据支撑。 展开更多
关键词 中国英语学习者 时间状语从句 语序 依存树库 平均依存距离
下载PDF
中英文篇章依存树库构建与分析 被引量:1
13
作者 吴永芃 李素建 +2 位作者 秦沐坤 杨安 王厚峰 《中文信息学报》 CSCD 北大核心 2018年第1期75-82,共8页
该文在篇章依存关系的基础上,建立了小规模中英文篇章依存树库,并针对多核心关系问题、依存关系的选择、长篇章与复杂篇章的标注、层次结构信息的损失等标注过程中遇到的困难进行了分析研究,给出了解决方案。并对篇章依存树库进行了简... 该文在篇章依存关系的基础上,建立了小规模中英文篇章依存树库,并针对多核心关系问题、依存关系的选择、长篇章与复杂篇章的标注、层次结构信息的损失等标注过程中遇到的困难进行了分析研究,给出了解决方案。并对篇章依存树库进行了简单的统计分析,对中英文篇章中的异同进行了初步探索。 展开更多
关键词 篇章依存关系 篇章依存树库 篇章结构
下载PDF
借助汉-越双语词对齐语料构建越南语依存树库
14
作者 李发杰 余正涛 +2 位作者 郭剑毅 李英 周兰江 《中文信息学报》 CSCD 北大核心 2015年第6期69-74,共6页
由于对越南语的研究工作相对较少,因此还没有建立规模相对较大的依存树库。相对于已经拥有了形态丰富、语料成熟的汉语,越南语的依存句法分析要困难得多,所以该文提出了一种借助汉-越双语词对齐语料构建越南语依存树库的方法。首先对汉... 由于对越南语的研究工作相对较少,因此还没有建立规模相对较大的依存树库。相对于已经拥有了形态丰富、语料成熟的汉语,越南语的依存句法分析要困难得多,所以该文提出了一种借助汉-越双语词对齐语料构建越南语依存树库的方法。首先对汉语-越南语句子对进行词对齐处理,然后对汉语句子进行依存句法分析。最后结合越南语本身的语言特点和有关的语法规则将汉语的依存关系通过汉-越双语词对齐关系映射到越南语句子中,从而生成越南语的依存树库。实验表明,该方法简化了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间。实验结果表明,该方法相比采用机器学习的方法准确率明显提高。 展开更多
关键词 越南语依存树库 汉语依存句法分析 汉-越语言对齐关系
下载PDF
基于语义关系的藏语依存树库构建研究 被引量:1
15
作者 夏吾吉 黄鹤鸣 华却才让 《电子技术与软件工程》 2021年第20期128-130,共3页
本文针对藏语自然语言处理所面临的缺乏数据资源库问题,从藏语的依存语法和语义结构特点出发,确定了藏语语义依存课粒度,探讨了藏语语义依存树库的构建方法和构建过程。并对原有的研究成果进行了优化和分层归类,提出了新的藏语语义依存... 本文针对藏语自然语言处理所面临的缺乏数据资源库问题,从藏语的依存语法和语义结构特点出发,确定了藏语语义依存课粒度,探讨了藏语语义依存树库的构建方法和构建过程。并对原有的研究成果进行了优化和分层归类,提出了新的藏语语义依存分析体系,同时人工构建了规模达2106句的藏语语义依存树库,对藏语自然语言处理的发展提供了新的数据资源。 展开更多
关键词 依存树库 藏语语义 依存语法 语义关系
下载PDF
基于依存树库现代汉语“在”字计量研究
16
作者 毕鹏 林宽 《齐齐哈尔大学学报(哲学社会科学版)》 2016年第4期98-101,共4页
现代汉语中的"在"字兼有介词,动词和副词三种词性。本研究从依存语法观点出发,运用计量语言学的方法分析"在"在新闻语体语料中的使用情况,通过词频计算,句法分析等手段得出以下结论:现代汉语中"在"字主... 现代汉语中的"在"字兼有介词,动词和副词三种词性。本研究从依存语法观点出发,运用计量语言学的方法分析"在"在新闻语体语料中的使用情况,通过词频计算,句法分析等手段得出以下结论:现代汉语中"在"字主要用作介词,"在"字介词短语在句中充当状语,定语和补语;较长的"在"字介词短语在使用中常被置于句首;"V+在"结构从句法角度可以被当成复合动词分析。 展开更多
关键词 依存树库 “在”字 句法功能 计量
下载PDF
藏语依存树库的构建技术研究 被引量:7
17
作者 头旦才让 尼玛扎西 完么扎西 《高原科学研究》 2018年第3期97-103,共7页
藏语依存树库的构建是藏文信息处理研究中的关键技术之一。文章在收集和整理1万句藏语分词标注语料基础上,研究了藏语依存树库构建技术和方法,根据指定的藏语依存句法标注集和藏语依存句法标注工具,建立了规模为1万句、词语总数为119,51... 藏语依存树库的构建是藏文信息处理研究中的关键技术之一。文章在收集和整理1万句藏语分词标注语料基础上,研究了藏语依存树库构建技术和方法,根据指定的藏语依存句法标注集和藏语依存句法标注工具,建立了规模为1万句、词语总数为119,510个、平均句长为12个词的藏语依存树库,并对建立的藏语依存树库进行了词类分布统计。 展开更多
关键词 藏语 依存树库 句法标注
下载PDF
汉语依存树库中方位词的计量考察 被引量:1
18
作者 高松 钱隆 《现代语文》 2022年第2期54-58,共5页
方位词是现代汉语中的一个特殊词类,关于方位词的研究大多基于定性分析展开。利用汉语依存树库资源,对方位词的分类和范围、语法功能、词性归属等问题进行计量分析,可以验证和补充现有的研究结论。根据方位词的使用频率,区分出核心方位... 方位词是现代汉语中的一个特殊词类,关于方位词的研究大多基于定性分析展开。利用汉语依存树库资源,对方位词的分类和范围、语法功能、词性归属等问题进行计量分析,可以验证和补充现有的研究结论。根据方位词的使用频率,区分出核心方位词和非核心方位词。考察方位词的语法功能分布,总结方位词的语法特点。并通过对比方位词与其他词类的语法特征,来阐述方位词的词性归属。这将有利于更加深入地认识方位词,量化信息丰富了以往单纯依靠定性分析的研究,也可以为现代汉语自动句法分析提供参考。 展开更多
关键词 方位词 语法特征 依存树库 计量
下载PDF
基于依存树库的特蕾莎梅和习近平的新年致辞句子的语量研究
19
作者 苏冬莹 《海外英语》 2019年第16期111-112,116,共3页
新年致辞是在每一年的新年到来之际,各个国家的领导人向广大人民群众传达信息的一个重要方式,致辞的内容缜密、严谨、充实,但是随着时代的发展,致辞的内容往往和过去的一年中发生的重大事件相关。领导人发表新年致辞能更好地拉近与人民... 新年致辞是在每一年的新年到来之际,各个国家的领导人向广大人民群众传达信息的一个重要方式,致辞的内容缜密、严谨、充实,但是随着时代的发展,致辞的内容往往和过去的一年中发生的重大事件相关。领导人发表新年致辞能更好地拉近与人民大众之间的距离。因此该文将以依存语法为理论基础,利用自建的中英两国领导人2019年新年贺词的依存句法树库,对英语新年贺词的绝对依存距离、相邻词的依存关系、依存方向以及平均句长、平均每段句子数量以及每句所含字数分别进行了计量统计分析。进而对特蕾莎梅和习近平的新年贺词句长进行对比研究,并得出结论。 展开更多
关键词 依存树库 计量分析 依存语法 依存距离
下载PDF
藏文祈使句依存树库的构建研究
20
作者 索朗拉姆 李铂钧 群诺 《信息与电脑》 2021年第7期186-188,共3页
随着当前社会的发展,对藏文句法分析的研究逐渐引起众多学者的关注。笔者收集和整理了1500多条祈使句的语料库,并根据依存文法的相关公理、《三十颂文法》、《字性组织法》以及藏文祈使句的句法构造特点对1000个藏文祈使句进行依存关系... 随着当前社会的发展,对藏文句法分析的研究逐渐引起众多学者的关注。笔者收集和整理了1500多条祈使句的语料库,并根据依存文法的相关公理、《三十颂文法》、《字性组织法》以及藏文祈使句的句法构造特点对1000个藏文祈使句进行依存关系的分析和标注,设立了25种依存关系的句法标注规范,并构建了1000句的依存树库,为以后的藏文句法分析奠定了基础。 展开更多
关键词 依存句法 依存树库 藏文
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部