期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
A Development Study on the Ordering Distribution of Temporal Adverbial Clauses by Chinese EFL Learners Based on Dependency Treebank
1
作者 Wenwen LI Yijun LONG 《Chinese Journal of Applied Linguistics》 2022年第4期551-565,612,613,共17页
Temporal adverbial clause is an important language structure and exhibits different features in English and Chinese,which brings about difficulties for Chinese EFL learners.Based on the theory of Dependency Grammar,th... Temporal adverbial clause is an important language structure and exhibits different features in English and Chinese,which brings about difficulties for Chinese EFL learners.Based on the theory of Dependency Grammar,the study attempts to investigate the ordering distribution of temporal adverbial clauses by Chinese EFL learners at the beginning,intermediate and advanced levels.The results show that:1)Chinese EFL learners at different proficiencies tend to precede temporal adverbial clause to main clause.With the increase of proficiency,the postposition of temporal adverbial clauses by learners increases and is approaching to the ordering preference of target language.2)The ordering distribution of subordinators for temporal adverbial clauses by Chinese EFL learners is consistent with native English,showing a tendency of 100%preposition,which ascribes to the high frequency and salience of subordinators in English.3)MDD is one of the significant motivations that cause the preference of prepositional temporal adverbial clauses by Chinese EFL learners.As a kind of natural language,interlanguage has a unique cognitive mechanism which distinguishes from both native and target language.This study provides a more comprehensive theoretical reference for learners at different proficiencies to understand and learn temporal adverbial clauses,as well as data support from empirical research for language teaching. 展开更多
关键词 chinese EFL learners temporal adverbial clauses ordering distribution dependency treebank MDD
下载PDF
汉语中介语依存树库偏误标注研究 被引量:1
2
作者 钱隆 王治敏 《国际汉语教学研究》 2024年第1期81-94,共14页
偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理... 偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理念。该方案明确了偏误标注的总体原则和具体标注规则。总体原则包括顺序性原则和自然性原则,二者共同确保了标注过程中语料、依存关系与偏误的真实性、自然性和有效性。具体标注规则涵盖了字、词、句层面的偏误问题,方案为每个层面都提供了相应的标注策略。特别是在句层面,偏误标记在依存关系句法标注体系的基础上改编而来,确保了正确信息赋码和偏误信息赋码之间具有一定的一致性和逻辑关系。研究发现:句层面的偏误通常出现在修饰语与中心语的组合上,这一现象在“状语”“谓语”“定语”“补语”等依存关系上尤为突出;偏误会对依存语法分析产生影响,影响有横纵之分,纵向影响与偏误的类型直接相关,而横向影响则与词汇的结合力紧密相连。 展开更多
关键词 汉语中介语语料库 依存语法 依存树库 偏误分析 偏误标注
下载PDF
汉语隐式篇章关系识别 被引量:15
3
作者 孙静 李艳翠 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期111-117,共7页
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进... 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进行识别。实验结果显示,总正确率为62.15%,其中并列类识别效果最好,F1值达到75.26%。 展开更多
关键词 篇章结构分析 篇章关系 隐式关系识别 汉语篇章语料库
下载PDF
短语结构树库向依存结构树库转化研究 被引量:12
4
作者 李正华 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2008年第6期14-19,共6页
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库... 汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IR-CDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析,作为一种利用多种树库提高依存句法分析器性能的方法,短语转依存还存在很多需要深入研究的方面。 展开更多
关键词 计算机应用 中文信息处理 短语结构树库 依存结构树库 依存句法分析
下载PDF
基于清华汉语树库的复句关系词识别与分类研究 被引量:19
5
作者 李艳翠 孙静 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期118-124,共7页
根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词... 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。 展开更多
关键词 复句关系词 清华汉语树库 关系词识别 关系词分类
下载PDF
基于语法功能匹配的汉语句法分析算法 被引量:5
6
作者 卢俊之 陈小荷 +1 位作者 王东波 陈锋 《计算机工程与应用》 CSCD 北大核心 2008年第16期151-153,159,共4页
以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,... 以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,短语正确率与召回率在封闭测试和开放测试中分别达到75.17%、73.69%和65.06%、56.55%。 展开更多
关键词 句法分析 语法功能匹配 汉语树库 汉语分析器
下载PDF
面向机器翻译的藏语短语句法研究 被引量:5
7
作者 万福成 于洪志 +1 位作者 吴玺宏 何向真 《计算机工程与应用》 CSCD 北大核心 2015年第13期211-215,250,共6页
针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉... 针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉机器翻译系统。 展开更多
关键词 句法树库 藏语句法 藏汉机器翻译
下载PDF
基于依存语法构建多视图汉语树库 被引量:10
8
作者 邱立坤 金澎 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第3期9-15,共7页
树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的... 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。 展开更多
关键词 多视图树库 依存语法 短语结构语法
下载PDF
中文CCG树库的构建 被引量:12
9
作者 宋彦 黄昌宁 揭春雨 《中文信息学报》 CSCD 北大核心 2012年第3期3-8,21,共7页
组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个经... 组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个经济有效的解决方案是利用现有短语句法树库来自动生成CCG树库。该文提出在清华中文树库的基础上自动生成CCG树库的方法,在预定义的中文句型和基于清华树库的动词子范畴框架的支持下,通过标准转换算法,得到一个包含32 737句、超过35万词次的中文CCG树库。该树库通过手工和自动评价验证,又与已有文献所报告的多语种CCG树库构建工作比较,均证明该文所述方法的有效性。 展开更多
关键词 组合范畴语法 树库 中文句型 动词子范畴框架
下载PDF
基于中文宾州树库的浅层语义分析 被引量:4
10
作者 连乐新 胡仁龙 +1 位作者 杨翠丽 袁春风 《计算机应用研究》 CSCD 北大核心 2008年第3期674-676,680,共4页
采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径... 采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%。实验结果表明该方法对中文浅层语义分析工作是有效的。 展开更多
关键词 支持向量机 语义角色标注 中文宾州树库 中文PropBank
下载PDF
基于树库的现代汉语短语分布考察 被引量:6
11
作者 陈锋 陈小荷 《语言科学》 CSSCI 2008年第1期12-17,共6页
自动句法分析中需要确定短语实例的语法功能。文章试图在大规模汉语树库统计的基础上对汉语短语的语法功能分布进行定量分析,以此评估确定短语实例语法功能的三种方法。首先描述了汉语短语结构类充当11种语法功能的情况,然后对短语功能... 自动句法分析中需要确定短语实例的语法功能。文章试图在大规模汉语树库统计的基础上对汉语短语的语法功能分布进行定量分析,以此评估确定短语实例语法功能的三种方法。首先描述了汉语短语结构类充当11种语法功能的情况,然后对短语功能类充当各种语法功能进行统计与分析,最后使用了核心词来估计定中短语的语法功能。在比较分析了不同方法估计短语实例的语法功能的效果后得出结论:汉语短语的语法功能表现出一定的聚合性,但自动句法分析中以类标记来估计短语语法功能效果欠佳。 展开更多
关键词 自动句法分析 现代汉语 短语 语法功能 树库
下载PDF
齐普夫定律在中文短语知识中的呈现 被引量:5
12
作者 谢靖 陈静 王东波 《情报学报》 CSSCI 北大核心 2014年第1期11-22,共12页
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验... 本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。 展开更多
关键词 齐普夫定律 汉语短语构建 直接成分分析汉语短语知识汉语树库 最省力法则
下载PDF
中文信息处理的词法问题--以句本位语法图解树库构建为背景 被引量:5
13
作者 彭炜明 宋继华 俞士汶 《中文信息学报》 CSCD 北大核心 2014年第2期1-7,36,共8页
该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理据,并探讨了"... 该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理据,并探讨了"依句辨品"和"指称化"等汉语词类相关理论在中文信息处理中的实现方式。 展开更多
关键词 中文信息处理 临时造词 句本位语法 图解树库
下载PDF
基于DOP的汉语句法分析技术 被引量:4
14
作者 张玥杰 朱靖波 +1 位作者 张跃 姚天顺 《中文信息学报》 CSCD 北大核心 2000年第1期13-21,共9页
本文提出一种以DOP技术作为基本框架,同时利用基于相似的概率评估技术,实现汉语句法分析的方法。其中,对于输入语句,首先需要经过词汇层与词性层两层初选。然后,基于已构建知识源,获取输入语句的片段组合形式。最后,对输入语句与初选结... 本文提出一种以DOP技术作为基本框架,同时利用基于相似的概率评估技术,实现汉语句法分析的方法。其中,对于输入语句,首先需要经过词汇层与词性层两层初选。然后,基于已构建知识源,获取输入语句的片段组合形式。最后,对输入语句与初选结果进行相似性评估,完成输入语句的组合分析过程。为论证方法有效性,基于包含1 000 个语句的真实汉语语料构建知识源,并采用包含100 个语句的真实汉语语料作为测试集。实验表明,句法分析的各项指标都比较令人满意,可有效地实现汉语句法分析。 展开更多
关键词 DOP 汉语 句法分析 相似性评估 树库 片段库
下载PDF
基于中心驱动模型的宾州中文树库(CTB)句法分析 被引量:3
15
作者 曹海龙 赵铁军 李生 《高技术通讯》 CAS CSCD 北大核心 2007年第1期15-20,共6页
报告了依托宾州中文树库进行句法分析研究的最新进展。以著名的中心驱动模型为基础,首次在宾州中文树库5.0上进行了句法分析实验。同前人的工作相比,这次实验取得了更加成功的结果,极大缩小了中、英文句法分析的差距。在公共的测试... 报告了依托宾州中文树库进行句法分析研究的最新进展。以著名的中心驱动模型为基础,首次在宾州中文树库5.0上进行了句法分析实验。同前人的工作相比,这次实验取得了更加成功的结果,极大缩小了中、英文句法分析的差距。在公共的测试集上对句法分析器的性能进行了评价,对于正确分词和词性标注的句子,句法分析的精确率和召回率分别达到85.89%和85.61%。介绍了模型的实现过程,并进一步分析了模型中决策表和基本名词短语(BNP)两个关键环节在句法分析器中所起到的作用。本文的工作对于研制实用化句法分析系统具有一定参考价值。 展开更多
关键词 中心驱动模型 宾州中文树库 句法分析 结构模式识别
下载PDF
洛特卡现象在汉语词汇句法功能分布复杂度中的呈现 被引量:2
16
作者 王东波 朱丹浩 苏新宁 《情报学报》 CSSCI 北大核心 2012年第3期297-302,共6页
本文基于大规模清华树库,从中统计了汉语词汇在句法结构中充当的句法成分,获取了汉语词汇的句法功能分布,并给出了汉语词汇句法功能分布复杂度的定义。在对汉语词汇按照汉语词汇句法功能分布复杂度的高低排序后,本文发现两者之间呈... 本文基于大规模清华树库,从中统计了汉语词汇在句法结构中充当的句法成分,获取了汉语词汇的句法功能分布,并给出了汉语词汇句法功能分布复杂度的定义。在对汉语词汇按照汉语词汇句法功能分布复杂度的高低排序后,本文发现两者之间呈现洛特卡现象。本文的这一发现一方面揭示了汉语词汇在句法结构中的分布规律,对于汉语的研究具有重要的促进作用;另一方面对于中文信息处理中的词性标注、自动消歧和句法分析等研究具有重要的影响。 展开更多
关键词 洛特卡现象 汉语词汇 句法功能分布复杂度 清华树库
下载PDF
汉语句类依存树库的构建研究 被引量:3
17
作者 王慧兰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期25-30,共6页
以机器翻译领域为应用目标,以概念层次网络理论的语义网络和句类分析方法为理论基础,探讨句类依存树库构建的理论和标注实践等问题。详细描述了构建树库所需的概念类别标注集和句类关系标注集,并给出了句类依存树样例。
关键词 汉语树库 概念层次网络理论 句类依存树库
下载PDF
基于CABOSFV聚类算法的汉语词汇类别知识挖掘研究 被引量:1
18
作者 王东波 朱丹浩 《计算机科学》 CSCD 北大核心 2013年第7期211-215,共5页
在清华大学973汉语树库的基础上,根据汉语词汇的句法功能分布状况,构建了句法功能分布知识库。在构建的句法功能分布知识库基础上,使用CABOSFV(Clustering Algorithm Based On Sparse Feature Vector)聚类算法,从中挖掘了汉语词汇的类... 在清华大学973汉语树库的基础上,根据汉语词汇的句法功能分布状况,构建了句法功能分布知识库。在构建的句法功能分布知识库基础上,使用CABOSFV(Clustering Algorithm Based On Sparse Feature Vector)聚类算法,从中挖掘了汉语词汇的类别知识,并对这些类别知识逐一进行了分析。 展开更多
关键词 973汉语树库 句法分布功能 知识库 CABOSFV
下载PDF
基于依存树库的现代汉语名词语法功能的计量研究 被引量:5
19
作者 高松 《华文教学与研究》 CSSCI 2010年第2期54-60,共7页
现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语名词的句法功能进行了计量研究。文章把名词各句法功能,按其出现频率的高低,区分出典型功能和非典型功能,给出了名词句法功能... 现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语名词的句法功能进行了计量研究。文章把名词各句法功能,按其出现频率的高低,区分出典型功能和非典型功能,给出了名词句法功能的关联标记模式和概率配价模式,从而从定量分析的角度,对前人的研究结论进行了验证和补充,有助于更清晰地认识汉语名词的句法功能,并对对外汉语语法教学提供参考。 展开更多
关键词 名词 句法功能 依存树库 概率配价模式 关联标记模式 对外汉语教学
下载PDF
依存树库在语言学理论中的应用 被引量:1
20
作者 高松 《学术交流》 CSSCI 北大核心 2014年第1期145-148,共4页
基于语料库的研究方法是现代语言学的基础研究方法。依存树库这种带有词类和句法信息的语料库,不仅是计算语言学的资源,更是语言学理论研究的宝贵资源。依存树库在分析和理解句子的结构方面具有较大的优势,借助依存树库资源优势来进行... 基于语料库的研究方法是现代语言学的基础研究方法。依存树库这种带有词类和句法信息的语料库,不仅是计算语言学的资源,更是语言学理论研究的宝贵资源。依存树库在分析和理解句子的结构方面具有较大的优势,借助依存树库资源优势来进行语言学理论研究具有可行性和有效性。目前,学者们已初步摸索出将依存树库应用于语言学理论研究中的实现路径,随着对依存树库资源认识的不断深入,该资源的应用领域还需进一步拓展。 展开更多
关键词 汉语 依存树库 语言学理论
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部