期刊文献+
共找到90篇文章
< 1 2 5 >
每页显示 20 50 100
A Development Study on the Ordering Distribution of Temporal Adverbial Clauses by Chinese EFL Learners Based on Dependency Treebank
1
作者 Wenwen LI Yijun LONG 《Chinese Journal of Applied Linguistics》 2022年第4期551-565,612,613,共17页
Temporal adverbial clause is an important language structure and exhibits different features in English and Chinese,which brings about difficulties for Chinese EFL learners.Based on the theory of Dependency Grammar,th... Temporal adverbial clause is an important language structure and exhibits different features in English and Chinese,which brings about difficulties for Chinese EFL learners.Based on the theory of Dependency Grammar,the study attempts to investigate the ordering distribution of temporal adverbial clauses by Chinese EFL learners at the beginning,intermediate and advanced levels.The results show that:1)Chinese EFL learners at different proficiencies tend to precede temporal adverbial clause to main clause.With the increase of proficiency,the postposition of temporal adverbial clauses by learners increases and is approaching to the ordering preference of target language.2)The ordering distribution of subordinators for temporal adverbial clauses by Chinese EFL learners is consistent with native English,showing a tendency of 100%preposition,which ascribes to the high frequency and salience of subordinators in English.3)MDD is one of the significant motivations that cause the preference of prepositional temporal adverbial clauses by Chinese EFL learners.As a kind of natural language,interlanguage has a unique cognitive mechanism which distinguishes from both native and target language.This study provides a more comprehensive theoretical reference for learners at different proficiencies to understand and learn temporal adverbial clauses,as well as data support from empirical research for language teaching. 展开更多
关键词 Chinese EFL learners temporal adverbial clauses ordering distribution dependency treebank MDD
下载PDF
基于子句抽取的文本摘要自动提取算法 被引量:1
2
作者 朱兵兵 罗飞 +2 位作者 罗勇军 丁炜超 黄浩 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期114-120,共7页
TextRank算法及SWTextRank等改进算法在抽取式摘要生成中得到了广泛的应用,但它们都没有有效地解决抽取式摘要所存在的冗余性问题。为此,提出一种基于子句抽取的文本摘要自动提取算法(PTextRank)。首先,使用Sinica Treebank(STB)对每个... TextRank算法及SWTextRank等改进算法在抽取式摘要生成中得到了广泛的应用,但它们都没有有效地解决抽取式摘要所存在的冗余性问题。为此,提出一种基于子句抽取的文本摘要自动提取算法(PTextRank)。首先,使用Sinica Treebank(STB)对每个句子进行语法标记,进而基于子句设置抽取单元;接着,使用BERT(Bidirectional Encoder Representation from Transformers)构建标题和每个子句的特征向量,并计算子句特征向量间的相似性,将其存放在相似度矩阵中;最后结合子句位置、子句与标题的相似度等调整子句相似度矩阵,迭代计算直至收敛,进而选取得分最高的子句作为最终摘要。实验分析表明,PTextRank算法有效地避免了多个句子中存在的冗余信息,且相比于TextRank和SWTextRank,PTextRank生成摘要的准确率至少提高6%,同时生成的摘要质量更好。 展开更多
关键词 TextRank 摘要提取 冗余处理 Sinica treebank 篇章结构
下载PDF
藏语依存句法标注体系构建及应用
3
作者 泽仁卓玛 祁坤钰 夏吾措毛 《西北民族大学学报(自然科学版)》 2024年第3期80-88,共9页
文章在多语种句法树库研究成果的基础上,构建了1万句左右的藏语依存句法树库,在参考了国内外多种依存句法标注规范的同时,结合藏语语法理论和语言类型学特征,制定了一套藏语依存句法标注体系.文章采用语料统计方法,验证了本句法标注体... 文章在多语种句法树库研究成果的基础上,构建了1万句左右的藏语依存句法树库,在参考了国内外多种依存句法标注规范的同时,结合藏语语法理论和语言类型学特征,制定了一套藏语依存句法标注体系.文章采用语料统计方法,验证了本句法标注体系的有效性和合理性,对词性分布和依存关系进行了统计,归纳了依存结构在语料库中的分布规律,为自动句法分析提供了语言学数据支撑. 展开更多
关键词 藏语 依存树库 依存体系
下载PDF
汉语中介语依存树库偏误标注研究
4
作者 钱隆 王治敏 《国际汉语教学研究》 2024年第1期81-94,共14页
偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理... 偏误标注是汉语中介语依存树库标注的重要组成部分,然而现有的同类型树库尚未充分实现偏误标注与句法标注的有效融合。鉴于此,本文提出了一套汉语中介语依存树库偏误标注方案,旨在更好地贯彻中介语语料库“基础标注+偏误标注”的标注理念。该方案明确了偏误标注的总体原则和具体标注规则。总体原则包括顺序性原则和自然性原则,二者共同确保了标注过程中语料、依存关系与偏误的真实性、自然性和有效性。具体标注规则涵盖了字、词、句层面的偏误问题,方案为每个层面都提供了相应的标注策略。特别是在句层面,偏误标记在依存关系句法标注体系的基础上改编而来,确保了正确信息赋码和偏误信息赋码之间具有一定的一致性和逻辑关系。研究发现:句层面的偏误通常出现在修饰语与中心语的组合上,这一现象在“状语”“谓语”“定语”“补语”等依存关系上尤为突出;偏误会对依存语法分析产生影响,影响有横纵之分,纵向影响与偏误的类型直接相关,而横向影响则与词汇的结合力紧密相连。 展开更多
关键词 汉语中介语语料库 依存语法 依存树库 偏误分析 偏误标注
下载PDF
句式结构树库的自动构建研究
5
作者 谢晨晖 胡正升 +2 位作者 杨麟儿 廖田昕 杨尔弘 《中文信息学报》 CSCD 北大核心 2023年第2期15-25,共11页
句式结构树库是以句本位语法为理论基础构建的句法资源,对汉语教学以及句式结构自动句法分析等研究具有重要意义。目前已有的句式结构树库语料主要来源于教材领域,其他领域的标注数据较为缺乏,如何高效地扩充高质量的句法树库是值得研... 句式结构树库是以句本位语法为理论基础构建的句法资源,对汉语教学以及句式结构自动句法分析等研究具有重要意义。目前已有的句式结构树库语料主要来源于教材领域,其他领域的标注数据较为缺乏,如何高效地扩充高质量的句法树库是值得研究的问题。人工标注句法树库费时费力,树库质量也难以保证,为此,该文尝试通过规则的方法,将宾州中文树库(CTB)转换为句式结构树库,从而扩大现有句式结构树库的规模。实验结果表明,该文提出的基于树库转换规则的方法是有效的。 展开更多
关键词 句式结构 短语结构 树库构建
下载PDF
汉语隐式篇章关系识别 被引量:15
6
作者 孙静 李艳翠 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期111-117,共7页
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进... 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进行识别。实验结果显示,总正确率为62.15%,其中并列类识别效果最好,F1值达到75.26%。 展开更多
关键词 篇章结构分析 篇章关系 隐式关系识别 汉语篇章语料库
下载PDF
汉语树库的构建 被引量:32
7
作者 周强 张伟 俞士汶 《中文信息学报》 CSCD 北大核心 1997年第4期42-51,共10页
本文讨论了汉语树库构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后... 本文讨论了汉语树库构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后提出了构建大规模汉语树库的设想。 展开更多
关键词 树库 语料加工模型 语料库语言学 数据库系统
下载PDF
基于清华汉语树库的复句关系词识别与分类研究 被引量:19
8
作者 李艳翠 孙静 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期118-124,共7页
根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词... 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。 展开更多
关键词 复句关系词 清华汉语树库 关系词识别 关系词分类
下载PDF
短语结构树库向依存结构树库转化研究 被引量:12
9
作者 李正华 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2008年第6期14-19,共6页
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库... 汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IR-CDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析,作为一种利用多种树库提高依存句法分析器性能的方法,短语转依存还存在很多需要深入研究的方面。 展开更多
关键词 计算机应用 中文信息处理 短语结构树库 依存结构树库 依存句法分析
下载PDF
短语结构到依存结构树库转换研究 被引量:6
10
作者 周惠巍 黄德根 +1 位作者 钱志强 杨元生 《大连理工大学学报》 EI CAS CSCD 北大核心 2010年第4期609-613,共5页
为基于真实语料进行句法分析,构建了大规模的短语结构树库和依存结构树库,并尝试在两种结构的树库之间进行转换.讨论了宾州中文树库(Penn Chinese Treebank,CTB)中短语结构树库和依存结构树库的关系,并基于现代中文依存文法制定了中心... 为基于真实语料进行句法分析,构建了大规模的短语结构树库和依存结构树库,并尝试在两种结构的树库之间进行转换.讨论了宾州中文树库(Penn Chinese Treebank,CTB)中短语结构树库和依存结构树库的关系,并基于现代中文依存文法制定了中心子节点过滤表,依据该表将短语结构的CTB转换为依存结构树库.在CTB中随机抽取200句语料,转换正确率达到了99.50%.基于该转换得到的依存结构树库可以进一步进行中文依存关系解析的研究. 展开更多
关键词 句法分析 短语结构 依存结构 树库 转换
下载PDF
基于树库的现代汉语动词句法功能的计量研究 被引量:10
11
作者 高松 颜伟 刘海涛 《汉语学习》 CSSCI 北大核心 2010年第5期105-112,共8页
现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语动词的句法功能进行计量研究。把动词各句法功能,按其出现频率的高低区分出主要功能、次要功能和局部功能。从定量分析的角度,... 现代汉语自动句法分析需要词类句法功能的量化信息。本文基于概率配价模式理论,利用汉语依存树库,对现代汉语动词的句法功能进行计量研究。把动词各句法功能,按其出现频率的高低区分出主要功能、次要功能和局部功能。从定量分析的角度,对前人的研究结论进行验证和补充,有助于更清晰地认识动词的句法功能。本文也是对概率配价模式理论的进一步发展。 展开更多
关键词 依存树库 动词 句法功能 计量
下载PDF
中文CCG树库的构建 被引量:12
12
作者 宋彦 黄昌宁 揭春雨 《中文信息学报》 CSCD 北大核心 2012年第3期3-8,21,共7页
组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个经... 组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个经济有效的解决方案是利用现有短语句法树库来自动生成CCG树库。该文提出在清华中文树库的基础上自动生成CCG树库的方法,在预定义的中文句型和基于清华树库的动词子范畴框架的支持下,通过标准转换算法,得到一个包含32 737句、超过35万词次的中文CCG树库。该树库通过手工和自动评价验证,又与已有文献所报告的多语种CCG树库构建工作比较,均证明该文所述方法的有效性。 展开更多
关键词 组合范畴语法 树库 中文句型 动词子范畴框架
下载PDF
面向机器翻译的藏语短语句法研究 被引量:5
13
作者 万福成 于洪志 +1 位作者 吴玺宏 何向真 《计算机工程与应用》 CSCD 北大核心 2015年第13期211-215,250,共6页
针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉... 针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉机器翻译系统。 展开更多
关键词 句法树库 藏语句法 藏汉机器翻译
下载PDF
越南语短语树到依存树的转换研究 被引量:4
14
作者 李英 郭剑毅 +2 位作者 余正涛 毛存礼 线岩团 《计算机科学与探索》 CSCD 北大核心 2017年第4期599-607,共9页
依存句法分析是自然语言处理的一个关键环节,目前对于越南语短语结构树的研究比较多,而依存结构树的研究就显得十分薄弱。提出了一种新的方法,尝试结合越南语的语言特点和语法特征,利用中心子节点过滤表的思想与统计的方法将越南语的短... 依存句法分析是自然语言处理的一个关键环节,目前对于越南语短语结构树的研究比较多,而依存结构树的研究就显得十分薄弱。提出了一种新的方法,尝试结合越南语的语言特点和语法特征,利用中心子节点过滤表的思想与统计的方法将越南语的短语结构树转换成依存结构树。首先依据中文依存关系标注体系与越南语的语法规则,制定出依存关系列表;然后结合越南语的语言特点,制定出中心子节点过滤表,利用中心子节点过滤表的思想进行初步转化;最后使用依存关系标注器来进行依存关系标注。基于转换后得到的依存结构树,利用MSTParser工具进一步训练得到更多的越南语依存结构树。对实验结果进行了抽样评估,树库转换的准确率达到了89.4%,较好地解决了越南语由短语树到依存树的转换问题。 展开更多
关键词 句法分析 中心子节点过滤表 短语结构 依存结构 树库
下载PDF
融合越南语语言特征与改进PCFG的越南语短语树库构建 被引量:4
15
作者 李英 郭剑毅 +2 位作者 余正涛 线岩团 陈玮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期357-367,共11页
短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短... 短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成越南语短语树库的构建.实验结果表明,新的PCFG模型针对越南语短语树库构建的准确率达到了81.14%,相比传统PCFG模型以及基于最大熵的树库构建方法准确率明显提高了2%~3%. 展开更多
关键词 越南语 短语结构树 概率上下文无关文法 语法规则集 树库
下载PDF
多领域中文依存树库构建与影响统计句法分析因素之分析 被引量:7
16
作者 邱立坤 史林林 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第5期69-75,共7页
为提升依存分析并分析影响其精度的相关因素,该文构建了大规模中文通用依存树库和中等规模领域依存树库。基于这一系列树库,通过句法分析实验考察质量、规模、领域差异等因素对中文依存分析的影响,实验结果表明:(1)树库规模和质量均与... 为提升依存分析并分析影响其精度的相关因素,该文构建了大规模中文通用依存树库和中等规模领域依存树库。基于这一系列树库,通过句法分析实验考察质量、规模、领域差异等因素对中文依存分析的影响,实验结果表明:(1)树库规模和质量均与句法分析精度成正相关关系,质量应先于规模因素被优先考虑;(2)通用树库和领域树库之间的差异程度与前者对后者的替代性成相关关系;(3)两种树库混合使用的效果同样与领域差异有关。 展开更多
关键词 依存树库 领域迁移 依存句法分析
下载PDF
基于依存语法构建多视图汉语树库 被引量:10
17
作者 邱立坤 金澎 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第3期9-15,共7页
树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的... 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。 展开更多
关键词 多视图树库 依存语法 短语结构语法
下载PDF
基于语法功能匹配的汉语句法分析算法 被引量:5
18
作者 卢俊之 陈小荷 +1 位作者 王东波 陈锋 《计算机工程与应用》 CSCD 北大核心 2008年第16期151-153,159,共4页
以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,... 以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,短语正确率与召回率在封闭测试和开放测试中分别达到75.17%、73.69%和65.06%、56.55%。 展开更多
关键词 句法分析 语法功能匹配 汉语树库 汉语分析器
下载PDF
蒙古语短语结构树的自动识别 被引量:7
19
作者 乌兰 达胡白乙拉 +1 位作者 关晓炟 周强 《中文信息学报》 CSCD 北大核心 2014年第5期162-169,181,共9页
句法分析在自然语言信息处理中处于非常关键的位置。该文在描述蒙古语特点的同时提出蒙古语句子中短语结构分析难点。根据蒙古语自身特点,归纳了短语标注体系,建立了蒙古语短语树库,尝试实现蒙古语句子的自动分析。初次开发的句法分析... 句法分析在自然语言信息处理中处于非常关键的位置。该文在描述蒙古语特点的同时提出蒙古语句子中短语结构分析难点。根据蒙古语自身特点,归纳了短语标注体系,建立了蒙古语短语树库,尝试实现蒙古语句子的自动分析。初次开发的句法分析器的分析准确率达到62%,自动分析器的测试结果表明该分析器能在较大程度上辨别出短语结构类型,能生成句法树结构,但在短语结构内部关系方面的识别效果还有很大改进空间。最后总结了分析器近期能解决的相关问题。 展开更多
关键词 蒙古语 短语结构语法 句法树库 自动识别
下载PDF
基于中文宾州树库的浅层语义分析 被引量:4
20
作者 连乐新 胡仁龙 +1 位作者 杨翠丽 袁春风 《计算机应用研究》 CSCD 北大核心 2008年第3期674-676,680,共4页
采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径... 采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%。实验结果表明该方法对中文浅层语义分析工作是有效的。 展开更多
关键词 支持向量机 语义角色标注 中文宾州树库 中文PropBank
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部