期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
汉英篇章结构平行语料库的对齐标注评估 被引量:4
1
作者 冯文贺 李艳翠 +1 位作者 任函 周国栋 《中文信息学报》 CSCD 北大核心 2017年第3期86-93,共8页
汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是"结构对齐、关系对齐"。该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连... 汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是"结构对齐、关系对齐"。该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连接词对齐、关系角色与中心对齐等对齐标注任务的评估方法,并给出评估分析。实验表明,对齐标注是构建汉英篇章结构平行语料库的合理、有效工作方式。 展开更多
关键词 篇章结构 平行语料库 对齐标注 结构对齐 对齐评估
下载PDF
并列结构的依存分析与连词的控制语地位 被引量:9
2
作者 冯文贺 姬东鸿 《语言科学》 CSSCI 北大核心 2011年第2期168-181,共14页
从依存的角度看,连词是一种虚谓词,它支配着两个具有-N属性的论元。基于这一认识,不仅传统语法下的各种并列结构得到了统一的依存表示,复句及有关特殊句式也得到了统一的依存表示。并列结构的各种语法形式差异及有关语义问题均可根据依... 从依存的角度看,连词是一种虚谓词,它支配着两个具有-N属性的论元。基于这一认识,不仅传统语法下的各种并列结构得到了统一的依存表示,复句及有关特殊句式也得到了统一的依存表示。并列结构的各种语法形式差异及有关语义问题均可根据依存结构上具体结点的异同及性质差异得到一定解释。对谓词控制更全面的论断是:单命题句中实义谓词是根控制语("中心");多命题句中,连词是根控制语("中心")。 展开更多
关键词 并列结构 依存 连词 中心 控制语
下载PDF
《世说新语》的篇章连接词 被引量:2
3
作者 冯文贺 郭海芳 +1 位作者 李玉静 任函 《中文信息学报》 CSCD 北大核心 2017年第1期212-220,共9页
该文标注《世说新语》的篇章结构,据此研究其连接词的显隐、语义及用法。研究发现:1)隐式关系(3 346,81.4%)多于显式关系(786,18.6%),17类关系仅有三类(假设,选择,让步)显多隐少;2)各类关系的同义连接词种数与使用有差异,其中种数最多36... 该文标注《世说新语》的篇章结构,据此研究其连接词的显隐、语义及用法。研究发现:1)隐式关系(3 346,81.4%)多于显式关系(786,18.6%),17类关系仅有三类(假设,选择,让步)显多隐少;2)各类关系的同义连接词种数与使用有差异,其中种数最多36(顺承),最少则无(总分,背景);3)连接词(90种)单义为多(55),多义为少(35),义项最多为八种("乃"),分布也有差异。对比发现,《世说新语》与同时期《文心雕龙》的连接词使用有一定差异。 展开更多
关键词 《世说新语》 篇章结构 连接词 语义分析
下载PDF
汉英篇章结构平行语料库的对齐标注研究 被引量:7
4
作者 冯文贺 《中文信息学报》 CSCD 北大核心 2013年第6期158-164,186,共8页
篇章结构平行语料库是对具有对译关系的双语文本标注了平行篇章结构信息的语料库。对齐标注是汉英篇章结构平行语料库的核心理论基础。该文提出"结构对齐,关系对齐"的对齐标注策略,应用于切分对齐、层次结构对齐、关系对齐、... 篇章结构平行语料库是对具有对译关系的双语文本标注了平行篇章结构信息的语料库。对齐标注是汉英篇章结构平行语料库的核心理论基础。该文提出"结构对齐,关系对齐"的对齐标注策略,应用于切分对齐、层次结构对齐、关系对齐、中心对齐等环节,实现了对齐和标注并行、单位对齐和结构对齐共进的平行语料库工作模式。本策略辅之以相应标注平台和工作程序以及相应难点解决方案,被证明是一种高效的篇章结构平行语料库工作方式。 展开更多
关键词 平行语料库 对齐标注 篇章结构
下载PDF
汉语复句关系的特征结构 被引量:1
5
作者 冯文贺 《中文信息学报》 CSCD 北大核心 2015年第6期13-22,共10页
通常复句关系分析基于分类机制,由于缺乏统一逻辑,面临不少分歧。该文提出基于特征结构描写复句关系。复句关系的特征结构由[特征:值]元组构成,该文初步构拟汉语复句关系的特征结构系统,并用于具体分析。较之分类机制,特征结构对复句关... 通常复句关系分析基于分类机制,由于缺乏统一逻辑,面临不少分歧。该文提出基于特征结构描写复句关系。复句关系的特征结构由[特征:值]元组构成,该文初步构拟汉语复句关系的特征结构系统,并用于具体分析。较之分类机制,特征结构对复句关系的描写深刻,且分析判断准确、易行。目前特征结构系统开放,但特征调整,可以完善而不大量更改已有特征描写结果。特征结构可用于复句关系的深度语义分析资源构建与计算研究。 展开更多
关键词 复句关系 特征结构 语义分析
下载PDF
“副+名”及相关语法理论问题 被引量:1
6
作者 冯文贺 《长江学术》 2011年第2期164-167,共4页
副词是从语际功能上立的类,谈副词可不可以和某一类词组合是不恰当的。所谓副词可以修饰名词的条件,实质上是体词短语充当谓词性中心语的条件。通常说副词可以修饰动词或形容词,正是因为其可以单个充当谓词中心语的缘故。"高高一... 副词是从语际功能上立的类,谈副词可不可以和某一类词组合是不恰当的。所谓副词可以修饰名词的条件,实质上是体词短语充当谓词性中心语的条件。通常说副词可以修饰动词或形容词,正是因为其可以单个充当谓词中心语的缘故。"高高一座宝塔"等是状中结构,而非定中结构。"最"兼属副词和区别词。非主谓句的构成材料虽有体词和谓词之分,但在句法功能上都是谓词性的。充分认识词的词际功能与语际功能的差异性,对语言现象的描写与解释有重要意义。 展开更多
关键词 副词 “副+名” 语法功能
下载PDF
语病评判中语义与语法的交互作用——“语义重复”与“成分赘余”再思考 被引量:3
7
作者 冯文贺 《文山师范高等专科学校学报》 2009年第4期44-47,共4页
语言有语音、语义、语法、语用等多个层面。对具体语言现象的评判必需充分考虑多个层面的交互作用。语义重复属于语义平面,成分赘余属于语法平面。文章就语义重复和成分赘余的关系分别进行了论述,并把语义重复和成分赘余分别区分为两种... 语言有语音、语义、语法、语用等多个层面。对具体语言现象的评判必需充分考虑多个层面的交互作用。语义重复属于语义平面,成分赘余属于语法平面。文章就语义重复和成分赘余的关系分别进行了论述,并把语义重复和成分赘余分别区分为两种类型,深入探讨了有关的语言现象。 展开更多
关键词 语义重复 成分赘余 交互作用
下载PDF
语病评判的角度、精度和效度——以“凯旋”及有关啰嗦问题为例 被引量:1
8
作者 冯文贺 《柳州师专学报》 2009年第2期45-48,共4页
针对语病评判的种种现状,提出语病评判应:积极作为,增加和细化评论的角度,优化判定性质的精度,并提高评判的效度。并以对"凯旋"及有个啰嗦问题的批评实践了这一理念。
关键词 语病评判 啰嗦问题 “凯旋”
下载PDF
复合名词短语N_1AN_2中形容词语义指向的判定与分析
9
作者 冯文贺 《汉语学习》 CSSCI 北大核心 2013年第3期15-21,共7页
复合名词短语N1AN2由"名1+形+名2"直接构成。其语义指向是句子或短语内概念成分间可以优先实现的直接关联。提问与最佳答案是确定语义指向的基本原则,加"的"和组合测试是验证形容词语义指向的辅助手段。调查显示,N1... 复合名词短语N1AN2由"名1+形+名2"直接构成。其语义指向是句子或短语内概念成分间可以优先实现的直接关联。提问与最佳答案是确定语义指向的基本原则,加"的"和组合测试是验证形容词语义指向的辅助手段。调查显示,N1AN2中形容词语义后指约占74.3%,前指约占25.7%。根据不同的语义指向能力,N1AN2中形容词可分为惟前指形容词、惟后指形容词和双向形容词,三者分别占形容词总量的22.7%、71.8%和5.5%。这与一般句法条件下的形容词功能分布有较大差异。 展开更多
关键词 复合名词短语 N1AN2 形容词 语义指向
下载PDF
基于语料库的动态词群建构
10
作者 冯文贺 《河南科技学院学报(社会科学版)》 2014年第9期47-50,共4页
提出一个以大规模语料库为资源提取材料,以词汇集为语义成分表达方式的动态词群建构方法,其维度特征值的提取不但具有客观性,而且操作简易。维度特征值用词汇集的方式表示特征取值范围,可以避免传统的义素概括性过强、词汇个性表现不足... 提出一个以大规模语料库为资源提取材料,以词汇集为语义成分表达方式的动态词群建构方法,其维度特征值的提取不但具有客观性,而且操作简易。维度特征值用词汇集的方式表示特征取值范围,可以避免传统的义素概括性过强、词汇个性表现不足的缺陷。这种方法有利于面向应用的大规模动态词群的建构。 展开更多
关键词 词群 多维特征 词义 特征结构
下载PDF
语病评判与语言学发展三论
11
作者 冯文贺 《大理学院学报(综合版)》 CAS 2009年第7期37-40,共4页
语病评判在语言学的发生发展史上有重要的意义。规范语法只能选择描写语法中的精华部分作为"规范"语法,在当代仍有其独立的语法形态意义。语病评判是检验语法分析方法的标准之一,传统的中心词分析法魅力之一在于其为语病评判... 语病评判在语言学的发生发展史上有重要的意义。规范语法只能选择描写语法中的精华部分作为"规范"语法,在当代仍有其独立的语法形态意义。语病评判是检验语法分析方法的标准之一,传统的中心词分析法魅力之一在于其为语病评判之利器;语病评判在语言学研究中切合当代解释语法的追求。 展开更多
关键词 语病评判 规范语法 语法分析方法
下载PDF
基于清华汉语树库的复句关系词识别与分类研究 被引量:19
12
作者 李艳翠 孙静 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期118-124,共7页
根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词... 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。 展开更多
关键词 复句关系词 清华汉语树库 关系词识别 关系词分类
下载PDF
基于逗号的汉语子句识别研究 被引量:22
13
作者 李艳翠 冯文贺 +1 位作者 周国栋 朱坤华 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期7-14,共8页
根据篇章分析的任务和实践,结合传统研究,提出汉语的基本篇章单位为子句,并从结构、功能、形式等方面给出其定义。分析了逗号与子句的关系,并在标注语料上进行了基于逗号的汉语子句识别研究。首先手工标注了CTB6.0中前100篇文档的逗号... 根据篇章分析的任务和实践,结合传统研究,提出汉语的基本篇章单位为子句,并从结构、功能、形式等方面给出其定义。分析了逗号与子句的关系,并在标注语料上进行了基于逗号的汉语子句识别研究。首先手工标注了CTB6.0中前100篇文档的逗号是否为子句边界的信息,在标注结果中抽取句法、词汇、长度等特征进行实验,子句识别准确率为90%。然后利用信息增益选出贡献最大的9个特征,使用它们也可获得较高的子句识别准确率。最后仅使用词法信息,子句识别准确率可达84.5%。实验证明子句的定义合理,基于逗号的子句识别在理论上和实验上均可行。 展开更多
关键词 逗号 汉语子句 子句识别
下载PDF
汉语隐式篇章关系识别 被引量:15
14
作者 孙静 李艳翠 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期111-117,共7页
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进... 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进行识别。实验结果显示,总正确率为62.15%,其中并列类识别效果最好,F1值达到75.26%。 展开更多
关键词 篇章结构分析 篇章关系 隐式关系识别 汉语篇章语料库
下载PDF
论“不合逻辑”
15
作者 冯文贺 《郧阳师范高等专科学校学报》 2009年第1期47-50,共4页
"不合逻辑"在句法范围内影响到话语不能说;事理逻辑有时候可以违反,形式逻辑绝对不可违反;两种看似违反形式逻辑规律的语言现象和客观世界及语言意义的表达形式有关;语法意义的周边性和词汇意义的周边性不同,利用意义能否重... "不合逻辑"在句法范围内影响到话语不能说;事理逻辑有时候可以违反,形式逻辑绝对不可违反;两种看似违反形式逻辑规律的语言现象和客观世界及语言意义的表达形式有关;语法意义的周边性和词汇意义的周边性不同,利用意义能否重复可以鉴定语法形式,"们"还不是一个充分的显性语法形式。 展开更多
关键词 事理逻辑 形式逻辑 辩证逻辑 “们”
下载PDF
基于知识话题模型的文本蕴涵识别 被引量:4
16
作者 任函 盛雅琦 +1 位作者 冯文贺 刘茂福 《中文信息学报》 CSCD 北大核心 2015年第6期119-126,共8页
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之... 该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。 展开更多
关键词 文本蕴涵识别 话题模型 蕴涵分类 推理知识
下载PDF
基于语言现象的文本蕴涵识别 被引量:4
17
作者 任函 冯文贺 +1 位作者 刘茂福 万菁 《中文信息学报》 CSCD 北大核心 2017年第1期184-191,共8页
该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征... 该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。 展开更多
关键词 文本蕴涵识别 语言现象 随机森林
下载PDF
基于协同训练的文本蕴含识别 被引量:1
18
作者 任函 万菁 +1 位作者 吴泓缈 冯文贺 《中文信息学报》 CSCD 北大核心 2014年第6期114-119,共6页
针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分... 针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。 展开更多
关键词 文本蕴含识别 协同训练 语义树核
下载PDF
基于汉英平行语料库的英文显式篇章关系识别 被引量:2
19
作者 冯洪玉 李艳翠 冯文贺 《河南科技学院学报(自然科学版)》 2019年第5期55-62,共8页
汉英篇章平行语料库有助于基于篇章的双语研究.构建了汉英平行语料库,对语料中的汉语及其英语对译中的连接词分别进行了标注和关系分类.其中英文连接词比单语语料上的英文连接词定义广泛,更为复杂.在此语料上,抽取词法、句法和位置信息... 汉英篇章平行语料库有助于基于篇章的双语研究.构建了汉英平行语料库,对语料中的汉语及其英语对译中的连接词分别进行了标注和关系分类.其中英文连接词比单语语料上的英文连接词定义广泛,更为复杂.在此语料上,抽取词法、句法和位置信息等特征在英文文本上进行显式篇章关系识别.实验采用最大熵分类方法,获得连接词识别正确率92.5%;抽取英文和对应中文连接词作为特征,获得给定连接词关系分类正确率85.6%.研究结果可为今后的中英篇章关系对比识别提供参考. 展开更多
关键词 显式篇章关系 连接词识别 分类
下载PDF
法律文本中表条件“的”字结构的英译——基于《民法通则》汉英平行文本的考察 被引量:5
20
作者 冯文贺 郭海芳 杨华 《中文信息学报》 CSCD 北大核心 2019年第2期26-33,共8页
法律文本中有一种表条件"的"字结构,该文对其英译进行语法标注与统计分析。考察《民法通则》的汉英平行文本,确定"的"字结构的英语对应单位。统计"的"字结构的英语对应单位,发现:1.状语远多于定语(85.40%... 法律文本中有一种表条件"的"字结构,该文对其英译进行语法标注与统计分析。考察《民法通则》的汉英平行文本,确定"的"字结构的英语对应单位。统计"的"字结构的英语对应单位,发现:1.状语远多于定语(85.40%>14.60%);2.限定式远多于非限定式(87.59%>12.41%),限定式中一般现在时占绝对多数(99.17%),非限定式以介词短语为多(64.71%);3.状语引导词以if为多(86.32%),定语引导词以who为多(60.00%)。研究认为,法律文本中此类"的"字结构是句而非短语,而其中的"的"是表条件的篇章连接词。 展开更多
关键词 法律文本 “的”字结构 条件关系 汉英翻译
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部