-
题名平行语料库设计及对应单位识别
被引量:18
- 1
-
-
作者
李文中
-
机构
河南师范大学语料库研发中心
-
出处
《当代外语研究》
2010年第9期22-27,61,共7页
-
基金
国家社科基金项目“基于语料库英语本土化研究及应用,编号:07BYY022”及“平行语料库对应意义单位研究,编号:07BYY002”研究
-
文摘
翻译高度依赖语境,在翻译过程中,译者交互的对象包括文本、读者,以及其他译者。"好的翻译"是指那些在译者社团中通过谈判交际不断被重复的翻译,并通过重复应用得到确立。因此,当前的翻译文本不仅仅是一种终端产品,还是联接前后翻译文本的重要环节,从而继承了以往翻译文本中大量的翻译特征。对应单位即是对应源文本和目的文本中任何可识别的文本块或片段。对应单位具有意义的完整性和相同性,并且具有各自的句法特征。由于其对语境高度敏感,并在结构上动态变化,对应单位可逆或不可逆。本研究的问题是:1)在平行语料库中如何界定等值性,如何在操作层面测量它?2)平行语料库处理如何体现语料库驱动原则?3)双语视角对识别对应单位的意义是什么?研究目的包括通过开发平行语料库,确定对应单位识别程序,并建立对应单位数据库。后续研究主要包括复杂对应关系分析及呈现。
-
关键词
平行语料库
对应单位
等值
翻译
-
分类号
H059
[语言文字—语言学]
-
-
题名基于“词坐标”的文本处理模型算法分析
- 2
-
-
作者
刘晓燕
孙海燕
-
机构
河南师范大学语料库研发中心
-
出处
《河南大学学报(自然科学版)》
CAS
2015年第1期95-101,共7页
-
基金
国家社科基金项目(14BYY084)
教育部人文社科项目(12YJC740062)
-
文摘
传统的文本处理软件大多能够较好地解决文本读入与词汇排序问题,但对内存消耗及数据统计结果的精确性关注较少,因此处理过程中造成诸多资源浪费及少量数据统计误差.基于Java语言,在充分考虑英语语言特点的基础上,结合"词坐标"思想,提出一套全新的算法设计,并对自行开发的英语文本处理模型进行分析与描述.实验结果证明,基于"词坐标"开发的文本处理模型对英语这一自然语言进行处理,能够精确统计文本各项数据;与其他同类软件相比,效率更高.借助于该模型,语料库研究者能够更好地分析与总结英语文本的内部规律,从而构建速度更快、效率更高的自然语言处理平台.
-
关键词
词坐标
文本处理模型
算法分析
-
Keywords
lexical coordination
text processing model
algorithm analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-