平行语料检索技术研究

Parallel corpus retrieval technology research

下载PDF

导出

摘要以中国传媒大学平行语料检索软件(CUC_ParaConc)为例论述平行语料检索技术,主要以纯文本形式的对齐语料为例进行阐述,包括平行语料的存储、读取技术以及双语、多语关键词检索技术。平行语料检索可分为"一对一"与"一对多"两种形式。在一对一平行语料检索中,以汉英平行语料为例分别论述了以汉语为对象的非拼音文字语料的检索技术,以英语为对象的拼音文字语料检索技术,对两者的异同进行了对比;在一对多平行语料检索中,重点论述了多语关键词检索技术。 Parallel corpus retrieval technology is discussed in the light of CUC_ParaConc, Communication University of China’s parallel corpus retrieval software. On the basis of the alignment of the plain text corpus form, how to store and read parallel data is prsented, bilingual and multilingual keyword retrieval technology is illustrated. Parallel corpus retrieval can be conducted on either “one-to-one” technique or “one-to-many” technique. As for “one-to-one” technique, Chinese-English parallel data are employed to expound and compare non-phonetic corpus retrieval technology for Chinese and phonetic corpus retrieval technology for English. Special attention has been given to a multi-lingual keyword search technology in “one-to-many” parallel corpus retrieval.

作者程南昌侯敏

机构地区中国传媒大学文学院百色学院中文系中国传媒大学有声媒体语言分中心

出处《计算机工程与应用》 CSCD 2012年第31期134-139,共6页 Computer Engineering and Applications

关键词平行语料检索双语多语 parallel corpus retrieval bilingual multilingual

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Barlow M.ParaConc[EB/OL].[2011-09-30].http://www.athel.com/para.html.
2秦洪武,王克非.《基于语料库的语言对比和翻译研究》评介[J].外语电化教学,2006(6):75-78. 被引量：10
3陈国华,王立欣,梁茂成,刘树杰,许家金.英汉/汉英对译语料库对应词检索器[J].外语电化教学,2006(6):11-16. 被引量：13
4吴雪颖.句子层级平行教学语料库的构建[J].英语教师,2011(1):30-33.
5骆海辉.最近十年国内《三国演义》英译研究评述[J].文教资料,2009(6):32-35. 被引量：18
6王丽娜,杜维沫.《三国演义》的外文译文[J].明清小说研究,2006(4):70-85. 被引量：40
7冯志伟.中国语料库研究的历史与现状[J].汉语语言与计算学报,2002,12(1):43-62.
8宋继华,胡佳佳,孟蓬生,王宁.古今汉语平行语料库的语料构建[J].现代教育技术,2008,18(1):92-99. 被引量：5
9Boyer R S, Moore J S.A fast string searching algorithm[J].Communications of the ACM, 1977,20: 762-772.
10Jurafsky D, Martin J H.Speech and language processing [M].冯志伟,孙乐,译.北京:电子工业出版社,2005:18-19.14-15.

二级参考文献34

1张煜,田翠芸.从《三国演义》英译本看译者的创造性[J].河北理工大学学报（社会科学版）,2007,7(2):156-159. 被引量：6
2游玉祥.全球化语境下汉英翻译的异化取向[J].武汉科技大学学报（社会科学版）,2007,9(2):200-203. 被引量：4
3曾晓光.试论罗慕士译《三国演义》对“数合”的翻译及问题[J].西华大学学报（哲学社会科学版）,2007,26(2):82-85. 被引量：1
4孙静艺,王伦.异化策略在文化翻译中的成功应用——以《三国演义》Roberts全译本中尊谦语的翻译为例[J].重庆交通大学学报（社会科学版）,2007,7(3):114-115. 被引量：5
5冯志伟.中国语料库研究的历史与现状.Journal of Chinese Language and Computing,2002,11(2):127-136.
6MarkGraves著尹志军译.XML数据库设计[M].北京:机械工业出版社,2002..
7常宝宝柏晓静.北京大学汉英双语语料库标记规范[J].汉语语言与计算学报,2003,(2):195-209.
8黄昌宁李娟子.语料库语言学[M].北京：商务印书馆,2002.115-120.
9柏晓静,常宝宝,詹卫东．构建大规模的汉英双语平行语料库[A]．黄河燕主编．2002全国机器翻译研讨会文集：机器翻译研究进展[C]．北京：电子工业出版社，2002．
10Barlow,Michael.Analysing Parallel Texts with ParaConc[C].Paper presented at ALLC/ACH′96,University of Bergen,1996.

共引文献76

1冉明志.《三国演义》邓译本与罗译本战争军事术语英译策略对比研究[J].译苑新谭,2021,2(1):72-79. 被引量：1
2李雯雯.基于依存树库的英汉语主语句法计量特征的对比研究[J].语言研究集刊,2020(1):173-191. 被引量：1
3彭文青,王金波.借鉴还是抄袭?——张亦文《三国演义》英文节译本存疑[J].当代外语研究,2019(6):98-110. 被引量：2
4彭文青.《三国演义》节译中的副文本探析[J].翻译界,2020(2):55-69.
5李林波,刘逸凡.《三国演义》英译研究二十年:回顾与展望[J].大连大学学报,2023,44(3):21-26.
6宋庆伟,匡华,吴建平.国内语料库翻译学20年述评(1993—2012)[J].上海翻译,2013(2):25-29. 被引量：25
7龙绍赟,刘克强.基于《三国演义》平行语料库的英译本特征分析[J].语文学刊（外语教育与教学）,2013(11):45-49.
8陈国华,熊文新.英语学习词典机辅编写系统的设计原则与实现[J].外语电化教学,2007(5):3-7. 被引量：2
9熊文新,陈国华.一个用于英语学习词典编纂的机辅词编系统的实现[J].现代教育技术,2008,18(8):63-67.
10李秀英.术语与机器翻译——实验结果分析与术语数据库的构建[J].实验室研究与探索,2008,27(11):51-56. 被引量：3

1宋培彦,张冬梅.一种基于C#正则表达式的汉语文本信息检索方法[J].现代计算机,2009,15(12):33-36. 被引量：1
2廖剑平,元昌安,邓松,饶元.一种基于Rough Set的汉语检索算法[J].广西师范学院学报（自然科学版）,2005,22(4):33-39. 被引量：1
3罗霄峰,李琳,罗万伯.周境有关的使用控制研究[J].四川大学学报（工程科学版）,2013,45(4):103-110.
4董桂.基于PostgreSQL的TMX数据存储研究与语料检索平台实现[J].现代图书情报技术,2011(7):47-55. 被引量：1
5张统宣.陕北民歌语料库构建及WEB管理系统设计[J].计算机与数字工程,2010,38(12):128-129. 被引量：1
6张统宣.基于Web检索的陕北民歌语料库设计[J].现代电子技术,2010,33(22):38-39. 被引量：2
7罗霄峰,罗万伯.基于策略的CUC研究[J].通信技术,2016,49(6):751-757. 被引量：1
81946-2005IT图解[J].商学院,2005(7):64-65.
9贾晓露.基于语料库的韩国学生“被”字句偏误分析[J].文教资料,2011(35):31-33.
10刘延金,雷刚,陈海员,黄明和,周志刚.中医汉英双语语料库平台[J].计算机工程,2008,34(11):266-267. 被引量：13

计算机工程与应用

2012年第31期

浏览历史

内容加载中请稍等...

平行语料检索技术研究

参考文献10

二级参考文献34

共引文献76

相关作者

相关机构

相关主题

浏览历史