双语网页分句匹配算法的研究与实现

Research and Implementation of Text Segmentation Algorithm in Bilingual Web Page

下载PDF

导出

摘要在实现基于网络语料库和双语网页搜索的辅助翻译系统的过程中,利用网络机器人从互联网上获取中英文双语对照网页,对它们进行过滤,留下有用的信息,再把中英文句子进行匹配存入数据库。分句匹配算法是语言翻译处理领域的双语句子对齐过程,它将网页净化后获得的有用信息进行匹配,产生最终的双语语料。对分句匹配算法进行了描述,并且研究了匹配算法的实现过程。 In the process of implementing the assistant translation system based on bilingual corpus and bilingual pages searching, the Chinese and English bilingual pages from the net using network robot are used and filtered so as to get useful information. In this way, the Chinese and English sentences are matched and stored in the database. The text segmentation algorithm is the process that matches the bilingual sentences in language translation processing domain, which matches the useful information that we get in web page cleaning module to get the last bilingual corpus. The text segmentation algorithm was described and the implementing process of test segmentation algorithm was studied.

作者刘东飞卢苇

机构地区武汉理工大学计算机科学与技术学院

出处《武汉理工大学学报（信息与管理工程版）》 CAS 2008年第5期708-710,共3页 Journal of Wuhan University of Technology：Information & Management Engineering

关键词分句匹配双语句对匹配最优 text segmentation bilingual pairs of sentences best match

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘非凡,赵军,徐波.大规模非限定领域汉英双语语料库建设及句子对齐研究[M].北京:清华大学出版社,2003.
2张霄军,张凌岚,刘军.基于Web语料挖掘技术及其系统设计[J].上海电力学院学报,2004,20(2):39-43. 被引量：5
3RENIK P. A preliminary investigation into mining the Web for bilingual text [ R ]. Maryland : University of Maryland, 1998.
4CHRISTOPHER C. Mining english/chinese parallel documents from the world wide web [ C ]. Proceedings of the International World Wide Web Conference. Hawaii : [ s. n. ], 1999 : 156 - 167.
5JISONG C, ROWENA C. Discovering parallel text from the world wide web [ R]. Australia-Monash University, 2001.

二级参考文献2

1何波,李建国.基于XML的WEB数据挖掘系统框架的设计与实现[J].西南师范大学学报（自然科学版）,2002,27(6):887-890. 被引量：9
2蔡霞,张森.基于自然语言理解的个性化Web挖掘及其系统设计[J].计算机系统应用,2003,12(6):41-43. 被引量：3

共引文献4

1王晓东,王靖.基于Ontology的Web语料的挖掘[J].河南师范大学学报（自然科学版）,2006,34(4):43-45. 被引量：3
2王晓东,王靖.基于Ontology的语料库系统[J].计算机应用与软件,2007,24(8):44-46. 被引量：1
3张小红,王靖.具有语义的英语语料库的支撑平台[J].平顶山学院学报,2008,23(2):115-117.
4王靖.C语言程序设计网络课程的构建[J].中国科教创新导刊,2010(10):192-193.

1夏小亮,周明全,王学松,李鹏,李娟.基于分句匹配的哼唱音乐检索系统的算法研究与实现[J].北京师范大学学报（自然科学版）,2011,47(4):366-369. 被引量：1
2林丽华.在线翻译也要双语对照[J].电脑迷,2011(1):75-75.
3吴盼密,龙鹏飞.基于四叉树和进化算法的分形图像压缩[J].微计算机应用,2005,26(2):198-200. 被引量：5
4林伟,丁志刚.基于Agent的微信平台自适应负载均衡算法[J].实验技术与管理,2015,32(12):63-65.
5谭亚丽,于炯,邓定兰,吕良干,田国忠.基于多维QoS约束的网格任务调度算法[J].计算机工程,2010,36(12):75-77. 被引量：4
6苗雪兰,向国全.GAPT交互式图形生成系统[J].河南大学学报（自然科学版）,1992,22(4):29-34.
7罗阳,季铎,张桂平,王莹莹.面向单一双语网页的双语资源挖掘方法[J].中文信息学报,2011,25(1):110-115. 被引量：5
8李英,吐尔根.依布拉音.双语句子对齐算法分析[J].现代计算机,2008,14(12):71-74.
9陈相,林鸿飞,杨志豪.基于高斯混合模型的生物医学领域双语句子对齐[J].中文信息学报,2010,24(4):68-73. 被引量：3
10一江春水.使用阅读模式翻译英文[J].电脑迷,2011(14):77-77.

武汉理工大学学报（信息与管理工程版）

2008年第5期

浏览历史

内容加载中请稍等...

双语网页分句匹配算法的研究与实现

参考文献5

二级参考文献2

共引文献4

相关作者

相关机构

相关主题

浏览历史