期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于多种长度单位的汉英句子分组对齐算法 被引量:2
1
作者 昝红英 张霞 刘亚雷 《郑州大学学报(理学版)》 CAS 北大核心 2009年第2期33-36,共4页
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大... 传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%. 展开更多
关键词 自然语言处理 双语语料 句子对齐 分组对齐 句子长度
下载PDF
以汉语为中心语的多语汉外平行语料库集群的研制与应用 被引量:8
2
作者 王克非 《外语教学》 CSSCI 北大核心 2022年第6期1-7,共7页
本文论述以汉语为中心语的多语汉外平行语料库集群的设计、研制及应用问题。设计上,不同于以往单一语对的平行语料库,打破了国际上大多以英语为中心语的平行语料库局面。研制上,该多语汉外平行语料库集群,既可分别为10个语种与汉语的平... 本文论述以汉语为中心语的多语汉外平行语料库集群的设计、研制及应用问题。设计上,不同于以往单一语对的平行语料库,打破了国际上大多以英语为中心语的平行语料库局面。研制上,该多语汉外平行语料库集群,既可分别为10个语种与汉语的平行语料库,又可集合成一个整体,即运行在一个多语兼容和统一的共享分析检索平台上。应用上,由于多语平行语料库的特点,该语料库集群可以在更广的视角、更多的层面,开展一系列新型的语言、翻译等方面的研究。 展开更多
关键词 汉外平行语料库 语料库集群 研制 应用
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部