期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多种长度单位的汉英句子分组对齐算法
被引量:
2
1
作者
昝红英
张霞
刘亚雷
《郑州大学学报(理学版)》
CAS
北大核心
2009年第2期33-36,共4页
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大...
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%.
展开更多
关键词
自然语言处理
双语语料
句子对齐
分组对齐
句子长度
下载PDF
职称材料
以汉语为中心语的多语汉外平行语料库集群的研制与应用
被引量:
8
2
作者
王克非
《外语教学》
CSSCI
北大核心
2022年第6期1-7,共7页
本文论述以汉语为中心语的多语汉外平行语料库集群的设计、研制及应用问题。设计上,不同于以往单一语对的平行语料库,打破了国际上大多以英语为中心语的平行语料库局面。研制上,该多语汉外平行语料库集群,既可分别为10个语种与汉语的平...
本文论述以汉语为中心语的多语汉外平行语料库集群的设计、研制及应用问题。设计上,不同于以往单一语对的平行语料库,打破了国际上大多以英语为中心语的平行语料库局面。研制上,该多语汉外平行语料库集群,既可分别为10个语种与汉语的平行语料库,又可集合成一个整体,即运行在一个多语兼容和统一的共享分析检索平台上。应用上,由于多语平行语料库的特点,该语料库集群可以在更广的视角、更多的层面,开展一系列新型的语言、翻译等方面的研究。
展开更多
关键词
汉外平行语料库
语料库集群
研制
应用
原文传递
题名
基于多种长度单位的汉英句子分组对齐算法
被引量:
2
1
作者
昝红英
张霞
刘亚雷
机构
郑州大学信息工程学院
仰恩大学计算机与信息学院
西南交通大学电气工程学院
出处
《郑州大学学报(理学版)》
CAS
北大核心
2009年第2期33-36,共4页
基金
河南省教育厅自然科学基金资助项目
编号2007520050
文摘
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%.
关键词
自然语言处理
双语语料
句子对齐
分组对齐
句子长度
Keywords
NLP
bilingual
corpora
sentence alignment
group
ed alignment
sentence length
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
以汉语为中心语的多语汉外平行语料库集群的研制与应用
被引量:
8
2
作者
王克非
机构
北京外国语大学中国外语与教育研究中心
出处
《外语教学》
CSSCI
北大核心
2022年第6期1-7,共7页
基金
国家社科基金重大项目“围绕汉语的超大型多语汉外平行语料库集群研制与应用研究”(项目编号:21ZD&290)的阶段性研究成果。
文摘
本文论述以汉语为中心语的多语汉外平行语料库集群的设计、研制及应用问题。设计上,不同于以往单一语对的平行语料库,打破了国际上大多以英语为中心语的平行语料库局面。研制上,该多语汉外平行语料库集群,既可分别为10个语种与汉语的平行语料库,又可集合成一个整体,即运行在一个多语兼容和统一的共享分析检索平台上。应用上,由于多语平行语料库的特点,该语料库集群可以在更广的视角、更多的层面,开展一系列新型的语言、翻译等方面的研究。
关键词
汉外平行语料库
语料库集群
研制
应用
Keywords
Sino-foreign parallel
corpora
corpora group
development
application
分类号
H030 [语言文字—语言学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多种长度单位的汉英句子分组对齐算法
昝红英
张霞
刘亚雷
《郑州大学学报(理学版)》
CAS
北大核心
2009
2
下载PDF
职称材料
2
以汉语为中心语的多语汉外平行语料库集群的研制与应用
王克非
《外语教学》
CSSCI
北大核心
2022
8
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部