期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中英文跨语言信息检索中平行语料库的构建及性能评价研究
1
作者
张宇辉
张雪萍
《情报科学》
CSSCI
北大核心
2024年第3期80-88,共9页
【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国...
【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国香港政府等新闻网站搜集中英文网页,使用开源软件HTML Parser过滤掉非文本内容,经过格式转换,最终生成XML文件,自行建立平行语料库,利用CL-LSI和TDS模型,并对其性能进行评价。【结果/结论】在建立CLIR评测语料库上进行的验证,TDS模型在双语配对检索过程中,能够充分客观的提取语义关联的语义双语主题特征,通过双语配对搜索,CLIR的性能上将超过CL-LSI模型检索效率。【创新/局限】本文针对语料库深入研究,提出一种基于平行语料库中对偶空间的跨语言信息检索模型(TDS),并对给定的主题分别进行中英文语料采集,对获得的关键词应用于TDS模型上,通过双语词项的共现语义信息分析,最终实现在平行语料库的构建和性能评价的目标。不足之处在于双语主题数较少时,翻译的准确率较低,而主题数量逐渐增大时,翻译的准确率更高。
展开更多
关键词
跨语言信息检索
平行语料库
对偶空间
TDS
模型
cl-lsi模型
原文传递
题名
中英文跨语言信息检索中平行语料库的构建及性能评价研究
1
作者
张宇辉
张雪萍
机构
吉林外国语大学英语学院
吉林农业大学外国语学院
出处
《情报科学》
CSSCI
北大核心
2024年第3期80-88,共9页
基金
2023年度吉林省教育厅教育厅社会科学研究项目“20世纪美国黑人女性文学作品中的‘姐妹情谊’”(JJKH20231385SK)
吉林省教育科学“十三五”规划课题“大学英语‘课程思政’教学研究与实践基金”(GH20391)。
文摘
【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国香港政府等新闻网站搜集中英文网页,使用开源软件HTML Parser过滤掉非文本内容,经过格式转换,最终生成XML文件,自行建立平行语料库,利用CL-LSI和TDS模型,并对其性能进行评价。【结果/结论】在建立CLIR评测语料库上进行的验证,TDS模型在双语配对检索过程中,能够充分客观的提取语义关联的语义双语主题特征,通过双语配对搜索,CLIR的性能上将超过CL-LSI模型检索效率。【创新/局限】本文针对语料库深入研究,提出一种基于平行语料库中对偶空间的跨语言信息检索模型(TDS),并对给定的主题分别进行中英文语料采集,对获得的关键词应用于TDS模型上,通过双语词项的共现语义信息分析,最终实现在平行语料库的构建和性能评价的目标。不足之处在于双语主题数较少时,翻译的准确率较低,而主题数量逐渐增大时,翻译的准确率更高。
关键词
跨语言信息检索
平行语料库
对偶空间
TDS
模型
cl-lsi模型
Keywords
cross-language information retrieval
parallel corpora
dual space
TDS model
cl-lsi
model
分类号
G254 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
中英文跨语言信息检索中平行语料库的构建及性能评价研究
张宇辉
张雪萍
《情报科学》
CSSCI
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部