期刊文献+
共找到541篇文章
< 1 2 28 >
每页显示 20 50 100
赵小兵:内容不占四成,收费电视就没戏
1
作者 赵小兵 《投资与合作》 2003年第8期53-53,共1页
《投资与合作》:目前收费电视能不能成功关键的因素是什么? 赵小兵:节目内容。曾经被质疑过的机顶盒这类设备的技术问题,早已经不是问题了;支付能力也不是问题。收费电视频道1个月也就收20元多一点,也就是买本时尚杂志的价钱;消费习惯... 《投资与合作》:目前收费电视能不能成功关键的因素是什么? 赵小兵:节目内容。曾经被质疑过的机顶盒这类设备的技术问题,早已经不是问题了;支付能力也不是问题。收费电视频道1个月也就收20元多一点,也就是买本时尚杂志的价钱;消费习惯也可以慢慢地培养。关键是内容是不是比免费电视要好看,还要好看到我愿意付费,但绝对不会仅仅因为没有广告而给付费电视付费。 展开更多
关键词 赵小兵 收费电视 节目内容 广播电视 产业环境
下载PDF
Ti-Reader:基于注意力机制的藏文机器阅读理解端到端网络模型
2
作者 孙媛 陈超凡 +1 位作者 刘思思 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第2期61-69,共9页
机器阅读理解旨在教会机器去理解一篇文章并且回答与之相关的问题。为了解决低资源语言上机器阅读理解模型性能低的问题,该文提出了一种基于注意力机制的藏文机器阅读理解端到端网络模型Ti-Reader。首先,为了编码更细粒度的藏文文本信息... 机器阅读理解旨在教会机器去理解一篇文章并且回答与之相关的问题。为了解决低资源语言上机器阅读理解模型性能低的问题,该文提出了一种基于注意力机制的藏文机器阅读理解端到端网络模型Ti-Reader。首先,为了编码更细粒度的藏文文本信息,将音节和词相结合进行词表示,然后采用词级注意力机制去关注文本中的关键词,利用重读机制去捕捉文章和问题之间的语义信息,自注意力机制去匹配问题与答案的隐变量本身,为答案预测提供更多的线索。最后,实验结果表明,Ti-Reader模型提升了藏文机器阅读理解的性能,同时在英文数据集SQuAD上也有较好的表现。 展开更多
关键词 机器阅读理解 注意力机制 端到端网络 藏文
下载PDF
面向机器阅读理解的高质量藏语数据集构建
3
作者 孙媛 刘思思 +2 位作者 陈超凡 旦正错 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第3期56-64,共9页
机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但... 机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但对于低资源语言,由于缺乏相应的数据集,机器阅读理解研究尚处于起步阶段。该文以藏语为例,人工构建了藏语机器阅读理解数据集(TibetanQA),其中包含20000个问题答案对和1513篇文章。该数据集的文章均来自云藏网,涵盖了自然、文化和教育等12个领域,问题形式多样且具有一定的难度。另外,该数据集在文章收集、问题构建、答案验证、回答多样性和推理能力等方面,均采用严格的流程以确保数据的质量,同时采用基于语言特征消融输入的验证方法说明了数据集的质量。最后,该文初步探索了三种经典的英语阅读理解模型在TibetanQA数据集上的表现,其结果难以媲美人类,这表明藏语机器阅读理解任务还需要更进一步的探索。 展开更多
关键词 机器阅读理解 低资源语言 藏语 数据集
下载PDF
JCapsR:一种联合胶囊神经网络的藏语知识图谱表示学习模型
4
作者 孙媛 梁家亚 +1 位作者 陈安东 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第4期69-77,共9页
知识图谱表示学习是自然语言处理的一项关键技术,现有的知识图谱表示研究主要集中在英语、汉语等语言,而低资源语言的知识图谱表示学习研究还处于探索阶段,如藏语。该文基于前期构建的藏语知识图谱,提出了一种联合胶囊神经网络(JCapsR)... 知识图谱表示学习是自然语言处理的一项关键技术,现有的知识图谱表示研究主要集中在英语、汉语等语言,而低资源语言的知识图谱表示学习研究还处于探索阶段,如藏语。该文基于前期构建的藏语知识图谱,提出了一种联合胶囊神经网络(JCapsR)的藏语知识图谱表示学习模型。首先,我们使用TransR模型生成藏语知识图谱的结构化信息表示。其次,采用融合多头注意力和关系注意力的Transfomer模型表示藏语实体的文本描述信息。最后,采用JCapsR进一步提取三元组在知识图谱语义空间中的关系,将实体文本描述信息和结构化信息融合,得到藏语知识图谱的表示,相比基线系统,联合胶囊神经网络JCapsR模型提高了在藏语知识图谱上实体链接预测的性能,相关研究为其他低资源语言知识图谱表示学习的拓展优化提供了参考借鉴意义。 展开更多
关键词 藏语知识图谱 表示学习 胶囊神经网络
下载PDF
特种设备多元共治模式的探索
5
作者 赵小兵 林茂盛 +1 位作者 戚作秋 耿明 《品牌与标准化》 2024年第2期177-180,共4页
为打破特种设备安全监管主体单一化,以“放管服”改革为契机,以多元共治为抓手,对企业、属地政府、监管部门、检验机构、行业协会和社会公众六大主体的职责进行阐述,建立适应国家治理体系和治理能力现代化的特种设备多元共治模式,提出... 为打破特种设备安全监管主体单一化,以“放管服”改革为契机,以多元共治为抓手,对企业、属地政府、监管部门、检验机构、行业协会和社会公众六大主体的职责进行阐述,建立适应国家治理体系和治理能力现代化的特种设备多元共治模式,提出建立多元共治模式下的多部门协同机制、网格化监管机制和“吹哨人”机制,以确保特种设备多元共治模式的有效运行。 展开更多
关键词 特种设备 多元共治 网格化机制 吹哨人
下载PDF
语言模型蒸馏的低资源神经机器翻译方法
6
作者 申影利 赵小兵 《计算机工程与科学》 CSCD 北大核心 2024年第4期743-751,共9页
大规模平行语料库的缺乏是低资源神经机器翻译面临的关键问题之一。提出语言模型蒸馏的神经机器翻译方法,通过单语语言模型对神经机器翻译训练进行正则化,引入语言模型包含的先验知识以提升翻译效果。具体地,借鉴知识蒸馏思想,使用丰富... 大规模平行语料库的缺乏是低资源神经机器翻译面临的关键问题之一。提出语言模型蒸馏的神经机器翻译方法,通过单语语言模型对神经机器翻译训练进行正则化,引入语言模型包含的先验知识以提升翻译效果。具体地,借鉴知识蒸馏思想,使用丰富单语数据训练的目标端语言模型(教师模型)构造低资源神经机器翻译模型(学生模型)的正则化因子,让翻译模型学习到语言模型中高度泛化的先验知识。与传统单语语言模型融合参与解码过程不同的是,本文方法中的语言模型只在训练阶段使用,不参与推断阶段,因此能够有效提升解码速度。在第十七届全国机器翻译大会CCMT2021维吾尔语-汉语和藏语-汉语2种民汉低资源翻译数据集上的实验结果表明,相比目前最先进的语言模型融合方法,BLEU提高了1.42%(藏汉方向)~2.11%(汉维方向)。 展开更多
关键词 语言模型 知识蒸馏 正则化 低资源神经机器翻译
下载PDF
布拉特·奥库扎瓦诗歌艺术特色
7
作者 赵小兵 王英丽 《中国俄语教学》 2023年第4期19-25,共7页
布拉特·奥库扎瓦,苏联作家,俄罗斯20世纪第一弹唱诗人。本文基于奥库扎瓦的生平创作,探讨了他的诗歌艺术特色。阿尔巴特街意象、别具一格的战争叙事、荒诞的艺术手法、多基因的诗人——音乐家原型形象,以及以飞行形象隐喻对人的灵... 布拉特·奥库扎瓦,苏联作家,俄罗斯20世纪第一弹唱诗人。本文基于奥库扎瓦的生平创作,探讨了他的诗歌艺术特色。阿尔巴特街意象、别具一格的战争叙事、荒诞的艺术手法、多基因的诗人——音乐家原型形象,以及以飞行形象隐喻对人的灵魂自由和创造力的颂赞,构成其诗歌创作的主要艺术特色。奥库扎瓦的诗歌艺术创新,在一定程度上继承了普希金和白银时代诗人们的创作经验。我国对于奥库扎瓦的译介研究还很不够,值得全面深入研究。 展开更多
关键词 布拉特·奥库扎瓦 俄罗斯弹唱诗人 诗歌艺术特色
下载PDF
240t/h CFB锅炉布袋除尘器升级改造 被引量:1
8
作者 赵小兵 张伟 于季鹏 《锅炉制造》 2023年第3期23-25,42,共4页
文中针对某发电公司2×240t/h循环流化床锅炉布袋除尘器的升级改造方案进行阐述,除尘器升级改造后,粉尘排放浓度从30mg/Nm^(3)降至10mg/Nm^(3)以内,满足了《陕西省锅炉大气污染物排放标准》的新标准,各项技术指标均达到了设计要求,... 文中针对某发电公司2×240t/h循环流化床锅炉布袋除尘器的升级改造方案进行阐述,除尘器升级改造后,粉尘排放浓度从30mg/Nm^(3)降至10mg/Nm^(3)以内,满足了《陕西省锅炉大气污染物排放标准》的新标准,各项技术指标均达到了设计要求,并取得了良好的经济效益和社会效益。 展开更多
关键词 循环流化床锅炉 布袋除尘器 升级改造 排放浓度
下载PDF
饲料添加植物源组分对大口黑鲈血清皮质醇含量与溶菌酶活力的影响
9
作者 赵小兵 周建忠 《现代农业科技》 2024年第14期158-162,共5页
在水温为29~32℃、水质pH值为7.90~8.60、高锰酸盐指数(CODMn)为8.01~10.34 mg/L、溶解氧(DO)为4.68~6.15 mg/L条件下,将栀子苷、黄芩苷、茶多酚单一组分及其复配混合物(栀子苷∶黄芩苷∶茶多酚=1∶1∶1)分别按0.1%、0.2%和0.5%(质量比... 在水温为29~32℃、水质pH值为7.90~8.60、高锰酸盐指数(CODMn)为8.01~10.34 mg/L、溶解氧(DO)为4.68~6.15 mg/L条件下,将栀子苷、黄芩苷、茶多酚单一组分及其复配混合物(栀子苷∶黄芩苷∶茶多酚=1∶1∶1)分别按0.1%、0.2%和0.5%(质量比)的添加量添加于大口黑鲈饲料中,连续喂养30 d,随后采集大口黑鲈的血清,分析皮质醇(COR)含量和溶菌酶(LSZ)的活力,并与未添加植物源组分的普通饲料投喂的对照组进行比较,了解饲料添加植物源组分对大口黑鲈抗应激和免疫能力的影响。结果表明:与对照组相比,各试验组大口黑鲈血清COR含量有一定的下降,下降幅度分别为7.43%~20.98%、9.02%~26.51%、8.67%~29.68%和9.88%~32.29%;各试验组血清LSZ活力有一定的上升,上升幅度分别为12.49%~54.78%、15.48%~45.78%、11.74%~37.95%和14.14%~56.82%。复配混合物效果最优,添加比例以0.2%~0.5%为宜。研究显示,饲料添加植物源组分可提高大口黑鲈的免疫活力,降低应激反应,抵御病害的侵染。 展开更多
关键词 饲料 植物源组分 大口黑鲈 皮质醇 溶菌酶
下载PDF
伸缩缝施工技术在桥梁施工中的应用
10
作者 赵小兵 《中文科技期刊数据库(引文版)工程技术》 2024年第6期0218-0221,共4页
在桥梁施工中伸缩缝为主要的构件之一,是否能够保证伸缩缝施工技术的运用效果,会影响到桥梁施工的根本质量。在落实施工时,应该积极进行切缝以及开槽等,需结合工程的根本需要,科学设置伸缩缝装置等,做到在最大程度上把控好伸缩缝的质量... 在桥梁施工中伸缩缝为主要的构件之一,是否能够保证伸缩缝施工技术的运用效果,会影响到桥梁施工的根本质量。在落实施工时,应该积极进行切缝以及开槽等,需结合工程的根本需要,科学设置伸缩缝装置等,做到在最大程度上把控好伸缩缝的质量,从而才利于应对桥梁的结构应力问题,也利于保障技术利用效果与施工设计方案之间有所匹配,最终真正保障桥梁工程的总体稳定性。基于此,本文分析了伸缩缝的主要类型,研究了伸缩缝施工的影响因素,探索了伸缩缝施工技术在桥梁施工中的应用。 展开更多
关键词 伸缩缝 施工技术 桥梁施工 应用
下载PDF
断路器机构防跳下的合闸回路监视回路
11
作者 赵小兵 《云南电力技术》 2024年第3期76-79,共4页
断路器机构防跳时,必须将合闸回路监视回路移到断路器机构箱处监视,但是会导致合闸回路被监视部分缩短,当断路器在分闸位置时,缩短的合闸回路如果出现断线,装置不能报控制回路断线信号,检修、运行人员不能第一时间发现合闸回路断线,只... 断路器机构防跳时,必须将合闸回路监视回路移到断路器机构箱处监视,但是会导致合闸回路被监视部分缩短,当断路器在分闸位置时,缩短的合闸回路如果出现断线,装置不能报控制回路断线信号,检修、运行人员不能第一时间发现合闸回路断线,只有到断路器合闸送电时才能发现断路器不能合闸,增加停电时间及电网运行风险,将第一跳闸回路监视继电器1HWJ常闭触点1HWJ1与第二跳闸回路监视继电器2HWJ常闭触点2HWJ1串接后接入合闸回路监视回路中,可靠监视合闸回路。 展开更多
关键词 断路器 控制回路
下载PDF
某电厂不同类型锅炉掺烧新疆淖毛湖高碱煤适应性研究 被引量:3
12
作者 蒙玉仓 李炎 +4 位作者 杨忠灿 祁青福 蒋泰宇 赵小兵 聂明清 《热力发电》 CAS CSCD 北大核心 2023年第7期142-149,共8页
电站锅炉高比例掺烧高碱煤,会造成受热面严重结渣沾污,威胁电厂安全稳定生产。对比了甘肃某电厂3种不同类型锅炉掺烧新疆淖毛湖高碱煤炉况劣化前后的烟气温度变化,并对受热面沾污的灰渣进行了XRD物相分析和化学成分分析。分析结果表明:... 电站锅炉高比例掺烧高碱煤,会造成受热面严重结渣沾污,威胁电厂安全稳定生产。对比了甘肃某电厂3种不同类型锅炉掺烧新疆淖毛湖高碱煤炉况劣化前后的烟气温度变化,并对受热面沾污的灰渣进行了XRD物相分析和化学成分分析。分析结果表明:短时间粘结发展而成的灰块成分与煤灰成分接近,质地疏松,可通过优化吹灰保持受热面清洁;长时间沾污形成的管壳状渣块中富集SO3、Na2O,烧结程度高、质地坚硬,控制受热面入口烟气温度可有效缓解管屏沾污结渣;管屏间距50 mm左右的对流受热面,入口烟气温度应控制在800℃以下;管屏间距200 mm以上的对流受热面,入口烟气温度应控制在1 000℃以下。研究结果可为同类型锅炉掺烧高碱煤提供参考。 展开更多
关键词 淖毛湖高碱煤 掺烧 结焦 沾污 锅炉
下载PDF
火力发电厂的节能和运行经济性分析
13
作者 赵小兵 《通信电源技术》 2023年第9期120-122,126,共4页
火力发电是我国能源结构的重要组成部分之一,是支撑国家经济和社会发展的重要基础。然而,随着我国能源消费结构的调整和环保要求的提高,火力发电厂的节能和环保问题日益凸显。通过对火力发电厂运行存在的问题进行深入分析,结合火力发电... 火力发电是我国能源结构的重要组成部分之一,是支撑国家经济和社会发展的重要基础。然而,随着我国能源消费结构的调整和环保要求的提高,火力发电厂的节能和环保问题日益凸显。通过对火力发电厂运行存在的问题进行深入分析,结合火力发电厂锅炉的运行特点,提出了具有一定针对性的改善措施,并结合具体案例分析了节能措施的实施效果,提高火力发电厂的节能和运行经济性。 展开更多
关键词 火力发电厂 节能 运行经济性
下载PDF
面向自然语言生成的词汇选择研究 被引量:1
14
作者 王星星 李琳 赵小兵 《中央民族大学学报(自然科学版)》 2023年第3期61-68,共8页
词汇选择是自然语言生成研究的关键问题,主要研究如何将意思表示映射为恰当词语。目前许多自然语言处理系统仍没有采取恰当的选词策略,选词效果非常不理想。本文从词汇选择研究的理论和方法两个方面,对当前词汇选择研究现状进行梳理,重... 词汇选择是自然语言生成研究的关键问题,主要研究如何将意思表示映射为恰当词语。目前许多自然语言处理系统仍没有采取恰当的选词策略,选词效果非常不理想。本文从词汇选择研究的理论和方法两个方面,对当前词汇选择研究现状进行梳理,重点分析了当前研究存在的重点和难点,介绍了现有研究在词义表示、词汇选择建模等方面的方法;并介绍了今后词汇选择研究可能的发展趋势。 展开更多
关键词 词汇选择 词义表示 自然语言理解
下载PDF
我国地下水生态环境保护项目入库方案技术要点探讨
15
作者 郇环 晁韶良 +2 位作者 周爱霞 杨洋 赵小兵 《环境科学研究》 CAS CSCD 北大核心 2024年第4期908-918,共11页
水污染防治项目储备库建设是解决地下水突出问题、确保完成地下水生态环境保护目标和任务的重要举措.入库方案技术成熟度是项目通过率最大的影响因素.本文首先梳理总结了地下水生态环境调查评估、地下水污染防控修复(含废弃井封井回填)... 水污染防治项目储备库建设是解决地下水突出问题、确保完成地下水生态环境保护目标和任务的重要举措.入库方案技术成熟度是项目通过率最大的影响因素.本文首先梳理总结了地下水生态环境调查评估、地下水污染防控修复(含废弃井封井回填)和地下水环境监管能力建设三类项目入库时存在的实施方案目标不明确、缺少因地制宜的具体方案、不满足相关技术文件要求、缺少前期工作基础等问题.然后有针对性地提出了具体建议:①调查评估类项目应明确因地制宜的工作内容和工作量,成果支撑环境管理或后续风险管控修复措施,高度重视全链条质量控制;②监管能力建设类项目应充分整合评估现有可用监测井,建设完善地下水环境监测网,明确地下水环境监管信息化需求,探索构建智能高效监管平台,聚焦地下水环境监管短板,提升地下水监管软硬件能力;③防控修复类项目应明确地下水污染防控修复必要内容,优先采用工艺成熟、低成本、绿色低碳化的管控修复技术,充分体现“源−路径−受体”的系统整治思路,复杂地下水污染区探索建立分区分级管控与修复集成模式.最后从完善技术指导文件、联合不同部门积极探索可复制和可推广的技术模式以及统筹谋划重大项目等方面提出入库建议,以期为提高地下水生态环境保护项目入库质量提供技术支撑. 展开更多
关键词 水污染防治项目储备库 地下水生态环境保护项目 调查评估 监管能力建设 防控修复 技术要点
下载PDF
基于目标语言预训练和联合解码的低资源语言端到端语音翻译
16
作者 李宁 朱丽平 +2 位作者 赵小兵 仁曾卓玛 王燕敏 《中文信息学报》 CSCD 北大核心 2023年第12期36-43,共8页
自动语音翻译(AST)是将源语言语音转换为目标语言文字的技术。目前,端到端的语音翻译成为AST的研究主流,但面临数据稀缺问题。该文首先利用机器翻译和人工检验构建了20h的维吾尔语-汉语AST语音翻译数据集。其次,为提高端到端语音翻译模... 自动语音翻译(AST)是将源语言语音转换为目标语言文字的技术。目前,端到端的语音翻译成为AST的研究主流,但面临数据稀缺问题。该文首先利用机器翻译和人工检验构建了20h的维吾尔语-汉语AST语音翻译数据集。其次,为提高端到端语音翻译模型的性能,使用语料相对丰富的目标语言语音识别数据集预训练模型,不仅解决了数据稀缺造成的模型无法收敛问题,而且能让模型学到目标语言的语言学知识;再次,在预训练解码器前添加映射模块,使其学到源语言到目标语言知识的映射关系,由此构建了端到端语音翻译模型。最后,使用CTC与Attention联合解码,强制语音标签对齐,提高翻译效果。实验结果表明,在维汉语音翻译数据集上达到了61.45 BLEU值。 展开更多
关键词 语音翻译 端到端 数据集构建
下载PDF
基于跨语言词嵌入对齐增强少数民族预训练语言模型
17
作者 申影利 鲍薇 +1 位作者 赵小兵 周毛克 《中文信息学报》 CSCD 北大核心 2023年第9期63-72,共10页
由于民族语言与汉语之间的词嵌入语义空间差距较大,导致预训练语言模型的跨语言迁移效果不佳。为此,该文设计了一个通过静态词嵌入对齐到上下文词嵌入空间中的新框架,以提升少数民族跨语言预训练语言模型在下游任务中的表现。该文首先... 由于民族语言与汉语之间的词嵌入语义空间差距较大,导致预训练语言模型的跨语言迁移效果不佳。为此,该文设计了一个通过静态词嵌入对齐到上下文词嵌入空间中的新框架,以提升少数民族跨语言预训练语言模型在下游任务中的表现。该文首先将由大规模单语数据训练的静态词嵌入进行跨语言对齐;其次,基于民汉平行语料从少数民族预训练语言模型CINO中抽取上下文词嵌入,并设计两种损失函数:双语词典归纳损失、对比学习损失,实现静态词嵌入对齐到上下文词嵌入的共享语义空间中;最后,我们将结合静态与上下文跨语言词嵌入对齐的CINO增强模型应用于双语词典归纳、文本分类以及机器翻译任务中,在多个语言对上的实验结果表明,相比鲁棒的基线系统,该文方法在标注语料匮乏的下游任务中均达到了显著的性能提升。 展开更多
关键词 词嵌入对齐 少数民族预训练语言模型 双语词典归纳 对比学习
下载PDF
面向司法领域的藏文事件数据集构建
18
作者 高璐 赵小兵 《中文信息学报》 CSCD 北大核心 2023年第8期34-42,51,共10页
为了构建高质量的藏文司法事件数据集,推动藏文司法事件抽取技术的进一步探索、评测与优化。该文面向藏文司法领域,以藏文刑事裁判文书为研究对象,设计了“类别分组-主题建模”两阶段的契合藏文司法实际的事件Schema;采用模型驱动的事... 为了构建高质量的藏文司法事件数据集,推动藏文司法事件抽取技术的进一步探索、评测与优化。该文面向藏文司法领域,以藏文刑事裁判文书为研究对象,设计了“类别分组-主题建模”两阶段的契合藏文司法实际的事件Schema;采用模型驱动的事件触发词预标注与事件要素人工标注相结合的半自动化数据标注方式,对1863篇藏文刑事裁判文书进行爬取、OCR、降噪、分析、多人协同标注及审核,构建了藏文司法事件数据集TiEvent。TiEvent共定义了3个大类、12个小类的事件类型,涵盖1863个藏文真实司法文本的2249个事件提及。BiLSTM、BiLSTM-CRF、CINO-CRF等事件抽取模型的实验结果表明,藏文司法事件触发词检测和论元识别的最高F1值分别为75.36%、70.98%。在藏文司法文本上,TiEvent具有较高的事件覆盖度和事件要素完整度,能够满足藏文司法事件抽取工作的基本需要。 展开更多
关键词 事件数据集 事件抽取 藏文信息处理
下载PDF
基于多任务学习的民汉神经机器翻译数据增强方法
19
作者 申影利 周毛克 赵小兵 《中文信息学报》 CSCD 北大核心 2023年第2期97-106,共10页
神经机器翻译在资源丰富语言对中取得良好性能,但这种性能的取得通常以大规模的平行语料为前提。在民族语言与汉语之间仅存在小规模双语平行句对的情况下,该文提出把机器翻译中的数据增强技术融入多任务学习框架提升翻译性能。首先,通... 神经机器翻译在资源丰富语言对中取得良好性能,但这种性能的取得通常以大规模的平行语料为前提。在民族语言与汉语之间仅存在小规模双语平行句对的情况下,该文提出把机器翻译中的数据增强技术融入多任务学习框架提升翻译性能。首先,通过对目标端句子进行简单的变换(如词序调整、词替换等)以产生非准确的新句子增强噪声;其次,将上述扩增的伪平行语料作为辅助任务融入一个多任务学习框架中以充分训练编码器,并使神经网络将注意力转移到如何使编码器中的源语言句子拥有更丰富准确的表示。通过在全国机器翻译大会(CCMT 2021)蒙汉、藏汉以及维汉3种机器翻译评测数据集上进行6个方向的互译实验,结果表明,在上述民汉翻译任务上,该文方法均显著优于基线系统及多种常见的机器翻译数据增强方法。 展开更多
关键词 多任务学习 数据增强 低资源机器翻译
下载PDF
多民族语言本体知识库构建技术 被引量:15
20
作者 赵小兵 邱莉榕 赵铁军 《中文信息学报》 CSCD 北大核心 2011年第4期71-74,共4页
语义本体是共享概念模型的显示的形式化规范说明,其目标是将杂乱无章的信息源转变为有序易用的知识源。语义本体知识库的构建是文本自动处理的一个重要环节,跨语言信息检索、信息抽取、自动翻译等领域中都有广泛的应用。该文旨在描述统... 语义本体是共享概念模型的显示的形式化规范说明,其目标是将杂乱无章的信息源转变为有序易用的知识源。语义本体知识库的构建是文本自动处理的一个重要环节,跨语言信息检索、信息抽取、自动翻译等领域中都有广泛的应用。该文旨在描述统一标准、统一接口的多民族语言本体知识库的创建思路,以及包含的若干问题,例如:多民族语言中共有概念的一般表示与各民族语言特有的事物表达方式的规律,基于词汇语义的、包括汉语、英语及少数民族语言在内的多民族语言语义本体的表示理论与方法等。 展开更多
关键词 知识库 语义本体 词典扩充 本体学习
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部