期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
CINOSUM:面向多民族低资源语言的抽取式摘要模型
1
作者
翁彧
罗皓予
+3 位作者
超木日力格
刘轩
董俊
刘征
《计算机科学》
CSCD
北大核心
2024年第7期296-302,共7页
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效...
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效果不佳的问题,构建了一个框架,采用统一的句子抽取器,以进行不同民族语言的抽取式摘要生成。此外,提出采用多语言数据集的联合训练方法,旨在弥补知识获取上的不足,进而扩展在低资源语言上的应用,显著增强模型的适应性与灵活性。最终,在MESUM数据集上开展了广泛的实验研究,实验结果表明CINOSUM模型在包括藏语和维吾尔语在内的多民族低资源语言环境中表现卓越,并且在ROUGE评价体系下取得了显著的性能提升。
展开更多
关键词
抽取式摘要
多
语言
预训练模型
低资源语言信息处理
知识迁移
下载PDF
职称材料
Lacmia:抗混淆的多民族语言生成式摘要模型
2
作者
翁彧
罗皓予
+3 位作者
刘征
超木日力格
刘轩
董俊
《中文信息学报》
CSCD
北大核心
2024年第10期80-94,共15页
该文提出了一种针对中国多民族低资源语言生成式摘要模型Lacmia(Language-Anti-confusioned Chinese Minority Abstractive Summarization Model)。为了克服以往模型只能处理单一语言的限制,Lacmia采用了一种统一的生成式架构来执行不...
该文提出了一种针对中国多民族低资源语言生成式摘要模型Lacmia(Language-Anti-confusioned Chinese Minority Abstractive Summarization Model)。为了克服以往模型只能处理单一语言的限制,Lacmia采用了一种统一的生成式架构来执行不同民族语言的摘要生成任务。此外,为了解决以往模型在多民族低资源语言处理上的性能不足问题,该模型在框架中加入了语言信息嵌入模块。该文通过在损失函数中引入目标语言偏好性正则化项,有效减轻了多语言摘要中出现的语言混淆现象,从而提升摘要生成准确性和流畅度。广泛的实验表明,Lacmia在包括藏语和维吾尔语在内的多民族低资源语言摘要任务中,取得了卓越成绩。除了在ROUGE评价标准上实现了显著性能提升外,Lacmia在该文新提出的CINOScore和NLCR两项指标上均达到了最佳效果,验证了模型的有效性和先进性。
展开更多
关键词
生成式摘要
多
语言
预训练模型
低资源语言信息处理
多目标学习
下载PDF
职称材料
题名
CINOSUM:面向多民族低资源语言的抽取式摘要模型
1
作者
翁彧
罗皓予
超木日力格
刘轩
董俊
刘征
机构
中央民族大学民族语言智能分析与安全治理教育部重点实验室
中央民族大学中国少数民族语言文学学院
出处
《计算机科学》
CSCD
北大核心
2024年第7期296-302,共7页
基金
国家重点研发计划(2020YFB1406702-3)
国家自然科学基金(61772575,62006257)。
文摘
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效果不佳的问题,构建了一个框架,采用统一的句子抽取器,以进行不同民族语言的抽取式摘要生成。此外,提出采用多语言数据集的联合训练方法,旨在弥补知识获取上的不足,进而扩展在低资源语言上的应用,显著增强模型的适应性与灵活性。最终,在MESUM数据集上开展了广泛的实验研究,实验结果表明CINOSUM模型在包括藏语和维吾尔语在内的多民族低资源语言环境中表现卓越,并且在ROUGE评价体系下取得了显著的性能提升。
关键词
抽取式摘要
多
语言
预训练模型
低资源语言信息处理
知识迁移
Keywords
Extractive summarization
Multilingual pre-trained model
Low-resource language processing
Knowledge transfer
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Lacmia:抗混淆的多民族语言生成式摘要模型
2
作者
翁彧
罗皓予
刘征
超木日力格
刘轩
董俊
机构
中央民族大学民族语言智能分析与安全治理教育部重点实验室
中央民族大学信息工程学院
出处
《中文信息学报》
CSCD
北大核心
2024年第10期80-94,共15页
基金
国家重点研究与发展计划(2020YFB1406702-3)
北京市科技计划项目(Z231100001723002)
国家自然科学基金(62006257)。
文摘
该文提出了一种针对中国多民族低资源语言生成式摘要模型Lacmia(Language-Anti-confusioned Chinese Minority Abstractive Summarization Model)。为了克服以往模型只能处理单一语言的限制,Lacmia采用了一种统一的生成式架构来执行不同民族语言的摘要生成任务。此外,为了解决以往模型在多民族低资源语言处理上的性能不足问题,该模型在框架中加入了语言信息嵌入模块。该文通过在损失函数中引入目标语言偏好性正则化项,有效减轻了多语言摘要中出现的语言混淆现象,从而提升摘要生成准确性和流畅度。广泛的实验表明,Lacmia在包括藏语和维吾尔语在内的多民族低资源语言摘要任务中,取得了卓越成绩。除了在ROUGE评价标准上实现了显著性能提升外,Lacmia在该文新提出的CINOScore和NLCR两项指标上均达到了最佳效果,验证了模型的有效性和先进性。
关键词
生成式摘要
多
语言
预训练模型
低资源语言信息处理
多目标学习
Keywords
abstractive text summarization
multilingual pre-training model
low-resource language processing
multi-objective learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
CINOSUM:面向多民族低资源语言的抽取式摘要模型
翁彧
罗皓予
超木日力格
刘轩
董俊
刘征
《计算机科学》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
Lacmia:抗混淆的多民族语言生成式摘要模型
翁彧
罗皓予
刘征
超木日力格
刘轩
董俊
《中文信息学报》
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部