期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
藏医药抽取式机器阅读理解数据集研究
1
作者 旦增罗布 拉巴次仁 +1 位作者 王浩畅 小次仁 《西藏科技》 2024年第9期73-80,共8页
藏文机器阅读理解领域尚处于起步阶段,构建一份高质量的语料库成为推动该领域发展的当务之急。本研究采用众包方式,对藏医经典著作《四部医典》中的藏医植物药材与名词解释部分进行精细标注。结合藏文掩码数据扩充策略,有效扩充了数据... 藏文机器阅读理解领域尚处于起步阶段,构建一份高质量的语料库成为推动该领域发展的当务之急。本研究采用众包方式,对藏医经典著作《四部医典》中的藏医植物药材与名词解释部分进行精细标注。结合藏文掩码数据扩充策略,有效扩充了数据集的规模,最终整理出13k条有效问答对。基于该数据集,通过优化传统的注意力机制,提出了一个高效的藏文机器阅读理解模型。文章的研究不仅对于推动藏文信息处理技术的深入发展具有重要意义,更有助于提升机器对藏文文本的理解能力,从而为藏文化的传承和保护提供有力支持。 展开更多
关键词 藏文机器阅读理解 四部医典 藏文语料库 注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部