热湿舒适性是鞋靴舒适性的重要组成部分。基于知网和Web of Science等数据库,文章对20年来文献中有关鞋靴热湿舒适性的评测方法进行了分析、总结和评价,并介绍了数值模拟用于鞋靴热湿舒适性评测的原理和具体案例,为建立系统的鞋靴热湿...热湿舒适性是鞋靴舒适性的重要组成部分。基于知网和Web of Science等数据库,文章对20年来文献中有关鞋靴热湿舒适性的评测方法进行了分析、总结和评价,并介绍了数值模拟用于鞋靴热湿舒适性评测的原理和具体案例,为建立系统的鞋靴热湿舒适性评价体系和制订鞋靴热湿舒适性评价标准提供借鉴和参考。展开更多
大语言模型(Large Language Models, LLMs)在多种自然语言处理(Natural Language Processing, NLP)任务中展现出了卓越性能,并为实现通用语言智能提供了可能。然而随着其应用范围的扩大,如何准确、全面地评估大语言模型已经成为了一个...大语言模型(Large Language Models, LLMs)在多种自然语言处理(Natural Language Processing, NLP)任务中展现出了卓越性能,并为实现通用语言智能提供了可能。然而随着其应用范围的扩大,如何准确、全面地评估大语言模型已经成为了一个亟待解决的问题。现有评测基准和方法仍存在许多不足,如评测任务不合理和评测结果不可解释等。同时,随着模型鲁棒性和公平性等其它能力或属性的关注度提升,对更全面、更具解释性的评估方法的需求日益凸显。该文深入分析了大语言模型评测的现状和挑战,总结了现有评测范式,分析了现有评测的不足,介绍了大语言模型相关的评测指标和评测方法,并探讨了大语言模型评测的一些新方向。展开更多
目的探讨医学汉语进阶学习与评测设计在来华医学留学生医学汉语水平考试(Medical Chinese Test,MCT)实践中的应用效果。方法2022年9月—2023年7月,以2018级秋季5~8班130名医学留学生为教学研究对象,通过问卷调查评估留学生医学汉语的学...目的探讨医学汉语进阶学习与评测设计在来华医学留学生医学汉语水平考试(Medical Chinese Test,MCT)实践中的应用效果。方法2022年9月—2023年7月,以2018级秋季5~8班130名医学留学生为教学研究对象,通过问卷调查评估留学生医学汉语的学习和测评应采用从低阶中介语至高阶单语的模式,以配合双语学习者的渐进过程。结果该套学习与测评框架让学习者对源语言理解、中介语言解码、目标语言考核评测结果、学习者双语能力与专业知识学习方面均有提升。观察组学生自学能力、学习兴趣、进阶效果满意度分别为84.6%、83.1%、86.2%,观察组对该套医学汉语进阶学习与评测设计框架整体认可度高。结论该医学汉语进阶学习与评测设计框架在医学汉语学习与评测中有很好的教学效果。展开更多
文摘大语言模型(Large Language Models, LLMs)在多种自然语言处理(Natural Language Processing, NLP)任务中展现出了卓越性能,并为实现通用语言智能提供了可能。然而随着其应用范围的扩大,如何准确、全面地评估大语言模型已经成为了一个亟待解决的问题。现有评测基准和方法仍存在许多不足,如评测任务不合理和评测结果不可解释等。同时,随着模型鲁棒性和公平性等其它能力或属性的关注度提升,对更全面、更具解释性的评估方法的需求日益凸显。该文深入分析了大语言模型评测的现状和挑战,总结了现有评测范式,分析了现有评测的不足,介绍了大语言模型相关的评测指标和评测方法,并探讨了大语言模型评测的一些新方向。
文摘目的探讨医学汉语进阶学习与评测设计在来华医学留学生医学汉语水平考试(Medical Chinese Test,MCT)实践中的应用效果。方法2022年9月—2023年7月,以2018级秋季5~8班130名医学留学生为教学研究对象,通过问卷调查评估留学生医学汉语的学习和测评应采用从低阶中介语至高阶单语的模式,以配合双语学习者的渐进过程。结果该套学习与测评框架让学习者对源语言理解、中介语言解码、目标语言考核评测结果、学习者双语能力与专业知识学习方面均有提升。观察组学生自学能力、学习兴趣、进阶效果满意度分别为84.6%、83.1%、86.2%,观察组对该套医学汉语进阶学习与评测设计框架整体认可度高。结论该医学汉语进阶学习与评测设计框架在医学汉语学习与评测中有很好的教学效果。