传统的多模态过程故障等级评估方法对模态之间的共性特征考虑较少,导致当被评估模态故障信息不充分时,评估的准确性较低.针对此问题,首先,提出一种共性–个性深度置信网络(Common and specific deep belief network,CS-DBN),该网络充分...传统的多模态过程故障等级评估方法对模态之间的共性特征考虑较少,导致当被评估模态故障信息不充分时,评估的准确性较低.针对此问题,首先,提出一种共性–个性深度置信网络(Common and specific deep belief network,CS-DBN),该网络充分利用深度置信网络(Deep belief network,DBN)的深度分层特征提取能力,通过度量多模态数据间分布的相似性和差异性,进一步得到能够反映多模态过程共有信息的共性特征以及反映每个模态独有信息的个性特征;其次,基于CS-DBN,利用多模态过程的已知故障等级数据生成多模态共性–个性特征集,通过加权逻辑回归构建故障等级评估模型;最后,将所提方法应用于带钢热连轧生产过程的故障等级评估中.应用结果表明,随着多模态故障等级数据的增加,所提方法的评估准确率逐渐增加,当故障信息充足时,评估准确率可达98.75%;故障信息不足时,与传统方法相比,评估准确率提升近10%.展开更多
在过去20年中,语言建模(Language models,LM)已经成为一种主要方法,用于语言理解和生成,同时作为自然语言处理(Natural language processing,NLP)领域下游的关键技术受到广泛关注.近年来,大语言模型(Large language models,LLMs),例如Ch...在过去20年中,语言建模(Language models,LM)已经成为一种主要方法,用于语言理解和生成,同时作为自然语言处理(Natural language processing,NLP)领域下游的关键技术受到广泛关注.近年来,大语言模型(Large language models,LLMs),例如ChatGPT等技术,取得了显著进展,对人工智能乃至其他领域的变革和发展产生了深远的影响.鉴于LLMs迅猛的发展,本文首先对LLMs相关技术架构和模型规模等方面的演进历程进行了全面综述,总结了模型训练方法、优化技术以及评估手段.随后,分析了LLMs在教育、医疗、金融、工业等领域的应用现状,同时讨论了它们的优势和局限性.此外,还探讨了大语言模型针对社会伦理、隐私和安全等方面引发的安全性与一致性问题及技术措施.最后,展望了大语言模型未来的研究趋势,包括模型的规模与效能、多模态处理、社会影响等方面的发展方向.本文通过全面分析当前研究状况和未来走向,旨在为研究者提供关于大语言模型的深刻见解和启发,以推动该领域的进一步发展.展开更多
文摘传统的多模态过程故障等级评估方法对模态之间的共性特征考虑较少,导致当被评估模态故障信息不充分时,评估的准确性较低.针对此问题,首先,提出一种共性–个性深度置信网络(Common and specific deep belief network,CS-DBN),该网络充分利用深度置信网络(Deep belief network,DBN)的深度分层特征提取能力,通过度量多模态数据间分布的相似性和差异性,进一步得到能够反映多模态过程共有信息的共性特征以及反映每个模态独有信息的个性特征;其次,基于CS-DBN,利用多模态过程的已知故障等级数据生成多模态共性–个性特征集,通过加权逻辑回归构建故障等级评估模型;最后,将所提方法应用于带钢热连轧生产过程的故障等级评估中.应用结果表明,随着多模态故障等级数据的增加,所提方法的评估准确率逐渐增加,当故障信息充足时,评估准确率可达98.75%;故障信息不足时,与传统方法相比,评估准确率提升近10%.
文摘在过去20年中,语言建模(Language models,LM)已经成为一种主要方法,用于语言理解和生成,同时作为自然语言处理(Natural language processing,NLP)领域下游的关键技术受到广泛关注.近年来,大语言模型(Large language models,LLMs),例如ChatGPT等技术,取得了显著进展,对人工智能乃至其他领域的变革和发展产生了深远的影响.鉴于LLMs迅猛的发展,本文首先对LLMs相关技术架构和模型规模等方面的演进历程进行了全面综述,总结了模型训练方法、优化技术以及评估手段.随后,分析了LLMs在教育、医疗、金融、工业等领域的应用现状,同时讨论了它们的优势和局限性.此外,还探讨了大语言模型针对社会伦理、隐私和安全等方面引发的安全性与一致性问题及技术措施.最后,展望了大语言模型未来的研究趋势,包括模型的规模与效能、多模态处理、社会影响等方面的发展方向.本文通过全面分析当前研究状况和未来走向,旨在为研究者提供关于大语言模型的深刻见解和启发,以推动该领域的进一步发展.