迁移学习能以相关领域中的标注数据为基础,提升目标领域的学习效果。当领域间的数据分布差异很大时,会导致严重的负迁移问题。如何充分捕获源域和目标域之间的相似性,进一步挖掘更多有效信息,最终提高目标域的预测精度,是一个值得探索...迁移学习能以相关领域中的标注数据为基础,提升目标领域的学习效果。当领域间的数据分布差异很大时,会导致严重的负迁移问题。如何充分捕获源域和目标域之间的相似性,进一步挖掘更多有效信息,最终提高目标域的预测精度,是一个值得探索的问题。该文从细粒度主动迁移的视角,提出一种深度子领域迁移学习(Deep subdomain transfer learning,DSTL)算法,能迭代优化源域和目标域之间的相似性,提升模型预测性能。该文首先提出一种伪标签生成策略,对所有样本进行子领域的划分;制定中心+边缘的主动查询策略,获得关键代表性实例的真实标签;设计一种迭代分布优化策略,实现源域和目标域的子领域对齐,避免负迁移。将DSTL算法与传统迁移学习算法以及当前最新的深度迁移学习算法在主流的基准数据集上进行了测试。统计分析的结果表明,该文所提算法能实现性能的有效提升,扩大模型在实际应用中的适用范围。展开更多
以“Z+Z智能教育平台的语音识别接口”的研究开发为背景,针对领域构架包含的构件太多和理解使用太复杂的问题,提出了子领域通用构件(General Component for Sub-domain,GCSD)的概念。GCSD的使用,能极大地简化基于构件的应用程序开发,提...以“Z+Z智能教育平台的语音识别接口”的研究开发为背景,针对领域构架包含的构件太多和理解使用太复杂的问题,提出了子领域通用构件(General Component for Sub-domain,GCSD)的概念。GCSD的使用,能极大地简化基于构件的应用程序开发,提高软件生产效率和产品质量;结合基于构件/构架的软件复用技术和领域工程方法,提出了GCSD的开发方法,并以语音命令识别通用组件的开发为例,展示其开发过程。展开更多
文摘迁移学习能以相关领域中的标注数据为基础,提升目标领域的学习效果。当领域间的数据分布差异很大时,会导致严重的负迁移问题。如何充分捕获源域和目标域之间的相似性,进一步挖掘更多有效信息,最终提高目标域的预测精度,是一个值得探索的问题。该文从细粒度主动迁移的视角,提出一种深度子领域迁移学习(Deep subdomain transfer learning,DSTL)算法,能迭代优化源域和目标域之间的相似性,提升模型预测性能。该文首先提出一种伪标签生成策略,对所有样本进行子领域的划分;制定中心+边缘的主动查询策略,获得关键代表性实例的真实标签;设计一种迭代分布优化策略,实现源域和目标域的子领域对齐,避免负迁移。将DSTL算法与传统迁移学习算法以及当前最新的深度迁移学习算法在主流的基准数据集上进行了测试。统计分析的结果表明,该文所提算法能实现性能的有效提升,扩大模型在实际应用中的适用范围。
文摘以“Z+Z智能教育平台的语音识别接口”的研究开发为背景,针对领域构架包含的构件太多和理解使用太复杂的问题,提出了子领域通用构件(General Component for Sub-domain,GCSD)的概念。GCSD的使用,能极大地简化基于构件的应用程序开发,提高软件生产效率和产品质量;结合基于构件/构架的软件复用技术和领域工程方法,提出了GCSD的开发方法,并以语音命令识别通用组件的开发为例,展示其开发过程。