期刊文献+

一种基于特征迁移的跨领域中文分词模型 被引量:1

A cross-domain Chinese word segmentation model based on feature transfer
下载PDF
导出
摘要 中文分词是自然语言处理的常见任务之一。在跨领域分词任务中,目标领域的数据分布不同及数据量不足通常导致分词效果急剧下降。基于该问题,本文通过引入了迁移学习、对抗学习和正交约束以减轻共享和私有特征之间的干扰,提出了一种基于特征迁移的跨领域中文分词模型,能够在跨领域和小数据量条件下,借鉴数据量较大的源领域的知识来进行学习,实验证明该模型最终获得了出色的表现。 Chinese word segmentation is one of the common tasks in natural language processing.In cross-domain Chinese word segmentation tasks,the different distributions between two different domains and the lack of enough training data often result the low performance.For this problem,we propose a cross-domain Chinese word segmentation model based on feature transfer,which introduces transfer learning,adversarial learning and orthogonal constraints to reduce the interferences between shared and private features.This model can learn from the knowledge of source domain with large amount of data under the premise of small amount of data and cross-domain.Experimental results show that the scheme achieves excellent performance.
作者 张韬政 张家健 ZHANG Taozheng;ZHANG Jiajian(School of information and communication engineering,Communication University of China,Beijing 100024,China)
出处 《中国传媒大学学报(自然科学版)》 2021年第3期41-45,74,共6页 Journal of Communication University of China:Science and Technology
基金 中国传媒大学中央高校基本科研业务费专项资金资助(3132018XNG1829)。
关键词 迁移学习 对抗学习 正交约束 中文分词 transfer learning adversarial learning orthogonal constraints Chinese word segmentation
  • 相关文献

参考文献3

二级参考文献24

  • 1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量:198
  • 2罗智勇 宋柔.现代汉语自动分词中专名的一体化、快速识别方法[A]..ICCC,Singapore[C].,2001.11..
  • 3季姮,罗振声.基于反比概率模型和规则的中文姓名自动辨识系统[A].自然语言理解与机器翻译[C].北京:清华大学出版社,2001.123-128.
  • 4何燕.基于单字词转移概率的未登录词识别[A].自然语言理解与机器翻译[C].北京:清华大学出版社,2001 141-146.
  • 5张艳丽,黄德根等.统计和规则相结合的中文机构名称识别[A].自然语言理解与机器翻译[C].北京:清华大学出版社,2001.233-239.
  • 6SUN J,GAO J F,ZHANG L,et al.Chinese named entity identification using class-based language model[A].Proc of the 19th International Conference on Computational Linguistics[C].Taipei:Morgan Kauffmann Press,2002.967-973.
  • 7YU H,ZHANG H,LIU Q.Recognition of Chinese organization name based on role tagging[A].Advances in Computation of Oriental Languages[C].Beijing:Tsinghua University Press,2003.79-87
  • 8ZHANG H,LIU Q,YU H,et al.Chinese named entity recognition using role model[J].The International Journal of Computational Linguistics and Chinese Language Processing,2003,8(2):1-31.
  • 9RICHARD S,THOMAS E.The first international Chinese word segmentation bakeoff[A].Second SIGHAN Workshop on Chinese Language Processing[C].Sapporo:Sapporo Press,2003.133-143.
  • 10张梅山,邓知龙,车万翔,刘挺.统计与词典相结合的领域自适应中文分词[J].中文信息学报,2012,26(2):8-12. 被引量:44

共引文献215

同被引文献9

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部