期刊文献+

一种改进的中文词嵌入模型

The Modified Chinese Word Embeddings Model
下载PDF
导出
摘要 针对当前中文词嵌入模型无法较好地建模汉字字形结构的语义信息,提出了一种改进的中文词嵌入模型.该模型基于词、字和部件(五笔编码)等粒度进行联合学习,通过结合部件、字和词来构造词嵌入,使得该模型可以有效学习汉字字形结构所蕴含的语义信息,在一定程度上提升了中文词嵌入的质量. Considering that current Chinese word embedding model can not well model the semantic information of Chinese character′s glyph structure,an improved Chinese word embedding model is proposed.The model constructs joint learning based on the granularities of words,characters and components(WUBI),can effectively learn the semantic information contained in the Chinese character glyph structure by constructing word embedding with components,characters and words,and improves the quality of Chinese word embeddings.
作者 杨雨晴 吴水秀 左家莉 YANG Yuqing;WU Shuixiu;ZUO Jiali(College of Computer and Information Engineering,Jiangxi Normal University,Nanchang Jiangxi 330022,China)
出处 《江西师范大学学报(自然科学版)》 CAS 北大核心 2021年第2期131-136,共6页 Journal of Jiangxi Normal University(Natural Science Edition)
基金 国家自然科学基金(60866018)资助项目.
关键词 词嵌入 语言模型 自然语言处理 word embedding language model nature language processing
  • 相关文献

参考文献1

二级参考文献10

  • 1王永民.计算机汉字键盘设计“三原理”[J].计算机学报,2005,28(5):870-881. 被引量:5
  • 2Lucas W 成礼智(译).离散与系统模型[M].长沙:国防科技大学出版社,1996.36-39.
  • 3王永民.汉字编码的理论与实践.中文信息国际研讨会论文集(2),1983:29-31.
  • 4王永民.中国专利号:ZL85100837.2,说明书.
  • 5王永民.中国专利号:ZL03150281.4,说明书.
  • 6饶宗颐.符号·初文和字母——汉字树.上海:上海书店出版社,2000:23.
  • 7Kapur J N. Mathematical Modeling. John Wiley & Sons, 1988.
  • 8Sakai, Nagao, Terai. A description of Chinese characters using sub-patterns. Information Processing, 1969, 10(5): 285-293.
  • 9Myers W. Key developments in computer technology: A survey. Computer, 1976:48-78.
  • 10Berry J S. Teaching and Applying Mathematical Modeling. John Wiley & Sons, 1984.

共引文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部