期刊文献+

基于偏旁部首知识表示学习的汉字字形相似度计算方法 被引量:3

A Method of Chinese Character Glyph Similarity Calculation Based on Radical Knowledge Representation Learning
下载PDF
导出
摘要 该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题。首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到目标汉字的形似字候选集。实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集。同时,也拓宽了日语等类汉语语言文字字体相似度计算的研究思路。 The paper proposes a method for calculating the similarity of character glyphs,which aims to solve the problem of identifying similar Chinese characters.First,we construct a radical knowledge graph according to the character’s composition.Then,based on the knowledge graph and structure features,the paper proposes 2 CTransE to learn the semantic representation of entities.Finally,we calculate the character similarity by the entity vector.Results show that the method are effective in similar characters identification.And the component library can be used in the subsequent related researches.We also propose a novel method for Japanese and other similar languages in character similarity calcalation.
作者 刘梦迪 梁循 LIU Mengdi;LIANG Xun(School of Information,Renmin University of China,Beijing 100872,China)
出处 《中文信息学报》 CSCD 北大核心 2021年第12期47-59,共13页 Journal of Chinese Information Processing
基金 北大方正集团有限公司数字出版技术国家重点实验室开放课题 京东商城电子商务研究项目(413313012) 国家社会科学基金(18ZDA309) 国家自然科学基金(71531012) 北京市自然科学基金(4172032)
关键词 知识图谱表示学习 汉字部件 形似字 knowledge graph representation learning Chinese character components similar characters
  • 相关文献

参考文献10

二级参考文献207

共引文献668

同被引文献15

引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部