期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
传统蒙古文“同形不同码”问题研究
1
作者 安波 诺明花 +2 位作者 吴健 刘汇丹 马龙龙 《信息技术与标准化》 2015年第1期62-66,共5页
设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每个传统蒙古文词生成字形图,并根据字形图之间的相似度识别出... 设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每个传统蒙古文词生成字形图,并根据字形图之间的相似度识别出相同的字形。系统根据倒排索引、同形词列表统计出语料中传统蒙古文同形不同码的情况。实验结果显示,同形不同码问题在传统蒙古文中普遍存在,反映出了制定相关标准的迫切性。 展开更多
关键词 传统蒙古文 同形不同码 爬虫 倒排索引 语料库
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部