期刊文献+

彝文网页文本分词平台 被引量:2

Analysis and Discussion of Yi Word Segmentation
下载PDF
导出
摘要 在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、分词算法、结构流程、系统界面和模块、实验结果等方面进行了详细的分析,最终实现彝文网页文本分词平台.最后的结果表明,本平台分词准确率较高,实用性和通用性也较好. In the fields of machine translation, automatic classificationand search engine technology, Yi word segmentation plays a very important role, which is also a vital part in Yi language information processing. This paper is based on the current segmentation of Yi word.Through the construction of Yi thesaurus and webpages of Yi, we can grab the page texts of Yi. Combining with the advantages of Yi language, with a detailed analysis such as the thesaurus, word segmentation algorithm, flowchart and structure, system interface and modulesand the experimental results, we build the segmentation platform of Yi page text. Finally, the results show that the segmentation platform has a property of higher accuracy, practicality and versatility.
作者 孙善通 王嘉梅 李炳泽 胡刚 SUN Shah-Tong WANG Jia-Mei LI Bing-Ze HU Gang(School of Electrical and Information Technology, Yunnan Minzu University, Kunming 650500, Chin)
出处 《计算机系统应用》 2016年第11期243-246,共4页 Computer Systems & Applications
基金 国家自然科学基金(61363085)
关键词 彝文网页 词典分词 词库 彝文分词 分词平台 Yi web pages segmentation dictionary thesaurus Yi word segmentation word segmentation platform
  • 相关文献

参考文献7

二级参考文献16

  • 1邓宏涛.中文自动分词系统的设计模型[J].计算机与数字工程,2005,33(4):138-140. 被引量:13
  • 2郭军,马跃,盛立东,钟义信.发展中的文字识别理论与技术[J].电子学报,1995,23(10):184-187. 被引量:21
  • 3周文帅,冯速.汉语分词技术研究现状与应用展望[J].山西师范大学学报(自然科学版),2006,20(1):25-29. 被引量:16
  • 4吕凤军.数字图像处理编程入门[M].北京:清华大学出版社,1999..
  • 5陈小荷.现代汉语自动分析[M].北京:北京语言文化大学出版社,2000..
  • 6[2]Sankur B,Sezgin M.Image thresholding techniques:a survey over categories[R].Berlin:Pattern Recognition,2001.
  • 7[5]Casey R G,Lecolinet E.A survey of methods and strategies in character segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(7):690-706.
  • 8冯志伟.计算机中文信息处理[M].北京:北京出版社,2001.
  • 9李金发.彝语真人发音词典的开发.西南民族大学学报:自然科学版,2005,10:34-37.
  • 10陈顺强.《彝语文现代化与彝文信息处理》[J].西南民族大学学报:自然科学版,2007,.

共引文献26

同被引文献28

引证文献2

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部