期刊文献+

基于格助词和接续特征的藏文自动分词方案 被引量:49

An Automatic Tibetan Segmentation Scheme Based on Case-Auxiliary Words and Continuous Features
下载PDF
导出
摘要 本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的确定性分词。初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。 This paper proposes a cascaded written Tibetan word segmentation scheme, which is based on case auxiliary words and continuous features. Using inflectional information such as case auxiliary words and continuous features and adopting a cascaded strategy are the key features of the proposed scheme. Preliminary experiments suggest that it could detect and eliminate segmentation ambiguities and deal with unknown words. The scheme has significant practical value in increasing the precision of segmentation.
出处 《语言文字应用》 CSSCI 北大核心 2003年第1期75-82,共8页 Applied Linguistics
基金 国家 8 6 3计划 (2 0 0 1AA114 0 4 0 ) 973项目 (G19980 30 5 0 7 4 )资助
关键词 格助词 接续特征 藏文分词 case auxiliary words continuous features Tibetan word segmentation
  • 相关文献

参考文献7

二级参考文献7

  • 1宋柔,计算语言学研究与应用,1993年
  • 2孙茂松,计算语言学研究与应用,1993年
  • 3郑家恒,计算语言学研究与应用,1993年
  • 4张俊盛,中文信息学报,1992年,6卷,3期
  • 5团体著者,姓氏人名用字分析统计,1990年
  • 6梁南元.书面汉语自动分词系统—CDWS[J]中文信息学报,1987(02).
  • 7揭春雨,刘源,梁南元.论汉语自动分词方法[J].中文信息学报,1989,3(1):1-9. 被引量:55

共引文献129

同被引文献360

引证文献49

二级引证文献237

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部