期刊文献+

带标注语料库的分词不一致研究综述

下载PDF
导出
摘要 目前,带标注语料库因为标注质量等原因严重影响了汉语的自动分词和测评,而其中影响较大的就是语料库中分词的不一致。本文总结并分析了前人对于分词不一致的各种研究,廓清了分词不一致的概念,提出分词不一致最好按照所属类别统一处理,同一类型的词应该处理成相同的切分形式。
作者 董宇
机构地区 金陵科技学院
出处 《现代语文(下旬.语言研究)》 2008年第8期106-108,共3页 Modern Chinese
  • 相关文献

参考文献6

二级参考文献20

  • 1孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量:20
  • 2黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量:83
  • 3宋柔.关于分词规范的探讨[J].语言文字应用,1997(3):113-114. 被引量:12
  • 4孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量:101
  • 5郑家恒 吴芳芳.多义型歧义字段切分研究.北京:全国第五届计算语言学联合学术会议论文集[M].,1999.129-134.
  • 6邢红兵.词性标注中难归类词语分析.北京:全国第五届计算语言学联合学术会议论文集[M].,1999.187-192.
  • 7黄昌宁 高剑峰 李沐.对自动分词的反思[C]..全国第七届语言学联合学术会议[C].,2003.26-38.
  • 8郑家恒.大规模中文文本语料库深加工质量检验技术研究(863项目)的研究报告(B)[R].山西大学计算机与信息技术学院,2003..
  • 9郑家恒 吴芳芳.多义歧义切分方法研究[C]..全国第五届计算语言会议论文集[C].,1999.129-134.
  • 10Mu Li, Jian Feng Gao, Changning Huang. Unsupervised training for overlapping ambiguity resolution in Chinese word senmetation[A]. Sighan workshop on Chinese language Processing[C]. 2003:1 -7.

共引文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部