期刊文献+

特征和语言模型结合的中文文本查错 被引量:1

下载PDF
导出
摘要 引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭 配不当、长距离的语言限制等词一级的错误。基本思想是,构建词语y在上下文x上的条件概率分布 模型p(y|x),查错时根据句子中的上下文x计算y出现的条件概率p(y|x)和y不出现的条件概率 p( y|x)。如果p(y|x) p( y|x),则y无误;反之,y有错。实验结果表明,该方法获得了平均 91.14%的召回率和65.70%的准确率。
作者 陈笑蓉 秦进
出处 《计算机应用》 CSCD 北大核心 2004年第B12期259-261,共3页 journal of Computer Applications
基金 贵州省科学技术基金项目(993021)
  • 相关文献

参考文献3

二级参考文献17

  • 1张磊,周明,黄昌宁,潘海华.中文文本自动校对[J].语言文字应用,2001(1):19-26. 被引量:23
  • 2孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量:66
  • 3白硕,语言学知识的计算机辅助发现,1995年
  • 4方开泰,实用多元统计分析,1989年
  • 5施得胜等.基于统计的中文错字侦测法[J].电脑与通讯,1992,(8).
  • 6Manning C D, Schütze H. FOUNDATIONS OF STATISTICAL NATURAL LANGUAGE PROCESSING The MTH Press, 1999
  • 7Kukich K. Techniques for automatically correcting words in text.ACM Computing Surveys, 1992, 24 (4)
  • 8Zhang Zhaohuang. A Pilot Study on Automatic Chinese Spelling Error Correction. Communication of COLIPS,1994,4(2): 143 - 149
  • 9Lei Zhang, Ming Zhou, Changning Huang, etc. Multifeature- based approach to automatic error detection and correction of Chinese text. In Proc. Workshop NLPRS'99, Beijing. 1999.
  • 10Sun Cai. Research on Lexical Error Detection and Correction of Chinese Text: [Master's Degree Dissertation]. Beijing: Tsinghua University Computer Science and Technology Department, 1997

共引文献69

同被引文献9

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部