摘要
引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭 配不当、长距离的语言限制等词一级的错误。基本思想是,构建词语y在上下文x上的条件概率分布 模型p(y|x),查错时根据句子中的上下文x计算y出现的条件概率p(y|x)和y不出现的条件概率 p( y|x)。如果p(y|x) p( y|x),则y无误;反之,y有错。实验结果表明,该方法获得了平均 91.14%的召回率和65.70%的准确率。
出处
《计算机应用》
CSCD
北大核心
2004年第B12期259-261,共3页
journal of Computer Applications
基金
贵州省科学技术基金项目(993021)