-
题名基于决策列表的中文同音词自动识别与校对
被引量:2
- 1
-
-
作者
石敏
高尚
-
机构
江苏科技大学计算机科学与工程学院
-
出处
《电子设计工程》
2015年第9期39-41,共3页
-
基金
人工智能四川省重点实验室开放基金(2012RYJ04)
中科院智能信息处理重点实验室开放课题(IIP2013-1)
-
文摘
中文文本校对是自然语言处理领域重要课题,在汉语校对中,文本错误有很多种,其中同音词错误占很大的比例,文中提出一种基于决策列表的方法,首先手工整理出常见的1000对同音词混淆集,通过大量语料训练出2元模型和上下文语境模型,校对文本时提取词以及它所有同音词的2元特征和上下文特征,根据训练好的模型计算出支持度,这就是同音词组决策列表的构建,从决策列表中判断哪个词的支持度最高,从而实现同音词自动查错与纠错。最后,为了改善由于数据稀疏带来的问题,文章用同义词聚类对实验进行了改进,提高了召回率等。根据实验,这种方法能有效的解决同音词错误。
-
关键词
同音词错误
决策列表
2元模型
上下文语境
-
Keywords
homophone errors
decision list
2-gram model
context
-
分类号
TN02
[电子电信—物理电子学]
-