-
题名基于信息增益改进贝叶斯模型的汉语词义消歧
被引量:8
- 1
-
-
作者
范冬梅
卢志茂
张汝波
潘树燊
-
机构
哈尔滨工程大学计算机学院
哈尔滨工业大学
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2008年第12期2926-2929,共4页
-
基金
国家自然科学基金(60575042,60603092)
国家教育部博士点专向基金(20070217043)资助课题
-
文摘
词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。
-
关键词
词义消歧
自然语言处理
信息增益
贝叶斯模型
-
Keywords
Word sense disambiguation
Natural language processing
Information gain
Naive Bayesian model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-