从搭配知识获取最优种子的词义消歧方法被引量：12

Chinese WSD Based on Selecting the Best Seeds from Collocations

下载PDF

导出

摘要基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词 ,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识 ,但人工获取质量较好的初始搭配是比较困难的 ,并且无法保证有效的扩大搭配知识。针对该问题 ,提出了通过机器学习初始搭配实例获取最优种子 ,再由最优种子扩增更多指示词 ,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对 8个多义词进行消歧的测试实验中取得了 87 7%的平均正确率。 The key problem of word sense disambiguation based on statistic model lies in how to acquiring the word sense indicators automatically. Although it is feasible to acquire a large number of collocations by learning examples, it is hard to select good seeds manually to increase new collocations effectively. The method of selecting the best seeds by machine learning is provided in this paper to solve this problem. The best seeds are used to augment more new word sense indicators; finally disambiguate polysemous words with the acquired indicators. The average accuracy is 87.7% for 8 polysemous words by this method.

作者全昌勤何婷婷姬东鸿刘辉

机构地区华中师范大学计算机科学与技术系新加坡国家科技局信息科学研究院华中师范大学生命科学学院

出处《中文信息学报》 CSCD 北大核心 2005年第1期30-35,共6页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目 (10 0 710 2 8) 国家语言文字应用委员会语言文字应用"十五"科研项目

关键词人工智能自然语言处理自然语言处理词义消歧搭配种子优选 artificial intelligence natural language processing natural language processing word sense disambiguation collocation select seeds

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1Nancy I de, Jean Veronis. Introduction to the Special Issue on Word Sense Disambiguation:The State of the Art[J].Computational Linguistics. 1998, 1-42.
2Yarowsky D. Umupervised Word Sense Disambiguation Rivaling Supervised Methods[A]. In: Proceedings of 33rd Annual Meeting of ACL[C], Cambridge, Massachusetts, USA, 1995, 181 - 188.
3HAO Trang Dang, Ching - yi Chia. Simple Features for Chinese Word Sense Disambiguation[A]. In: Proceedings of COLING-2002 [ C ].Philadelphia, USA, 2002, 88- 94.
4Lesk, Michael, Automatic Sense Disambiguation: How to tell a Pine Cone from and Ice Cream Cone, Proceeding of the 1986 SIGDOC Conference, Association for Computing Machinery, New York, 1986.

同被引文献170

1孙茂松,黄昌宁,方捷.汉语搭配定量分析初探[J].中国语文,1997(1):29-38. 被引量：54
2卢志茂,刘挺,郎君,李生.神经网络和贝叶斯网络在汉语词义消歧上的对比研究[J].高技术通讯,2004,14(8):15-19. 被引量：9
3王振华,孔祥龙,陆汝占,刘绍明.结合决策树方法的中文姓名识别[J].中文信息学报,2004,18(6):10-15. 被引量：15
4张克亮.基于HNC理论的句法结构歧义消解[J].中文信息学报,2004,18(6):43-52. 被引量：9
5曲维光,陈小荷,吉根林.基于框架的词语搭配自动抽取方法[J].计算机工程,2004,30(23):22-24. 被引量：17
6刘蓓,杜利民.汉语口语对话系统中语义分析的消歧策略[J].中文信息学报,2005,19(1):76-83. 被引量：3
7杨莹,李应潭.基于意象知识的消歧体系[J].中文信息学报,1993,7(1):40-47. 被引量：1
8钱树人.歧义、系统歧义和语境[J].中文信息学报,1993,7(2):18-26. 被引量：7
9徐秉铮,詹剑,贺前华.基于神经网络的分词方法[J].中文信息学报,1993,7(2):36-44. 被引量：15
10邰晓英,童頫.限制汉语语法分析中歧义性的启发式方法[J].中文信息学报,1993,7(4):10-17. 被引量：3

引证文献12

1刘莉,谈文蓉.统计学习方法在语义消歧中的应用研究[J].西南民族大学学报（自然科学版）,2007,33(1):193-196.
2孟维娟.自然语言处理中的歧义[J].上海电机学院学报,2006,9(S1):16-19. 被引量：1
3谈文蓉,符红光,刘莉,杨宪泽.一种基于贝叶斯分类与机读词典的多义词排歧方法[J].计算机应用,2006,26(6):1389-1391. 被引量：5
4王素格,杨军玲,张武.自动获取汉语词语搭配[J].中文信息学报,2006,20(6):31-37. 被引量：14
5吴云芳,金澎,郭涛.基于词典属性特征的粗粒度词义消歧[J].中文信息学报,2007,21(2):3-8. 被引量：9
6汤小娜,苏劲松.贝叶斯分类在词义消歧中的分析[J].黑龙江科技信息,2007(04S):38-38.
7于丽丽,丁德鑫,曲维光,陈小荷,李惠.基于条件随机场的古汉语词义消歧研究[J].微电子学与计算机,2009,26(10):45-48. 被引量：13
8车超,滕弘飞.伪实例与人工标注实例相结合的词义消歧方法[J].中文信息学报,2009,23(6):31-38. 被引量：1
9李纲,蔻广增.自举在词义消歧中的应用及其关键问题[J].情报学报,2010,29(1):93-99.
10张禄彭,易绵竹,周云.中文歧义研究25年——以《中文信息学报》论文为例[J].中文信息学报,2012,26(4):73-84. 被引量：4

二级引证文献69

1刘莉,谈文蓉.统计学习方法在语义消歧中的应用研究[J].西南民族大学学报（自然科学版）,2007,33(1):193-196.
2姜文志,蒋伟俊,范洪达.汉语分词技术在信息工程中的应用[J].信息与电子工程,2007,5(5):385-387. 被引量：5
3范冬梅,卢志茂,张汝波,潘树燊.基于信息增益改进贝叶斯模型的汉语词义消歧[J].电子与信息学报,2008,30(12):2926-2929. 被引量：8
4程月,陈小荷.基于条件随机场的汉语动宾搭配自动识别[J].中文信息学报,2009,23(1):9-15. 被引量：9
5李新福,赵蕾蕾,何海斌,李芳.使用Logistic回归模型进行中文文本分类[J].计算机工程与应用,2009,45(14):152-154. 被引量：10
6吴云芳.词义消歧研究:资源、方法与评测[J].当代语言学,2009,11(2):113-123. 被引量：8
7温春,石昭祥,张亮.中文领域本体概念层次获取方法对比研究[J].计算机应用研究,2009,26(8):2847-2850. 被引量：8
8刘商飞,张志祥.基于改进的Bayes判别法的中文多义词消歧[J].计算机与数字工程,2009,37(10):32-35. 被引量：3
9林建方,牛成,李生,郑德权.Web数据反馈的搭配抽取方法[J].哈尔滨工业大学学报,2010,42(2):281-285.
10王素格,杨安娜.基于混合语言信息的词语搭配倾向判别方法[J].中文信息学报,2010,24(3):69-74. 被引量：8

1蔡军,邹鹏,沈弼龙,何骏.基于改进轮盘赌策略的反馈式模糊测试方法[J].四川大学学报（工程科学版）,2016,48(2):132-138. 被引量：10
2辛日华,辛日峰.探究NVEF义对标识库的构建[J].电脑知识与技术（过刊）,2013,19(12X):8068-8069.
3全昌勤,何婷婷,姬东鸿,刘辉.基于指示词的词义消歧方法[J].计算机工程,2005,31(16):48-50.
4龚永恩,袁春风,武港山.基于语义的词义消歧算法初探[J].计算机应用研究,2006,23(3):41-43. 被引量：8
5谢芳,胡泉.基于BP神经网络的词义消歧模型[J].计算机工程与应用,2006,42(12):187-189. 被引量：3
6郑晓菊.使用实例获取软件需求的方法[J].韩山师范学院学报,2004,25(3):33-36.
7曹鸿霞.统计与神经网络相结合的词义消歧模型[J].武汉理工大学学报,2006,28(8):131-134. 被引量：2
8李涓子,黄昌宁,杨尔弘.一种自组织的汉语词义排歧方法[J].中文信息学报,1999,13(3):1-8. 被引量：13
9张仰森,郭江.动态自适应加权的多分类器融合词义消歧模型[J].中文信息学报,2012,26(1):3-8. 被引量：1
10冯素琴,陈惠明.一种自组织的汉语组合型歧义消歧方法[J].计算机工程与设计,2007,28(3):737-739. 被引量：3

中文信息学报

2005年第1期

浏览历史

内容加载中请稍等...

从搭配知识获取最优种子的词义消歧方法被引量：12

参考文献4

同被引文献170

引证文献12

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

从搭配知识获取最优种子的词义消歧方法 被引量：12

参考文献4

同被引文献170

引证文献12

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

从搭配知识获取最优种子的词义消歧方法被引量：12