汉语NP识别方法的实验比较研究

The Test Comparison Research on Chinese NP Recognition Methods

下载PDF

导出

摘要利用错误驱动法、支持向量机法和隐马尔可模型3种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效果总体上要好于错误驱动法,HMM法在封闭测试中优势明显.研究表明错误驱动法适用于解决从语料库中学习转换规则的传统问题;SVM方法适用于解决两类别的分类问题;而HMM方法侧重应用在与线性序列相关的现象上. This paper adopts three methods including Error-Driven, Support Vector Machines and Hidden Markov Model to recognize noun phrases in Chinese texts. Through the comparison and analysis to the experiments , the result shows that the recognition effect of the latter two methods is better then the effect of the first one, and the function of HMM in the closed test is dominant. The study shows that the Error-Driven method is often used to solve the traditional problems of learning transformation regulations from corpus, SVM is adaptable to solve the classification problem of two categories, and that HMM is mainly used on the problems related to linear array.

作者李荣郑家恒

机构地区忻州师范学院计算机系山西大学计算机与信息技术学院

出处《河南师范大学学报（自然科学版）》 CAS CSCD 北大核心 2007年第3期27-29,共3页 Journal of Henan Normal University(Natural Science Edition)

基金国家自然科学基金(60473139) 忻州师范学院科研基金(200623)

关键词错误驱动支持向量机隐马尔可夫模型短语识别 Error-Driven Support Vector Machines Hidden Markov Model phrase recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1Church K W.A stochastic parts program and noun phrase parser for unrestricted text[C].Proceedings of the Second Conference on Applied Natural Language Processing,Austin Texas,1988.
2Brill E.Transformation-based error-driven learning and natural language processing:a case study in part-of-speech tagging[J].Computational Linguistics,1995,21(4):543-565.
3张健沛,徐华.支持向量机(SVM)主动学习方法研究与应用[J].计算机应用,2004,24(1):1-3. 被引量：51
4曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
5Rabiner L R.A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition[J].Proc IEEE,1989,77(2):257-286.
6李荣.汉语名词短语自动识别方法研究[D].太原:山西大学计算机与信息技术学院,2004.

二级参考文献9

1[3]S. Amari and S. Wu. Improving support vector machine classifiers by modifying kernel functions [J].Neural Networks,1999. to appear.
2李国正王蒙曾华军译.支持向量机导论[M].北京:电子工业出版社,2004-03..
3VAPNIKVN 张学工译.统计学习理论的本质[M].清华大学出版社,2000..
4周强.汉语短语的自动划分和标注[J].中文信息学报,1997,11(1):1-10. 被引量：21
5朱靖波,张玥杰,姚天顺.一种短语结构规则的自动获取方法[J].计算机研究与发展,1999,36(5):601-607. 被引量：3
6谭立球,谷士文,费耀平.个人化电子邮件自动过滤系统的设计[J].计算机应用,2002,22(6):54-55. 被引量：17
7侯风雷,王炳锡.基于说话人聚类和支持向量机的说话人确认研究[J].计算机应用,2002,22(10):33-35. 被引量：11
8张昱琪,周强.汉语基本短语的自动识别[J].中文信息学报,2002,16(6):1-8. 被引量：41
9张健沛,徐华.支持向量机(SVM)主动学习方法研究与应用[J].计算机应用,2004,24(1):1-3. 被引量：51

共引文献52

1杨迎春.能想多远,就能走多远——上海利策投资管理公司总经理查大兵谈用人标准[J].成才与就业,2005(21):31-32.
2曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
3王丽侠.邮件过滤与个性化分类模型的研究[J].微机发展,2005,15(9):42-44.
4陈治平,王雷.基于自学习K近邻的垃圾邮件过滤算法[J].计算机应用,2005,25(B12):7-8. 被引量：15
5段丹青,陈松乔,杨卫平.网络入侵检测中的支持向量机主动学习算法[J].计算机工程与应用,2006,42(1):117-119. 被引量：5
6凌俊斌,庄卫华,刘鲁西.图像检索中的主动学习及其可测量性[J].计算机技术与发展,2006,16(2):132-134. 被引量：3
7陈增照,杨扬,董才林,何秀玲.支持向量机动态学习方法及其在票据识别中的应用[J].北京科技大学学报,2006,28(2):199-202. 被引量：3
8段丹青,陈松乔,杨卫平.基于SVM主动学习算法的网络入侵检测系统[J].计算机工程与科学,2006,28(4):33-36. 被引量：2
9纪习尚,宫宁生,朱梧槚.基于最优分类面的神经网络模式分类方法[J].计算机工程,2006,32(22):206-208. 被引量：1
10李荣,郑家恒.基于语料库的名词短语识别方法[J].济南大学学报（自然科学版）,2007,21(3):243-245. 被引量：2

1李荣,郑家恒.三种方法的NP识别比较实验研究[J].通化师范学院学报,2007,28(4):44-46.
2李荣.基于隐马尔可夫模型的汉语非嵌套名词短语识别[J].忻州师范学院学报,2004,20(5):122-124. 被引量：1
3张惠春.基于最大熵模型的中文名词短语识别[J].电脑知识与技术（过刊）,2009,15(3X):1928-1930.
4郝莹,李蓬,田芳,杨苗.基于系统调用的混合HMM/MLP异常检测模型[J].信息与控制,2008,37(2):214-218. 被引量：1
5丁纪凯.HMM识别孤立词的研究与实现[J].中国纺织大学学报,1990,16(3):60-68.
6王伟,甘艳珍,刘桂香,朱学峰.MFA与PID控制器的实验比较研究[J].自动化仪表,2008,29(5):27-29. 被引量：13
7陈辉堂,蒋平,王月娟.直接驱动机器人控制算法的试验研究和比较[J].机器人,1995,17(2):113-120. 被引量：4
8于美娟,马希荣.基于HMM方法的动态手势识别技术的改进[J].计算机科学,2011,38(1):251-252. 被引量：12
9赵仲方,王士同.模糊系统的确定及其比较研究[J].华东船舶工业学院学报,1998,12(1):17-24.
10王金龙.数据挖掘研究进展[J].青岛理工大学学报,2007,28(4):80-82. 被引量：11

河南师范大学学报（自然科学版）

2007年第3期

浏览历史

内容加载中请稍等...

汉语NP识别方法的实验比较研究

参考文献6

二级参考文献9

共引文献52

相关作者

相关机构

相关主题

浏览历史