半监督学习和主动学习相结合的浅层语义分析被引量：13

Combining Semi-Supervised Learning and Active Learning for Shallow Semantic Parsing

下载PDF

导出

摘要语义分析是基于内容的文本挖掘领域的重要技术和研究难点。有监督机器学习方法受限于标注语料的规模,在小规模标注样本中难以获取较高性能。本文面向浅层语义分析任务,采用一种新颖的半监督学习方法——直推式支持向量机,并结合其训练特点提出了基于主动学习的样本优化策略。实验表明,本文提出的浅层语义分析方法通过整合主动学习与半监督学习,在小规模标注样本环境中取得了良好的学习效果。 Semantic analysis is one of the fundamental and key problems in the research of content-based Text Mining. Most of supervised machine learning methods led to poor performance when work on limited tagged data. This paper investigated a novel semi supervised learning algorithm Transductive Support Vector Machine for shallow se- mantic parsing. An optimization strategy of selecting training instances, based on active learning, was integrated with TSVM. The experiment result shows that the method integrating TSVM and optimization strategy for shallow semantic parsing outperforms supervised methods on small tagged data.

作者陈耀东王挺陈火旺

机构地区国防科技大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2008年第2期70-75,共6页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(60403050) 新世纪优秀人才支持计划资助项目(NCET-06-0926)

关键词计算机应用中文信息处理浅层语义分析半监督学习直推式支持向量机主动学习 computer application Chinese information processing shallow semantic parsing semi-supervised learning transductive SVM active learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Xavier Carreras, Lluis Marquez. Introduction to the CoNLL-2005 Shared Task: Semantic Role Labeling[A]. In: Proceedings of CoNLL-2005[C]. 2005.
2T. Joachims. Transductive inference for text classification using support vector machines [A]. In: Proc. of ICML-99[C]. 1999. 200-209.
3Levin, Beth. English Verb Class and Alternations: A Preliminary Investigation [M]. Chicago: University of Chicago Press. 1993.
4AP Engelbrecht et al. Incremental Learning Using Sensitivity Analysis. IJCNN ' 99 [A]. International Joint Conference on Neural Networks [C]. 1999(2): 1350- 1355.
5CA Thompson, ME Califf, RJ Mooney. Active Learning for Natural Language Parsing and Information Extraction [A]. In: Proceedings of the Sixteenth International Machine Learning Conference[C]. Slovenia, 1999.
6张健沛,徐华.支持向量机(SVM)主动学习方法研究与应用[J].计算机应用,2004,24(1):1-3. 被引量：51
7Nianwen Xue, Martha Palmer. Automatic Semantic Role Labeling for Chinese Verbs [A]. In: The Proceedings of the Nineteenth International Joint Confer ence on Artificial Intelligence, Edinburgh, Scotland[C]. 2005.

二级参考文献3

1VAPNIKVN 张学工译.统计学习理论的本质[M].清华大学出版社,2000..
2谭立球,谷士文,费耀平.个人化电子邮件自动过滤系统的设计[J].计算机应用,2002,22(6):54-55. 被引量：17
3侯风雷,王炳锡.基于说话人聚类和支持向量机的说话人确认研究[J].计算机应用,2002,22(10):33-35. 被引量：11

共引文献50

1杨迎春.能想多远,就能走多远——上海利策投资管理公司总经理查大兵谈用人标准[J].成才与就业,2005(21):31-32.
2曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
3王丽侠.邮件过滤与个性化分类模型的研究[J].微机发展,2005,15(9):42-44.
4陈治平,王雷.基于自学习K近邻的垃圾邮件过滤算法[J].计算机应用,2005,25(B12):7-8. 被引量：15
5段丹青,陈松乔,杨卫平.网络入侵检测中的支持向量机主动学习算法[J].计算机工程与应用,2006,42(1):117-119. 被引量：5
6凌俊斌,庄卫华,刘鲁西.图像检索中的主动学习及其可测量性[J].计算机技术与发展,2006,16(2):132-134. 被引量：3
7陈增照,杨扬,董才林,何秀玲.支持向量机动态学习方法及其在票据识别中的应用[J].北京科技大学学报,2006,28(2):199-202. 被引量：3
8段丹青,陈松乔,杨卫平.基于SVM主动学习算法的网络入侵检测系统[J].计算机工程与科学,2006,28(4):33-36. 被引量：2
9纪习尚,宫宁生,朱梧槚.基于最优分类面的神经网络模式分类方法[J].计算机工程,2006,32(22):206-208. 被引量：1
10王毅,谢治华,梁国彪.基于知识积累方法的垃圾邮件过滤算法[J].科学技术与工程,2007,7(11):2556-2558.

同被引文献146

1龙军,殷建平,祝恩,赵文涛.主动学习研究综述[J].计算机研究与发展,2008,45(z1):300-304. 被引量：31
2栾丽华,吉根林.决策树分类技术研究[J].计算机工程,2004,30(9):94-96. 被引量：115
3李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
4车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
5周昭涛,卜东波,程学旗.文本的图表示初探[J].中文信息学报,2005,19(2):36-43. 被引量：17
6袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
7秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
8刘晶,郭雷,聂晶鑫.基于SVM的一种新的分类器设计方法[J].计算机应用研究,2006,23(7):181-182. 被引量：5
9张翔,肖小玲,徐光祐.基于最大熵估计的支持向量机概率建模[J].控制与决策,2006,21(7):767-770. 被引量：12
10赵英刚,陈奇,何钦铭.一种基于支持向量机的直推式学习算法[J].江南大学学报（自然科学版）,2006,5(4):441-444. 被引量：8

引证文献13

1刘健苗,王浩畅,赵铁军.基于TSVM与主动学习融合的蛋白质交互作用关系抽取[J].高技术通讯,2009,19(5):480-486.
2詹永照,陈亚必.具有噪声过滤功能的协同训练半监督主动学习算法[J].模式识别与人工智能,2009,22(5):750-755. 被引量：7
3陈锦禾,沈洁.基于信息熵的主动学习半监督分类研究[J].计算机技术与发展,2010,20(2):110-113. 被引量：8
4徐海龙,王晓丹,廖勇,权文.一种基于主动学习的SVM增量训练算法[J].控制与决策,2010,25(2):282-286. 被引量：3
5李业刚,孙福振,李鉴柏,吕新宇.语义角色标注研究综述[J].山东理工大学学报（自然科学版）,2011,25(6):19-24. 被引量：5
6李亚娥,汪西莉.一种自适应的半监督图像分类算法[J].计算机技术与发展,2013,23(2):112-114. 被引量：3
7肖升,何炎祥.事件超图模型及类型识别[J].中文信息学报,2013,27(1):30-38. 被引量：2
8张志锋,范乃梅.基于两层协同主动学习策略的分类算法[J].青岛科技大学学报（自然科学版）,2013,34(5):528-531.
9谢科.融合协同训练和两层主动学习策略的SVM分类方法[J].湖南师范大学自然科学学报,2014,37(1):93-97. 被引量：1
10刘锦文,许静,张利萍,芮伟康.基于标签传播和主动学习的人物社会关系抽取[J].计算机工程,2017,34(2):234-240. 被引量：4

二级引证文献42

1贾立鹏,王凤英,姜倩玉.基于多特征融合和集成学习的恶意代码检测研究[J].中国科技论文在线精品论文,2021(2):168-176. 被引量：1
2汪琼枝,毛军军,吴涛,李萍.应用粗糙模糊度的不完备信息系统属性约简[J].计算机技术与发展,2010,20(10):1-3. 被引量：2
3贾俊芳.基于层次聚类的主动学习方法——HC_AL[J].计算机应用,2011,31(8):2134-2137. 被引量：2
4汪婵,程玉虎,王雪松.基于局部稀疏K近邻密度的主动学习[J].中国科技论文在线,2011,6(7):507-511. 被引量：1
5黄霜明,谢丽聪.协同训练半监督学习二次伪迭代算法[J].广西师范大学学报（自然科学版）,2011,29(3):110-114.
6邓慧挺,毛宇光.不确定数据的重复记录检测[J].计算机技术与发展,2012,22(8):60-62.
7包小兵,翟素兰,程兰兰.基于信息熵加权的局部离群点检测算法[J].计算机技术与发展,2012,22(9):59-61. 被引量：3
8王慧兰.汉语句类依存树库的构建研究[J].北京大学学报（自然科学版）,2013,49(1):25-30. 被引量：3
9李亚娥,汪西莉.一种自适应的半监督图像分类算法[J].计算机技术与发展,2013,23(2):112-114. 被引量：3
10罗森林,韩磊,潘丽敏,冯扬,刘盈盈.汉语句义结构模型及其验证[J].北京理工大学学报,2013,33(2):166-171. 被引量：10

1吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
2柳春华,刘宏兵.基于超球粒计算的无线传感器网络节点定位算法[J].信阳农业高等专科学校学报,2014,24(1):123-126.
3张巍,陈俊杰.浅层语义分析及SPARQL在问答系统中的应用[J].计算机工程与应用,2011,47(2):118-120. 被引量：3
4孙志军,郑烇,袁婧,刘恒,王嵩.基于浅层语义分析技术的语义检索[J].计算机科学,2012,39(6):107-110. 被引量：8
5宋正来.一种部队训练效果评估中指标权重确定方法[J].舰船电子工程,2011,31(3):48-51. 被引量：3
6张惠春,由丽萍.基于中文框架网络的浅层语义分析模型[J].电脑开发与应用,2009,22(8):4-6. 被引量：3
7魏晶晶,廖祥文,陈巧灵,马飞翔,陈国龙.结合主动学习的多记录网页属性抽取方法[J].模式识别与人工智能,2016,29(8):673-681. 被引量：1
8曹钰.基于区域信息的深度卷积神经网络研究综述[J].电子世界,2017,0(6):32-32. 被引量：4
9张志昌,张宇,刘挺,李生.基于浅层语义树核的阅读理解答案句抽取[J].中文信息学报,2008,22(1):80-86. 被引量：14
10张巍,陈俊杰.基于本体的智能答疑系统的研究与实现[J].电脑开发与应用,2011,24(10):4-6. 被引量：1

中文信息学报

2008年第2期

浏览历史

内容加载中请稍等...

半监督学习和主动学习相结合的浅层语义分析被引量：13

参考文献7

二级参考文献3

共引文献50

同被引文献146

引证文献13

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

半监督学习和主动学习相结合的浅层语义分析 被引量：13

参考文献7

二级参考文献3

共引文献50

同被引文献146

引证文献13

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

半监督学习和主动学习相结合的浅层语义分析被引量：13