基于中文宾州树库的浅层语义分析被引量：4

Shallow semantic parsing based on Chinese Penn Treebank

下载PDF

导出

摘要采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%。实验结果表明该方法对中文浅层语义分析工作是有效的。 This paper presented an experiment on semantic role labeling by using SVM. This experiment was based on Chinese PropBank 5.0, which consisted of 1 652 sentences. The role-labeling set of this experiment included subject, object, !ndirect object, time and location. It used two-phase classification method with eight features, including path, phrase type, etc. For the small scaled training set, the experiment on testing set could reach the accuracy of 89.73% and the recall of 91.26% for semantic role labeling. Results highlight the effectiveness and efficiency of proposed approach for shallow semantic parsing of Chinese.

作者连乐新胡仁龙杨翠丽袁春风

机构地区南京大学计算机科学与技术系计算机软件新技术国家重点实验室

出处《计算机应用研究》 CSCD 北大核心 2008年第3期674-676,680,共4页 Application Research of Computers

基金国家"863"计划资助项目(2002AA117010-10) 国家自然科学基金资助项目(60673043) "十五"攻关教育部科技基础条件平台建设项目

关键词支持向量机语义角色标注中文宾州树库中文PropBank support vector machine（SVM） semantic role labeling Chinese Penn Treebank Chinese PropBank

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1车万翔,刘挺,李生.浅层语义分析.自然语言理解与大规模内容计算[M].北京:清华大学出版社,2005.
2GILDEA D, JURAFASKY D. Automatic labeling of semantic roles [ J ]. Computational Linguistics,2002,28 ( 3 ) :245- 288.
3PRADHAN S, WARD W, HACIOGLU K,et al. Shallow semantic parsing using support vector machines[ C ]//Proc of the Human Lanuage Technology Confdrence/North American Chapte of the Association of Comutional Linguistics. Boston: [ s. n. ] ,2004.
4SUN Hong-lin, JURAFSKY D. Shallow semantic parsing of Chinese [ C ]//Proc of the Human Lanuage Technology Conference. Boston: [s. n. ] ,2004.
5宾州树库[EB/OL].http://www.cis.upenn.edu/-chinese/ctb.html.
6XUE Nian-wen,PALMER M. Annotating the propositions in the Penn Chinese Treebank [ C ]//Proc of the 2nd Sighan Workshop. Sapporo :[s. n. ] ,2003.
7中文 PropBank [ EB/OL]. http://www, cis. upenn, edu/- chinese/ cob/index, html.
8XUE Nian-wen, PAMLER M. Automatic semantic role labeling for Chinese verbs [ C ]//Proc of the 19th International Joint Conference on Artificial Intelligence. Edinburgh : [ s. n. ] ,2005,
9VAPNIK V N. The nature of statistical learning theory [ M ]. New York: Springer-Verlag, 1995.
10PLATT J C. Fast training of support vector machines using sequential minimal optimization [ M ]//SCHOLKOPF B, BURGES C, SMOLA A. Advances in Kernel Methods: Support Vector Machines. Cambridge: MIT Press, 1998:185-208.

共引文献6

1周文翠,袁春风.并列复句的自动识别初探[J].计算机应用研究,2008,25(3):764-766. 被引量：12
2丁振国,陈海霞.一种基于知网的主观题阅卷算法[J].微电子学与计算机,2008,25(5):108-109. 被引量：6
3王跃龙,姬东鸿.汉语树库综述[J].当代语言学,2009,11(1):47-55. 被引量：18
4胥永康,赵友桥,龚四平,路松峰,魏筱毛.可无限分类的Web服务发现匹配算法[J].计算机工程与应用,2010,46(27):109-113.
5秦学勇,张润梅.两级相似度计算在主观题机器阅卷中的应用[J].计算机工程,2012,38(11):274-276.
6秦兵,刘挺,王洋,郑实福,李生.基于常问问题集的中文问答系统研究[J].哈尔滨工业大学学报,2003,35(10):1179-1182. 被引量：96

同被引文献33

1陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
2周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
3侯新国,吴正国,夏立,卜乐平.基于相关分析的感应电机定子故障诊断方法研究[J].中国电机工程学报,2005,25(4):83-86. 被引量：42
4黄国宏,熊志化,邵惠鹤.一种新的基于构造型神经网络分类算法[J].计算机学报,2005,28(9):1519-1523. 被引量：14
5熊浩,孙才新,陈伟根,杜林,廖玉祥.电力变压器故障诊断的人工免疫网络分类算法[J].电力系统自动化,2006,30(6):57-60. 被引量：30
6魏星,舒乃秋,崔鹏程,吴波.基于改进PSO-BP神经网络和D-S证据理论的大型变压器故障综合诊断[J].电力系统自动化,2006,30(7):46-50. 被引量：42
7郭创新,朱传柏,曹一家,吴欣.电力系统故障诊断的研究现状与发展趋势[J].电力系统自动化,2006,30(8):98-103. 被引量：134
8张含蕾,周洁敏,李刚.基于小波分析的感应电动机复合故障诊断[J].中国电机工程学报,2006,26(8):159-162. 被引量：34
9杨苹,陈武.基于自组织模糊神经网络的汽轮发电机组振动故障诊断系统[J].电力系统自动化,2006,30(14):66-70. 被引量：15
10刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39

引证文献4

1郭庆琳,张铭.基于规则和本体的汽轮机故障分析[J].电力自动化设备,2009,29(4):11-14. 被引量：4
2陈丽江,陈小荷.统计和规则结合识别动词的跨分句论元[J].计算机工程与应用,2009,45(16):40-42.
3张惠春,由丽萍.基于中文框架网络的浅层语义分析模型[J].电脑开发与应用,2009,22(8):4-6. 被引量：3
4安强强,张蕾.基于依存树的中文语义角色标注[J].计算机工程,2010,36(4):161-163. 被引量：7

二级引证文献14

1刘畅,谢红薇,杜冬霞.基于语义Web服务的数字化应急预案检索系统框架[J].电脑开发与应用,2010,23(1):4-7. 被引量：2
2于欣.汽轮机故障诊断技术[J].中国新技术新产品,2010(3):145-145. 被引量：3
3汪材印,杨杰.基于语义P2P技术的资源共享和检索系统研究[J].电脑开发与应用,2010,23(2):9-11.
4闫玉峰.汽轮机装置工程模块化分析[J].硅谷,2010,3(9):48-48.
5毛小丽,何中市,邢欣来,刘莉.基于语义角色的实体关系抽取[J].计算机工程,2011,37(17):143-145. 被引量：7
6王步康,王红玲,周国栋.基于树核函数的中文语义角色标注[J].计算机工程,2011,37(22):128-130. 被引量：2
7姚双云,胡金柱,舒江波,沈威.篇章连贯语义关系的自动标注方法[J].计算机工程,2012,38(7):131-133. 被引量：5
8刘盈盈,罗森林,冯扬,韩磊,陈功,王倩.BFS-CTC汉语句义结构标注语料库[J].中文信息学报,2013,27(1):72-80. 被引量：5
9李启云.汽轮机紧急跳闸系统设置原则与改造实践[J].科技创新与应用,2013,3(34):98-98. 被引量：1
10张曙明.汽轮机故障分析与检修方法研究[J].经济技术协作信息,2015,0(14):71-71.

1沈超.基于子树的确定性依存分析方法[J].计算机应用与软件,2011,28(2):268-270.
2吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
3毛奇,连乐新,周文翠,袁春风.基于标点符号分割的汉语句法分析算法[J].中文信息学报,2007,21(2):29-34. 被引量：7
4张巍,陈俊杰.浅层语义分析及SPARQL在问答系统中的应用[J].计算机工程与应用,2011,47(2):118-120. 被引量：3
5陈耀东,王挺,陈火旺.半监督学习和主动学习相结合的浅层语义分析[J].中文信息学报,2008,22(2):70-75. 被引量：13
6吴方磊,李军辉,朱巧明,李培峰.基于树核函数的中文语义角色分类研究[J].中文信息学报,2011,25(3):51-58. 被引量：3
7阿里甫.库尔班,吾买尔江.库尔班,房鼎益.维吾尔语框架语义角色标注标记集研究[J].中文信息学报,2013,27(2):41-46. 被引量：1
8刘勇,李良洁.基于汉语框架的语义标注方法[J].科技风,2015(3):224-225.
9刘勇,魏光泽.基于汉语框架的语义标注方法[J].计算机科学,2015,42(S1):98-101.
10吴方磊,李军辉,朱巧明,李培峰.中文语义角色标注的树核空间研究[J].计算机应用与软件,2012,29(3):58-61.

计算机应用研究

2008年第3期

浏览历史

内容加载中请稍等...

基于中文宾州树库的浅层语义分析被引量：4

参考文献15

共引文献6

同被引文献33

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于中文宾州树库的浅层语义分析 被引量：4

参考文献15

共引文献6

同被引文献33

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于中文宾州树库的浅层语义分析被引量：4