一种基于历史信息的多层次中文句法分析方法被引量：4

A HISTORY-BASED HIERARCHICAL CHINESE PARSING

下载PDF

导出

摘要实现一个基于历史信息的多层次中文句法分析系统。采用最大熵模型进行参数学习,在每层处理过程中,优先识别出容易识别的组块,在此基础上根据更丰富的上下文信息循环进行复杂组块的识别,直至识别出根结点。通过采用给出的相关算法,实验结果表明,在宾州中文树库测试集Section271-300上得到的F值性能为83.76%(<=40 words)和80.02%(<=100 words)。 This paper proposed a History-based hierarchical Chinese parser. The maximum entropy model is applied for learning parameters. In each level＇s process,simple constitutes would be detected firstly, so that the complex ones are to be recognized reliably with richer contextual information circulation in the following process until root node is identified. In this paper,the pertinent algorithm of the system is given, and evaluation on the Penn Chinese Treebank Section 271 - 230 （ based on gold standard segmentation） shows that this parser achieves the state-of-art performance with F-Measure 83.76 （〈 = 40 words） and 80.02 （〈 = 100 words）.

作者耿向好李军辉周国栋朱巧明

机构地区苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室

出处《计算机应用与软件》 CSCD 2009年第6期45-47,51,共4页 Computer Applications and Software

基金国家自然科学基金项目(60673041) 国家高技术研究发展计划(2006AA01Z147)

关键词中文句法分析历史信息层次分析最大熵模型 Chinese parsing History information Hierarchical parsing Maximum entropy models

分类号 TP391 [自动化与计算机技术—计算机应用技术] F231.5 [经济管理—会计学]

引文网络
相关文献

参考文献6

1Ratnaparkhi A.Learning to parse natural language with maximum entropy models[J].Machine Learning,1999,341:151-176.
2Charniak E.A maximum-entropy-inspired parser[C]//In Proceedings of the North American Chapter of the Association for Computation Linguistics,2000.
3Collins M.Head-driven statistical model for natural language parsing[D].Pennsylvania:the University of Pennsylvania,1999.
4Bikel D M,Chiang D.Two statistical parsing models applied to the Chinese Treebank[C]//In Proceedings of the Second Chinese Language Processing Workshop,Hong Kong,2000.
5Levy R,Manning C.Is it harder to parse Chinese,or the Chinese Treebank?[C]//In Proceedings of the 41st ACL,2003.
6Chiang D,Bikel D M.Recovering latent information in treebanks[C]//In Proceedings of COLING,2002.

同被引文献49

1刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
2于津凯,王映雪,陈怀楚.一种基于N-Gram改进的文本特征提取算法[J].图书情报工作,2004,48(8):48-50. 被引量：17
3John Durkin,蔡竞峰,蔡自兴.决策树技术及其当前研究方向[J].控制工程,2005,12(1):15-18. 被引量：62
4石定栩.汉语句法的灵活性和句法理论[J].当代语言学,2000,2(1):18-26. 被引量：44
5林颖,史晓东,郭锋.一种基于概率上下文无关文法的汉语句法分析[J].中文信息学报,2006,20(2):1-7. 被引量：11
6李幸,宗成庆.引入标点处理的层次化汉语长句句法分析方法[J].中文信息学报,2006,20(4):8-15. 被引量：22
7冯少荣.决策树算法的研究与改进[J].厦门大学学报（自然科学版）,2007,46(4):496-500. 被引量：67
8Manning C D, Schutze H. Foundations of statistical natural language processing[M]. London: the MIT Press, 1999: 184-197.
9Joshua G. A bit of progress in language modeling[J]. Computer Speech and Language, 2001, 15(4): 403-434.
10XUE Nian-wen, XIA Fei, Chiou F D, et al. The Penn Chinese treebank: Phrase structure annotation of a large corpus[J]. Natural Language Engineering, 2005, 11 (2): 207-238.

引证文献4

1袁里驰.融合语言知识的统计句法分析[J].中南大学学报（自然科学版）,2012,43(3):986-991. 被引量：5
2曹云波.中文句法对英文句法的影响研究[J].科教文汇,2014(31):138-139. 被引量：1
3王峥,刘师培,彭艳兵.基于句法决策树和SVM的短文本语境识别模型[J].计算机与现代化,2017(3):13-17. 被引量：7
4张丹,周俏丽,张桂平.引入层次成分分析的依存句法分析[J].沈阳航空航天大学学报,2017,34(1):76-82. 被引量：1

二级引证文献14

1袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
2马建军,宗敏.功能小句自动句法分析结果的错误分析[J].鸡西大学学报（综合版）,2014,14(9):124-127.
3袁里驰.几种基于统计的词聚类方法比较[J].中南大学学报（自然科学版）,2016,47(9):3079-3084. 被引量：1
4袁里驰.融合语义类信息的句法分析统计模型[J].数据采集与处理,2017,32(1):175-181. 被引量：1
5李心蕾,王昊,刘小敏,邓三鸿.面向微博短文本分类的文本向量化方法比较研究[J].数据分析与知识发现,2018,2(8):41-50. 被引量：14
6李玥.中文句法对英文句法的影响探究[J].校园英语,2017,0(39):157-157.
7谌志群,鞠婷,王冰.结合树形概率和双向长短期记忆的渐步性句法分析方法[J].厦门大学学报（自然科学版）,2019,58(2):243-248. 被引量：3
8丁森华,邵佳慧,李春艳,杨枝蕊.文本情感分析方法对比研究[J].广播电视信息,2020,27(4):92-96. 被引量：9
9沈思,翁小颖,孙豪,王东波.国家社科基金学科类别自动判定模型构建研究[J].湖南大学学报（自然科学版）,2020,47(4):118-124.
10王娟娟.基于List-Based转移的英语语义分析翻译系统研究[J].电子设计工程,2020,28(16):35-38. 被引量：1

1刘胜久,李天瑞,贾真,珠杰.基于Hadoop平台的并行中文句法分析研究[J].计算机科学,2014,41(3):88-90.
2赵国荣,王文剑.一种处理结构化输入输出的中文句法分析方法[J].中文信息学报,2015,29(1):139-145. 被引量：4
3项炜,金澎.大规模语料库上的Stanford和Berkeley句法分析器性能对比分析[J].电脑知识与技术（过刊）,2013,19(3X):1984-1986. 被引量：3
4王文剑,王亚贝.基于结构化支持向量机的中文句法分析[J].山西大学学报（自然科学版）,2011,34(1):66-70. 被引量：2
5米海涛,熊德意,刘群.中文词法分析与句法分析融合策略研究[J].中文信息学报,2008,22(2):10-17. 被引量：13
6万洁,张文胜,朱青,王珊.基于历史信息提升关键字查询效率[J].小型微型计算机系统,2011,32(11):2192-2197. 被引量：5
7曾劲涛,罗文浪,李金忠,曾小荟.基于历史信息选择软件可靠性模型的方法[J].井冈山大学学报（自然科学版）,2011,32(3):90-93.
8许兰,朱巧明,陈静,贡正仙.一种快速的网格任务调度算法的设计[J].计算机应用与软件,2008,25(5):97-99.
9申静,姚军财.基于历史信息和时间约束的多Agent协商模型[J].陕西理工学院学报（自然科学版）,2009,25(1):51-55. 被引量：8
10许兰,朱巧明,贡正仙,李培峰.一种基于历史信息的自适应动态网格作业调度方法[J].计算机应用与软件,2008,25(10):21-24.

计算机应用与软件

2009年第6期

浏览历史

内容加载中请稍等...

一种基于历史信息的多层次中文句法分析方法被引量：4

参考文献6

同被引文献49

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于历史信息的多层次中文句法分析方法 被引量：4

参考文献6

同被引文献49

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于历史信息的多层次中文句法分析方法被引量：4