混合的汉语基本名词短语识别方法被引量：7

Hybrid Method to Chinese Base Noun Phrase Recognition

下载PDF

导出

摘要提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。 This paper proposes a hybrid method to recognize Chinese Base Noun Phrase（BaseNP）,including the use of grammer rules,statistical approach and classification combination.It utilizes words information,part of speech information and context syntax information of BaseNP,generates a combination classification and improves the precision.Experimental results on CTB5.0 show that the F-score is 90.09%,it proves that the method is an effective approach to Chinese BaseNP recognition.

作者胡乃全朱巧明周国栋

机构地区苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室

出处《计算机工程》 CAS CSCD 北大核心 2009年第20期199-201,共3页 Computer Engineering

基金国家自然科学基金资助项目(0673041) 国家"863"计划基金资助项目(006AA01Z147)

关键词基本名词短语规则模板组合分类器 Base Noun Phrase（BaseNP） rule templates combined classifier

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1Chruch K W. A Stochastic Parts Program and Noun Phrase for Unrestricted Test[C]//Proc. of the 2nd Conf. on Applied Natural Language Processing. Austin, TX, USA: Kluwer Academic Publicshers, 1998.
2赵军,黄昌宁.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7. 被引量：41
3Koeling R. Chunking with Maximum Entropy Models[C]//Proc. of CoNLL-2000 and LLL-2000. Lisbon, Portugal: [s. n.], 2000.
4Lafferty J, McCallum A, Pereira E Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]//Proc. of the 18th International Conference on Machine Learning. San Francisco, USA: [s. n.], 2001.
5Tjong E F, Sang K, Daelemans W, et al. Applying System Combination to Base Noun Phrase Identification[C]//Proc. of COLING'00. Saarbrucken, Germany: [s. n.], 2000.
6周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446. 被引量：61
7徐昉,宗成庆,王霞.中文Base NP识别:错误驱动的组合分类器方法[J].中文信息学报,2007,21(1):115-119. 被引量：7

二级参考文献46

1孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：38
2张卫国.三种定语、三类意义及三个槽位[J].中国人民大学学报,1996,(4):97-100.
3张卫国，中国人民大学学报，1996年，4期，97页
4梅家驹，同义词词林，1983年
5CHRISTOPHER D,MANNING,HINRICH SCHUTZE.统计自然语言处理基础[M].苑春法译.北京:电子工业出版社,2005:143-163.
6E F T K Sang, W Daelemans, H Déjean et al. Applying system combination to base noun phrase identification. In: Proc of COLING 2000. Saarbrücken, Germany: Morgan Kaufmann Publishers, 2000. 857～863
7周明 .基于语料库的中文最长名词短语的自动抽取.见:计算语言进展与应用.北京,清华大学出版社,1995. 50-55(Zhou Ming. Corpus-based Chinese maximum noun phrase extraction. In: Computer Linguistic Development and Application(in Chinese). Beijing: Tsinghua University Press, 1995. 50-55)
8K W Church. A stochastic parts program and noun phrase for unrestricted test. In: Proc of the 2nd Conf on Applied Natural Language Processing. Austin, TX, USA: Kluwer Academic Publishers, 1988. 136～143
9S P Abney. Parsing by Chunks. In: R C Berwick, S P Abney eds. PrincipleBased Parsing: Computation and Psycholinguistics. Boston, USA: Kluwer Academic Publishers, 1991. 257～278
10L A Ramshaw, M P Marcus. Text chunking using transformation-based learning. In: Proc of the 3rd Workshop on Very Large Corpora. Kluwer Academic Publishers, 1995. 82～94

共引文献95

1李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
2李荣.基于隐马尔可夫模型的汉语非嵌套名词短语识别[J].忻州师范学院学报,2004,20(5):122-124. 被引量：1
3陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
4梁颖红,赵铁军,姚建民,于浩,徐冰.基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略[J].计算机工程与应用,2004,40(35):1-3. 被引量：2
5孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：38
6张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量：36
7干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
8王建会,王雷,胡运发.词语间依存关系的定量识别[J].中文信息学报,2005,19(4):31-38. 被引量：3
9冯丽萍,焦莉娟.基于最大熵的中文组织机构名识别模型[J].计算机与数字工程,2010,38(12):36-40. 被引量：2
10薛永增,杨沐昀,赵铁军,韩习武,齐浩亮.面向体育领域的句子主干翻译技术研究[J].中文信息学报,2005,19(5):24-30. 被引量：1

同被引文献52

1黄德根,马玉霞,杨元生.基于互信息的中文姓名识别方法[J].大连理工大学学报,2004,44(5):744-748. 被引量：12
2王振华,孔祥龙,陆汝占,刘绍明.结合决策树方法的中文姓名识别[J].中文信息学报,2004,18(6):10-15. 被引量：15
3郭艳华,周昌乐.自然语言理解研究综述[J].杭州电子工业学院学报,2000,20(1):58-65. 被引量：31
4干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
5孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
6李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：10
7赵健,王晓龙,关毅.中文名实体识别中的特征组合与特征融合的比较[J].计算机应用,2005,25(11):2647-2649. 被引量：7
8周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：111
9李荣,郑家恒.基于语料库的名词短语识别方法[J].济南大学学报（自然科学版）,2007,21(3):243-245. 被引量：2
10奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算机工程,2007,33(3):172-173. 被引量：9

引证文献7

1杨晓东,晏立,尤慧丽.CCRF与规则相结合的中文机构名识别[J].计算机工程,2011,37(8):169-171. 被引量：6
2霍亚格,黄广君.基于最大熵的汉语短语结构识别方法[J].计算机工程,2011,37(16):206-208. 被引量：2
3柯修,王惠临,于薇.基于串频统计的汉语和孟加拉语专有名词识别[J].现代图书情报技术,2011(12):31-38. 被引量：1
4桑乐园,黄德根.基于简单名词短语的汉语介词短语识别研究[J].中文信息学报,2015,29(6):8-12. 被引量：2
5王闻慧.融合边界信息的越南语名词短语深度学习识别方法[J].计算机应用与软件,2019,36(12):169-175.
6刘小蝶.基于边界感知的复杂名词短语的识别和转换研究[J].计算机科学,2021,48(S01):299-305.
7汤礼欣,周兰江,张力,张建安.融合短语结构的多通道老挝语名词短语识别方法[J].中文信息学报,2022,36(6):61-68.

二级引证文献11

1郑敏洁,雷志城,廖祥文,陈国龙.基于层叠CRFs的中文句子评价对象抽取[J].中文信息学报,2013,27(3):69-76. 被引量：19
2雷志城,廖祥文.结合领域知识的中文句子评价对象抽取[J].福州大学学报（自然科学版）,2013,41(3):297-304. 被引量：2
3关晓炟,吕学强,李卓,郑略省.用户查询日志中的中文机构名识别[J].现代图书情报技术,2014(1):72-78. 被引量：4
4孙丽萍,过弋,唐文武,徐永斌.基于构成模式和条件随机场的企业简称预测[J].计算机应用,2016,36(2):449-454. 被引量：3
5俞敬松,王惠临,杨洁.大规模地名本体数据库系统的建构技术与方法[J].图书情报工作,2016,60(8):126-131. 被引量：2
6田雪,黄德根.一种混合的汉语简单名词短语识别方法[J].小型微型计算机系统,2017,38(4):749-754. 被引量：1
7李洪政,晋耀红.汉语介词短语自动识别研究综述[J].中文信息学报,2017,31(2):1-10. 被引量：1
8刘彤,黄德根,张聪.基于多模型融合的汉语介词短语识别[J].中文信息学报,2017,31(6):25-32.
9于楠,王普,翁壮,方丽英.基于多特征融合的中文电子病历命名实体识别[J].北京生物医学工程,2018,37(3):279-284. 被引量：12
10何小波,罗跃,金贤锋,刘贤.规则匹配和深度学习结合的文本空间信息识别及定位[J].地理信息世界,2020,27(5):121-128. 被引量：6

1张瑞霞,张蕾.基于知识图的汉语基本名词短语分析模型[J].中文信息学报,2004,18(3):47-53. 被引量：8
2赵军,黄昌宁.结合句法组成模板识别汉语基本名词短语的概率模型[J].计算机研究与发展,1999,36(11):1384-1390. 被引量：11
3赵军,黄昌宁.汉语基本名词短语结构分析模型[J].计算机学报,1999,22(2):141-146. 被引量：28
4赵长伟,孙素环,李晓培.基于语义相似度的文本表示降维方法[J].河南科技大学学报（自然科学版）,2008,29(5):36-39. 被引量：4
5许满英,张永奎.基于HMM的中文BaseNp的识别[J].电脑开发与应用,2008,21(12):39-41.
6赵军,黄昌宁.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7. 被引量：41
7孙瑞娜,刘茜.基于互信息的汉语基本名词短语自动识别[J].信息与电脑（理论版）,2012(11):71-72.
8诺明花,刘汇丹,马龙龙,吴健,丁治明.基于中心语块扩展的汉藏基本名词短语对的识别[J].中文信息学报,2013,27(4):63-69. 被引量：1
9龚永恩,袁春风,武港山.基于语义的词义消歧算法初探[J].计算机应用研究,2006,23(3):41-43. 被引量：8
10梁颖红,毛蕾,赵铁军,徐冰,朱义勇.英语基本名词短语识别向汉语的快速移植[J].高技术通讯,2004,14(12):21-24. 被引量：1

计算机工程

2009年第20期

浏览历史

内容加载中请稍等...

混合的汉语基本名词短语识别方法被引量：7

参考文献7

二级参考文献46

共引文献95

同被引文献52

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

混合的汉语基本名词短语识别方法 被引量：7

参考文献7

二级参考文献46

共引文献95

同被引文献52

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

混合的汉语基本名词短语识别方法被引量：7