基于语义分析的汉语介词短语识别方法研究被引量：3

Research on Identification Method of Chinese Prepositional Phrase Based on Semantic Analysis

下载PDF

导出

摘要针对介词短语右边界存在多种错误识别的问题,提出了一种基于最大熵的汉语介词短语自动识别方法。该方法结合了汉语介词短语左右边界词语的依存语法知识,先由最大熵模型对介词短语进行识别,然后利用依存树库中介词短语的左右边界词语的依存语法知识,对介词短语右边界的错误识别进行校正,提高了介词短语的识别率。 We propose a maximum entropy-based method for automatic identification of prepositional phrase, which focuses on multiple error identification problems on the right boundary of prepositional phrase. It combines the dependency grammar knowledge of prepositional phrase boundary. In the process of recognition, firstly, we apply maximum entropy to identify prepositional phrase, then fine-tune the results with dependency grammar knowledge generated by dependency treebank. It improves the recognition rate of prepositional phrase.

作者卢朝华徐好芹王玉芬

机构地区商丘工学院

出处《电脑与电信》 2012年第3期46-48,共3页 Computer & Telecommunication

关键词汉语介词短语短语识别最大熵依存语法 Chinese prepositional phrase phrase identification maximum entropy dependence grammar

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1刘群.统计机器翻译综述[J].中文信息学报,2003,17(4):1-12. 被引量：71
2R.Rosenfeld.A Maximum Entropy Approach to Adaptive Statis-tical Language Learning[J].Computer Speech and language,1996,10(3):187-228.
3Adam L.Berger,Stephen A,Della Pietra and Vincent J.Della Pietra.A maximum entropy approach to natural language processing Com-putational Linguistics,1996,22(1):38-73.
4宋国杰,唐世渭,杨冬青,王腾蛟.基于最大熵原理的空间特征选择方法[J].软件学报,2003,14(9):1544-1550. 被引量：19
5Pietra S D,Pietra V D,Lafferty J.Including features of random fields.IEEE Transactions on Pattern Analysis and Machine Intelligence.1997,19(4):380-393.
6吕琳,刘玉树.最大熵和Brill方法结合识别英语BaseNPs[J].北京理工大学学报,2006,26(6):500-503. 被引量：6
7李彦,吕琳,刘玉树等.最大熵方法在英文基本名词短语识别中的应用.第十一届中国人工智能学术年会,2005:1265-1270.

二级参考文献30

1吕琳,周世斌,刘玉树.一种高性能英文词性标注器的设计与实现[J].北京理工大学学报,2005,25(10):876-879. 被引量：5
2俞士汶等.机器翻译译文质量自动评估系统[A]..中国中文信息学会1991年会论文集[C].,.314—319.
3BergerA.The improved iterative scaling algorithm: A gentle introduction.http://citeseer.nj.nec.com/31826.html,1997.
4Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Pietra, Fredrick Jelinek, John D. Lafferty, Robert L. Mercer, Paul S. Roossin, A Statistical Approach to Machine Translation [J],Computational Linguistics, 1990.
5Peter. F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, Robert L. Mercer, The Mathematics of Statistical Machine Translation: Parameter Estimation [J], Computational Linguiatics, 19,(2), 1993.
6F. J. Och, C. Tillmann, and H. Ney. Improved alignment models for statistical machine translation[A]. In Proc. of the Joint SIGDAT Conf. On Empirical Methods in Natural Language Processing and Very Large Corpora, pages 20-28, University of Maryland, College Park, MD, June 1999.
7Franz Josef Och, Hermann Ney. What Can Machine Translation Learn from Speech Recognition? [A]In: proceedings of MT 2001 Workshop: Towards a Road Map for MT, 26-31, Santiago de Compostels,Spain, September 2001.
8Franz Josef Och, Hermann Ney, Discriminative Training and Maximum Entropy Models for Statistical Machine Translation [A], ACL2002.
9K. A. Papineni, S. Roukos, and R. T. Ward. Feature-based language understanding[A]. In European Conf. on Speech Communication and Technology, 1435-1438, Rhodes, Greece, September,1997.
10K. A. Papineni, S. Roukos, and R. T. Ward. Maximum likelihood and discriminative training of direct translation models [A] In Proc. Int. Conf. on Accoustics, Speech, and Signal Processing,pages,189-192, Seattle, WA, May, 1998.

共引文献93

1唐元楠.论机器翻译的现状[J].南国博览,2019,0(4):380-380.
2贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
3李霞,马骏腾,覃世豪.融合图像注意力的多模态机器翻译模型[J].中文信息学报,2020(7):68-78. 被引量：5
4周新栋,王挺.基于N元语言模型的文本分类方法[J].计算机应用,2005,25(1):11-13. 被引量：11
5康海燕,樊孝忠,李彦芳,耿增民.熵原理在信息检索中的应用[J].计算机工程,2005,31(9):155-156. 被引量：3
6谭义红,陈治平,李学勇.基于决策树的中毒诊断专家系统实现[J].计算机应用,2005,25(10):2315-2317. 被引量：4
7卢林,吴纪桃.岛屿轮廓数据的熵信息研究[J].海洋测绘,2005,25(5):1-3.
8肖明.机器翻译系统中间件模型[J].福建电脑,2006,22(3):122-123.
9李玉鑑.英汉翻译模板的标准化方案及其应用[J].中文信息学报,2006,20(B03):41-46.
10王金宝.基于增量学习和阈值优化的自适应信息过滤研究[J].计算机应用,2006,26(5):1099-1101.

同被引文献44

1邢公畹.语词搭配问题是不是语法问题?[J].安徽师大学报（哲学社会科学版）,1978,6(4):77-84. 被引量：13
2林杏光.论词义分类和词语搭配[J].中国人民大学学报,1991,5(5):77-82. 被引量：3
3林杏光.词语搭配的性质与研究[J].汉语学习,1990(1):7-13. 被引量：13
4林杏光.张寿康先生与词语搭配研究[J].首都师范大学学报（社会科学版）,1995(1):59-63. 被引量：4
5谭咏梅,姚天顺,陈晴,李珩,朱靖波.基于SVM+Sigmoid的汉语组块识别[J].计算机科学,2004,31(8):142-146. 被引量：3
6王立霞,孙宏林.现代汉语介词短语边界识别研究[J].中文信息学报,2005,19(3):80-86. 被引量：11
7干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
8周强.汉语基本块描述体系[J].中文信息学报,2007,21(3):21-27. 被引量：25
9奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算机工程,2007,33(3):172-173. 被引量：9
10昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量：27

引证文献3

1胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].语言文字应用,2015(1):136-144. 被引量：8
2李洪政,晋耀红.汉语介词短语自动识别研究综述[J].中文信息学报,2017,31(2):1-10. 被引量：1
3邢丹,饶高琦,荀恩东,王诚文.基于大规模语料库的介词结构搭配库构建[J].中文信息学报,2020,34(11):1-8. 被引量：8

二级引证文献17

1张剑,张立杰.新时代媒体舆论引导下网络语言信息传播耗损及构建研究[J].情报科学,2022,40(8):71-75. 被引量：1
2游新冬,杨海翔,陈海涛,孙甜,吕学强.融合术语信息的新能源专利机器翻译研究[J].中文信息学报,2021,35(12):76-83. 被引量：1
3胡韧奋,肖航.面向二语教学的汉语搭配知识库构建及其应用研究[J].语言文字应用,2019(1):135-144. 被引量：8
4李洪政,晋耀红.基于条件随机场方法的汉语专利文本介词短语识别[J].现代语文（下旬．语言研究）,2015(7):120-122. 被引量：1
5李洪政,晋耀红.汉语介词短语自动识别研究综述[J].中文信息学报,2017,31(2):1-10. 被引量：1
6张海洋.基于语义选择的机器翻译方法研究[J].自动化与仪器仪表,2018,0(8):29-32. 被引量：3
7李诗品.基于平行语料库的专利摘要术语和词汇量化分析[J].科教导刊,2018(22):68-70.
8张成智,王鹏.专利翻译研究现状综述[J].才智,2016(36). 被引量：3
9邢丹,饶高琦,荀恩东,王诚文.基于大规模语料库的介词结构搭配库构建[J].中文信息学报,2020,34(11):1-8. 被引量：8
10孙金凤,赵萱.高校英语教学语料库应用性构建新思路研究[J].黑龙江工业学院学报（综合版）,2021,21(5):129-132.

1卢朝华,黄广君,郭志兵.基于最大熵的汉语介词短语识别研究[J].通信技术,2010,43(5):181-183. 被引量：7
2干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
3奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算机工程,2007,33(3):172-173. 被引量：9
4桑乐园,黄德根.基于简单名词短语的汉语介词短语识别研究[J].中文信息学报,2015,29(6):8-12. 被引量：2
5高松,冯志伟.基于依存树库的文本聚类研究[J].中文信息学报,2011,25(3):59-63. 被引量：3
6斯.劳格劳,华沙宝,萨如拉.基于统计方法的蒙古语依存句法分析模型[J].中文信息学报,2012,26(3):27-32. 被引量：3
7李发杰,余正涛,郭剑毅,李英,周兰江.借助汉-越双语词对齐语料构建越南语依存树库[J].中文信息学报,2015,29(6):69-74.
8王根宏.网络边界防护,路由器也担重任[J].网络安全和信息化,2017,0(4):124-126.
9卜雅娜.明清以来新产生的介词[J].文教资料,2012(7):41-42.
10刘挺,马金山,李生.基于词汇支配度的汉语依存分析模型[J].软件学报,2006,17(9):1876-1883. 被引量：24

电脑与电信

2012年第3期

浏览历史

内容加载中请稍等...

基于语义分析的汉语介词短语识别方法研究被引量：3

参考文献7

二级参考文献30

共引文献93

同被引文献44

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于语义分析的汉语介词短语识别方法研究 被引量：3

参考文献7

二级参考文献30

共引文献93

同被引文献44

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于语义分析的汉语介词短语识别方法研究被引量：3