韩国语名词短语结构特征分析及自动提取被引量：6

Structure Characteristic Analysisand Automatic Extraction for Korean Noun Phrase

下载PDF

导出

摘要名词短语作为语言中一种普遍的语法现象,在自然语言处理领域日益受到了研究人员的关注。目前,对其研究范围主要集中在边界识别、语法分析、语义分析及其分类等方面。该文通过研究分析韩国语书面语名词短语的左右边界规则,从大规模标注语料库中自动提取出名词短语。实验结果表明:语料中的高频名词短语相对集中于8个类型之中。根据提取结果分别建立不同类型的名词短语库,为进一步建立双语平行短语语料库打下基础,以便于以后的机器翻译、信息检索等自然语言信息处理工作。 These years, noun phrase,as a common grammatical phenomenon,has attracted eyes of many scholars in the field of language processing.At present,most researches on noun phrase lie in boundary identification grammatical analysis,semantic analysis,categorization and some other aspects.This thesis abstractsnoun phrases from a large-scale tagged corpus through studying and analyzing rules of left and right boundaries of noun phrases in written Korean.From the experimental result,we can see that high-frequency noun phrases mainly lie in 8 categories.Different kinds of corpus for noun phrases can be built according to the result of the abstract,which lays the foundation of building paralell corpus.It will also be convenient for machine translation,information retrieval and other work in language information processing in the future.

作者安帅飞毕玉德

机构地区解放军外国语学院语言工程系

出处《中文信息学报》 CSCD 北大核心 2013年第5期205-210,共6页 Journal of Chinese Information Processing

关键词韩国语名词短语标注语料库边界界定自动提取 Korean noun phrase tagged corpus boundary identification automatic extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1K W Church.A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Test[A].Proceedings of the Second Conference on Applied Natural Language Processing.1988:136-143.
2赵军,黄昌宁.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7. 被引量：41
3李基文[韩].东亚国语大辞典[D].斗山东亚,1997:754.

二级参考文献3

1张卫国.三种定语、三类意义及三个槽位[J].中国人民大学学报,1996,(4):97-100.
2张卫国，中国人民大学学报，1996年，4期，97页
3梅家驹，同义词词林，1983年

共引文献40

1李荣.基于隐马尔可夫模型的汉语非嵌套名词短语识别[J].忻州师范学院学报,2004,20(5):122-124. 被引量：1
2陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
3梁颖红,赵铁军,姚建民,于浩,徐冰.基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略[J].计算机工程与应用,2004,40(35):1-3. 被引量：2
4孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：38
5张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量：36
6薛永增,杨沐昀,赵铁军,韩习武,齐浩亮.面向体育领域的句子主干翻译技术研究[J].中文信息学报,2005,19(5):24-30. 被引量：1
7华沙宝,达胡白乙拉.对蒙古语语料库基本名词短语的定界与统计分析[J].中文信息学报,2005,19(5):52-58. 被引量：4
8刘向华.对隐马尔科夫模型中动态编程的探讨[J].电脑学习,2005(6):2-4. 被引量：1
9钱小飞.“地”字结构识别[J].现代语文（下旬．语言研究）,2006(5):61-63. 被引量：2
10黄德根,王莹莹.基于SVM的组块识别及其错误驱动学习方法[J].中文信息学报,2006,20(6):17-24. 被引量：6

同被引文献36

1李文中.平行语料库设计及对应单位识别[J].当代外语研究,2010(9):22-27. 被引量：18
2晋耀红.基于语境框架的文本相似度计算[J].计算机工程与应用,2004,40(16):36-39. 被引量：26
3王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
4张仕仁.汉语复句的结构分析[J].中文信息学报,1994,8(4):43-54. 被引量：13
5Chruch K W. A Stochastic Parts Program and Noun Phrase for Unrestricted Test : proceedings of the 2nd Conference on Applied Natural Language Processing, Austin, TX [ C ]. USA : Kluwer Academic Publicshers, 1988 : 136-- 142.
6Ramshaw L, Marcus M. Text Chunking Using Transfor- mation-Based Learning [C] //Proceedings of 3rd Work- shop on Very Large Corpora. Massachusetts : Association for Computational Linguistics, 1995 : 82--94.
7K Uehimoto, et al. Named entity extraction based on a maximum entropy model and transformation rules [ C ] //Proceedings of the 38th Annual Meeting of the Associa- tion for Computational Linguistics, 2000 : 326-- 335.
8Gulila Ahenbek, Ruina Sun. Kazakh Noun Phrase Ex- traction based on N-gram and Rules : 2010 International Conference on Asian Language Processing [C ]. Harbin, Heilongiiang, China: 1EEE computer society, 2010: 305-- 308.
9Laffel~y J. et al. Conditional Random Fields : Proba- bilistic Models for Segmenting and Labeling Sequence Da- m [ C ]//Proceedings of the 18th International Conf on machineLeaming, 2001: 282--289.
10S Lakshmana Pandian, T V Geetha. CRF Models for Tamil Part of Speech Tagging and Chunking [ C ]. In- ternational Conference on the Computer Processing of Ori- entalLanguages-ICCPOL, Hong Kong, 2009: 11 --22.

引证文献6

1孙瑞娜.基于CRFs的哈萨克语名词短语自动获取[J].图书馆理论与实践,2015(8):101-105. 被引量：1
2毕玉德,扈毅,安帅飞.朝鲜语特殊短语结构的语言特征分析及自动提取[J].广西科学院学报,2018,34(1):57-62. 被引量：1
3安帅飞,毕玉德,张婷.韩国语定语从句句法特征分析及其自动识别[J].中文信息学报,2018,32(2):66-74. 被引量：2
4凌天斌,毕玉德.基于统计和词典方法相结合的韩汉双语语料库名词短语对齐[J].中文信息学报,2018,32(8):27-31. 被引量：4
5毕玉德,姜博文.韩国语句子结构相似度计算方法研究[J].中文信息学报,2019,33(3):59-63. 被引量：1
6刘晨阳,赵天锐.融入双语词向量的韩汉名词短语对齐方法研究[J].智能计算机与应用,2021,11(9):42-47.

二级引证文献7

1华英楠.朝鲜语自然语言处理研究现状分析[J].牡丹江教育学院学报,2020,0(1):27-31.
2王瑛瑛.以短语译文组合构成英汉翻译系统开发研究[J].现代科学仪器,2019,0(6):14-17.
3余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：16
4杨飞扬,崔荣一,赵亚慧,金晶,李飞雨.基于强化学习与自注意力机制的朝鲜语重要句子结构识别[J].中文信息学报,2021,35(9):66-74. 被引量：2
5刘晨阳,赵天锐.融入双语词向量的韩汉名词短语对齐方法研究[J].智能计算机与应用,2021,11(9):42-47.
6沈同平,俞磊.融合医学词典的条件随机场模型多文本实体识别研究[J].长春大学学报,2021,31(12):1-5.
7沈同平,金力,黄方亮,许欢庆.隐马尔可夫模型的优化及其用于多文本实体识别[J].安庆师范大学学报（自然科学版）,2022,28(2):31-35. 被引量：1

1虞慧群,范贵生.云计算安全模型与管理[J].微型电脑应用,2013(1):1-3. 被引量：5
2赵旭辉.NFC与社交网络[J].中国自动识别技术,2012(1):70-73.
3汪虹,曹维祥.用例分析技术在医院信息化系统需求分析中的应用[J].电脑知识与技术,2015,11(1X):13-14. 被引量：1
4马宏艳.模糊数学理论在汉字识别中的应用[J].电脑知识与技术,2012,8(7X):5176-5177.
5魏凤歧,须毓孝.可综合的Verilog HDL语法现象与硬件实现的对应[J].内蒙古大学学报（自然科学版）,2000,31(5):544-548.
6冯玉龙.无线多媒体传感器网络MAC协议研究综述[J].电子技术与软件工程,2013(24):43-43.
7奚红宇.Ada软件性能检测技术研究及工具的实现[J].北京航空航天大学学报,1997,23(1):12-17.
8李海滨,杨义虎,朱姗姗,邱元庆.以CATIA为平台的起落架零件参数化建模技术研究[J].现代制造工程,2009(7):37-40. 被引量：12
9罗远胜,王明文,勒中坚,张华伟.跨语言信息检索中的双语主题相关模型[J].小型微型计算机系统,2013,34(12):2758-2763. 被引量：8
10江鸥.C语言表达式语法解析[J].科协论坛（下半月）,2007(5):24-24.

中文信息学报

2013年第5期

浏览历史

内容加载中请稍等...

韩国语名词短语结构特征分析及自动提取被引量：6

参考文献3

二级参考文献3

共引文献40

同被引文献36

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

韩国语名词短语结构特征分析及自动提取 被引量：6

参考文献3

二级参考文献3

共引文献40

同被引文献36

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

韩国语名词短语结构特征分析及自动提取被引量：6