基于统计的日本人名的识别和翻译被引量：2

Statistical Japanese Names Recognition and Translation

下载PDF

导出

摘要采用基于统计的方法实现日本人名的识别和翻译系统。将人名的识别转换成序列标注问题,采用条件随机场方法训练识别模型。训练语料在标注时使用S/E(Start/End)标注风格;利用人名在上下文中的关系、人名称呼后缀词和人名字典来设计特征模板。人名翻译时将日本人名分为假名人名和汉字人名,汉字人名的翻译通过建立日本人名常用汉字翻译字典实现;假名人名的翻译通过Moses系统训练翻译模型实现。该系统在人名的识别和翻译测试中都取得了不错统计结果。 This paper implements a system of Japanese names recognition and translation by using statistical ways. In this paper,names recognition problem is transformed to the task of labeling sequential data and the Conditional Random Field way is used to train recognition model. A seven tags label strategy is designed to distinguish the name in article when labeling corpus data; the feature template is built basing on the Japanese context and title for names. In the part of translation Japanese names, Japanese names is seperated to two types, Kana names and Kanji names. A ＂Kanji name translation dictionary＂is built to translating the Japanese Kanji names to Chinese character;and Moses machine translation system is used to deal with the kana names. Japanese names recognition and translation model both have preferably results on the test sets.

作者李婷婷赵铁军张春越

机构地区哈尔滨工业大学计算机科学与技术学院

出处《智能计算机与应用》 2012年第1期4-7,共4页 Intelligent Computer and Applications

关键词人名识别条件随机场人名汉字翻译字典 Name Recognition Conditional Random Field Kanji Name Translation Dictionary

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1谭红叶,郑家恒,刘开瑛.基于变换的中国地名自动识别研究(英文)[J].软件学报,2001,12(11):1608-1613. 被引量：23

二级参考文献2

1Tan Hongye，Proc Computational Linguistics，1999年，174页
2中国地名委员会，中国地名录，1994年

共引文献22

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：10
3赵健,王晓龙,关毅.中文名实体识别中的特征组合与特征融合的比较[J].计算机应用,2005,25(11):2647-2649. 被引量：7
4黄德根,孙迎红.中文地名的自动识别[J].计算机工程,2006,32(3):220-222. 被引量：10
5宇缨,王晓龙,刘秉权.一种基于SVM／RS的中文机构名称自动识别方法[J].电子与信息学报,2006,28(5):895-900. 被引量：4
6高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10
7赵健,王晓龙,关毅,徐志明.中文名实体识别：基于词触发对的条件随机域方法[J].高技术通讯,2006,16(8):795-801. 被引量：3
8李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量：32
9宇缨,王晓龙,刘秉权,王慧.Research on Chinese place name recognition based on kernel classifier[J].Journal of Harbin Institute of Technology(New Series),2007,14(1):79-82.
10李丽双,黄德根,陈春荣,杨元生.基于支持向量机的中文文本中地名识别[J].大连理工大学学报,2007,47(3):433-438. 被引量：16

同被引文献23

1张永臣,孙乐,李飞,李文波,西野文人,于浩,方高林.基于Web数据的特定领域双语词典抽取[J].中文信息学报,2006,20(2):16-23. 被引量：11
2蒋龙,周明,简立峰.利用音译和网络挖掘翻译命名实体[J].中文信息学报,2007,21(1):23-29. 被引量：11
3邹波,赵军.英汉人名音译方法研究//第四届全国学生计算语言学研讨会论集,2008:24-30.
4D Bikel, S Miller, R Schwartz, et al. A high-performance learning name-finder[C]//Proceedings of Applied Natural Language Processing,Washington DC:1997.
5Jenq-Haur Wang, Jei-Wen Teng, Pu-Jen Cheng,et al. Translating unknown cross-lingual queries in digital libraries using a web-based approach[C]//Proceedings of the 4th ACM/IEEE-CS Joint Conference on Digital Libraries.ACM,2004:108-116.
6Jiang L,Zhou M,Chien L F,et al.Named entity translation with web mining and Tansliteration[C]//Proceedings of the IJCAI.2007,7:1629-1634.
7Huang F, Vogel S, Waibel A. Automatic Extraction of Named Entity Translingual Equivalence Based on Multi-Feature Cost Minimization[C]//Proceeding of Association of Computational Linguistics, Sapporo,Japan,2003.
8Ru K,Xu J,Zhang Y,et al.A Method to Construct Chinese-Japanese Named Entity Translation Equivalents Using Monolingual Corpora.Natural Language Processing and Chinese Computing. Springer Berlin Heidelberg,2013:164-175.
9荒木健治,高橋祐治,桃内佳雄,等.帰納的学習を用いたかな漢字変換[C]//電子情報通信学会論文誌,1996,J79-D-Ⅱ(3):391-402.
10John Lafferty, Andrew McCallum, Fernando C N Pereira, Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data, 2001.

引证文献2

1王东明,徐金安,陈钰枫,张玉洁.基于单语语料的面向日语假名的日汉人名翻译对抽取方法[J].中文信息学报,2015,29(5):84-90. 被引量：1
2刘颖,曹项.基于网络搜索的英汉人名翻译[J].中文信息学报,2017,31(2):49-54.

二级引证文献1

1李源,蔡忠祥,李娜,黄子鸣.基于CiteSpace的国内命名实体识别技术的知识图谱分析[J].现代信息科技,2024,8(15):124-128.

1阎宗岭.PCD小编力荐不可不知的Chrome七大外挂[J].计算机应用文摘,2010(15):40-41.
2邵有为.还字体一个“名分”[J].新潮电子,2000(2):70-71.
3项保,张国喜.汉藏机器翻译中汉族人名翻译问题探讨[J].青海师范大学学报（自然科学版）,2011,27(4):88-90. 被引量：3
4刘文涛.浅谈AutoCAD2000使用技巧[J].信息技术,2003,27(4):47-48.
5阿布都哈力力·阿布都热依木,卿松,张建业,张超,塔拉甫·加盘.Moses在汉-维电费自助缴费终端系统中的应用[J].电脑知识与技术,2014,0(12):8188-8190.
6便携智能投影机海联达Ai-Stream Mini[J].计算机应用文摘,2013(11):91-91.
7傻里傻气.给网卡一个名分：刷新MS-KT6V集成网卡的MAC地址[J].微型计算机,2004(21):118-118.
8MOSES首款国产工业防火墙Guard问世七大核心优势护航工业信息安全[J].现代制造,2014(13):21-21.
9张雨莹.作家流水线复旦大学的文学试验[J].新民周刊,2014,0(20):62-65.
10邹智敏,郭荷清,高英.一种对英文字符串进行分词的方法[J].计算机应用研究,2007,24(7):52-54. 被引量：2

智能计算机与应用

2012年第1期

浏览历史

内容加载中请稍等...

基于统计的日本人名的识别和翻译被引量：2

参考文献1

二级参考文献2

共引文献22

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于统计的日本人名的识别和翻译 被引量：2

参考文献1

二级参考文献2

共引文献22

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于统计的日本人名的识别和翻译被引量：2