英文句子边界自动识别被引量：7

Auto Detection for English Sentence Boundaries

下载PDF

导出

摘要英语句子边界的识别是英文文本分析的基本问题 ,是进一步进行英汉机器翻译的基础。本文采用了统计决策树与错误驱动相结合的方法进行英语句子边界的识别 ,首先通过决策树学习训练语句中的句子划分规则 ,之后用错误驱动的方法对所获得的结果进一步修正 ,对 Penn Tree-Bank语句进行测试 ,正确率达到 98.6 %。 Sentence boundary identification is essential to English text analysis and machine translation. This paper proposes a strategy that combines decision tree with error-driven method to labeling English sentence boundaried. It achieves 98.6% accuracy over part of Penn TreeBank texts.

作者黄成哲张晓光李向宏王丁

机构地区黑龙江工程学院计算机系

出处《微处理机》 2003年第1期30-34,共5页 Microprocessors

关键词英文句子边界自动识别机器翻译语句边界检测决策树学习算法自然语言处理 sentence boundaries detection,decision tree,error-driven,rules

分类号 TP391.2 [自动化与计算机技术—计算机应用技术] H315.9 [语言文字—英语]

引文网络
相关文献

参考文献6

1[1]Riley, M. D. Some Application of Tree- Modeling to Speech and Language Indexing. In Proceedings of the DARPA Speech and Natural Language Workshop,1989:339～352.
2[2]Humphrey, T. , and Zhou, F. Period Disambiguation Using a Neural Network. In IJCNN : International Joint Conference on Neural Networks ,1989 : 606
3[3]Palmer, D. D., and Hearst, M. A. 1994 Adaptive Sentence Boundary Disambiguation. UC Berkeley Computer Science Technical Report Number UCB/CSD -94-797. Also CL,1997
4[4]David D. Plamer, 1995. Experiments in Multilingual Sentence Boundary Recognition; Proc. of Recent Advances In Natural Language Processing, Bulgaria,1995
5[5]Andrei Mikheev, 1994. Periods, Capitalized Words etc.Computational Linguistics, 9884 (Vo116: No. 1)
6[6]Andrei Mikheev, 1999. A Knowledge-free Method for Capitalized Word Disambiguation,Proc. of 37th Annual Meeting of the ACL, 1999

同被引文献38

1冯志伟.基于短语结构语法的自动句法分析方法[J].当代语言学,2000,2(2):84-98. 被引量：16
2毕雪华,吐尔根.依布拉音.基于限定领域的平行语料库的设计[J].电脑知识与技术,2005(9):77-78. 被引量：1
3张艳,柏冈秀纪.基于长度的扩展方法的汉英句子对齐[J].中文信息学报,2005,19(5):31-36. 被引量：24
4刘冬明,杨尔弘,方莹.汉英双语平行语料库的词义标注[J].中文信息学报,2005,19(6):50-56. 被引量：4
5贾卫忠,王开松,李存华.Delphi基于ADO通用数据库连接的实现和应用[J].电脑知识与技术,2006,1(5):33-35. 被引量：4
6祁坤钰.信息处理用藏文自动分词研究[J].西北民族大学学报（哲学社会科学版）,2006(4):92-97. 被引量：34
7王诗文.汉、藏语句子结构对比研究[J].西南民族大学学报（人文社会科学版）,2007,28(4):50-55. 被引量：4
8钱之莹.汉英/英汉平行翻译语料库的设计及其在翻译中的应用.华东师范大学,硕士研究生学位论文.
9Shengwei Tian, Turgun · Ibrahim. Chinese-Uighur Sentence Alignment Based on Hybrid Strategy with Mistake Spread Suppression ESIAT2009 Vol 2,July 2009,pp.683-688.
10Pahner D D,Hearst M A.Adaptive sentence boundary disambiguation[C]//Proceedings of the 1994 Conference on Applied Natural Language Processing(ANLP),Stuttgart,Germany,1994:78.

引证文献7

1贾卫忠,龚育尔.基于C/S结构的英语文章分析系统研究和实现[J].计算机与数字工程,2007,35(2):152-155. 被引量：2
2阿比达.吾买尔,吐尔根.依布拉音.维吾尔语句子边界识别算法的设计与实现[J].新疆大学学报（自然科学版）,2008,25(3):360-363. 被引量：10
3张亚军,吐尔根·依布拉音,田生伟.汉语-维吾尔语句子级对齐系统分析及其实现[J].中国科技纵横,2010(6):126-126. 被引量：3
4艾山.吾买尔,吐尔根.依步拉音.统计与规则相结合的维吾尔语句子边界识别[J].计算机工程与应用,2010,46(14):162-165. 被引量：7
5才藏太.基于最大熵分类器的藏文句子边界自动识别方法研究[J].计算机工程与科学,2012,34(6):187-190. 被引量：10
6张亚军,贺琛琛,香丽芸.限定领域的汉语-维吾尔语句子级对齐研究[J].软件,2014,35(3):62-64. 被引量：1
7艾孜海尔江,艾孜尔古丽,玉素甫.艾白都拉.现代维吾尔语句子分类系统[J].计算机与现代化,2015(3):84-87. 被引量：1

二级引证文献29

1艾山.吾买尔,吐尔根.依步拉音.基于最大熵的维吾尔语句子边界识别模型[J].计算机工程,2010,36(6):24-26. 被引量：7
2艾山.吾买尔,吐尔根.依步拉音.统计与规则相结合的维吾尔语句子边界识别[J].计算机工程与应用,2010,46(14):162-165. 被引量：7
3龚育尔,李进祺,杨金锋,贾卫忠.英语教材中功能词与阅读难易度相关性研究[J].安徽工业大学学报（社会科学版）,2010,27(1):73-75. 被引量：1
4张亚军.汉语-维吾尔语机器翻译解码器研究[J].昌吉学院学报,2011(3):110-113.
5李文刚,周杰,杨保群.基于词典和句长及位置的双语对齐方法的改进[J].现代电子技术,2011,34(14):25-27. 被引量：2
6李响,才藏太,姜文斌,吕雅娟,刘群.最大熵和规则相结合的藏文句子边界识别方法[J].中文信息学报,2011,25(4):39-44. 被引量：17
7吐尔根·依布拉音,袁保社.新疆少数民族语言文字信息处理研究与应用[J].中文信息学报,2011,25(6):149-156. 被引量：26
8才让加.面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究[J].中文信息学报,2011,25(6):157-161. 被引量：18
9才藏太.基于最大熵分类器的藏文句子边界自动识别方法研究[J].计算机工程与科学,2012,34(6):187-190. 被引量：10
10赵维纳,于新,刘汇丹,李琳,王磊,吴健.现代藏语助动词结尾句子边界识别方法[J].中文信息学报,2013,27(1):115-119. 被引量：7

1戚世远.英汉机器翻译中的语义分析[J].计算机应用,1991,11(5):11-13.
2戚世远.英汉机器翻译中的语义分析[J].计算机应用与软件,1993,10(4):54-58. 被引量：2
3李芳,谢志良.一个基于PROLOG的英汉机器翻译实验系统(PMT)的设计与实现[J].小型微型计算机系统,1989,10(3):44-46.
4谢金宝,孙岗,杨振宇.基于单词规则的英汉机器翻译和消歧研究[J].情报学报,1997,16(5):370-375.
5陈丽江,陈小荷.统计和规则结合识别动词的跨分句论元[J].计算机工程与应用,2009,45(16):40-42.
6李素元,黄晓玲.“译星”英汉机器翻译系统[J].软件世界,1994(12):5-6.
7张伟.中软译星技术创新开发嵌入式应用[J].半导体技术,2007,32(10):920-920.
8杨海涛.基于规则的多种策略句法分析[J].软件导刊,2014,13(10):63-64. 被引量：1
9邵文华.如何提高初中学生的英语听力[J].学园,2014,0(35):131-131. 被引量：1
10阿里甫.库尔班,吾买尔江.库尔班,尼加提.阿不都肉苏力.维吾尔语框架语义网及框架语义信息管理系统的设计[J].新疆大学学报（自然科学版）,2012,29(3):333-338.

微处理机

2003年第1期

浏览历史

内容加载中请稍等...

英文句子边界自动识别被引量：7

参考文献6

同被引文献38

引证文献7

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

英文句子边界自动识别 被引量：7

参考文献6

同被引文献38

引证文献7

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

英文句子边界自动识别被引量：7