基于大规模语料的英语词汇重复率研究被引量：1

A Large-scale Corpus-based Study of English Vocabulary Repeat Rate

导出

摘要本研究将英国国家语料库(BNC)和美国国家语料库(ANC)大规模海量笔语语料随机分为60个实验组和41个检验组,总计83,864个语篇对,通过计算机编程的手段对英语词汇重复率进行动态分析,建立了估算词汇重复率的数学模型,并运用60个实验组对此公式进行了检验。研究发现,词汇重复率曲线的分布较有规律,极值较少;词汇重复率变化曲线为非线性;词汇重复率预测公式误差较小,可以用于估算不同长度的真实语篇英语词汇重复率的理论数值。 This research randomly divided large-scale w ritten British National Corpus( BNC) and American National Corpus( ANC) into the experimental set and test set,w ith the former containing 60 samples and the latter 41 samples,totaling 83,864 pairs of texts. A dynamic analysis w as made to study the English vocabulary repeat rate by means of computer programs. A mathematic model to calculate vocabulary repeat rate w as established and then tested based on the 60 samples in the experimental set. Results show ed that the distribution curves for vocabulary repeat rates w ere nonlinear and regular,w ith only a few outliers; the inferred formula experienced a very small margin of error in the calculation of theoretical repeat rate,and can be used to estimate the theoretical values of vocabulary repeat rate for authentic English texts of different lengths.

作者赵小东冯志伟

机构地区大连海事大学外国语学院杭州师范大学外国语学院

出处《外语与外语教学》 CSSCI 北大核心 2016年第4期87-95,105,共10页 Foreign Languages and Their Teaching

基金 2012年教育部人文社科项目"英语动态篇际词汇重复率研究"(项目编号:12YJA740116)的阶段性成果

关键词词汇词汇重复率 Brunet模型 95%置信区间 vocabulary vocabulary repeat rate Brunet's model 95% confidence interval

分类号 H0 [语言文字—语言学]

引文网络
相关文献

参考文献28

1Biber, D. 1990. Methodological issues regarding corpus-based analyses of linguistic variation I J]. Literary and Linguistic Computing, ( 5 ) :257 - 269.
2Bogaards, P. 2001. Lexical units and the learning of foreign language vocabulary [J]. Studies in Second Language Acquisition, ( 23 ) :321 - 343.
3Brunet, E.1978. Le Vocabulaire de Jean Giraudoux. Structure et Evolution [M ]. Geneve :Slatkine.
4Crothers, E. & P. Suppes. 1967. Experiments in Second Language Learning [ M ]. New York:Academic Press.
5Devore, J. 2000. Probability and Statistics [ M ]. Pacific Grove: Brooks/Cole.
6Evert, S. 2004. A simple LNRE model for random character sequences[J]. Journes lnternationales d'Analyse Statistique des Donnes Textuelles, ( 1 ) : 1 - 20.
7Fan, F. 2006a. A corpus-based empirical study on inter-textual vocabulary growth [ J ]. Journal of Quantitative Linguistics, ( 1 ) :111 - 127.
8Fan, F. 2006b. Models for dynamic inter-textual type-token relationship [ J ]. Glottometrics, (12) :1 - 10.
9Fan, F. 2008. A corpus-based empirical study on random textual vocabulary coverage [J]. Corpus Linguistics and Linguistic Theory, ( 1 ) :1 - 17.
10Fan,F. 2010. An asymptotic model for the English hapax/vocabulary ratio[ J].spectives Computational Linguistics, (4) :631 -637.

二级参考文献33

1汤声平.从教与学的双重视角看《大学英语》(全新版)系列教材[J].外语界,2002(3):76-80. 被引量：14
2王翠翔,彭聃龄.中-英双语读者词汇表征的研究(一)[J].心理学报,1988,20(4):351-358. 被引量：5
3杨寿勋.《统计自然语言处理基础》评介[J].外语教学与研究,2001,33(4):317-319. 被引量：7
4康艳红,董明.初级对外汉语教材的词汇重现率研究[J].语言文字应用,2005(4):94-99. 被引量：30
5刘海涛,冯志伟.自然语言处理的概率配价模式理论[J].语言科学,2007,6(3):32-41. 被引量：31
6Baayen, R. 2001. Word Frequency Distributions[M]. Dordrecht: Kluwer Academic Publishers.
7Connor, U. 1996. Contrastive Rhetoric [M]. Cambridge: CUP.
8Crothers, E. &P. Suppes. 1967. Experiments in Second Language Learning[M].New York: Academic Press.
9DeLosh, E. &A. McDaniel. 1996. The role of order information in free recall: Application to the word-frequency effect [J].Journal of Experimental Psychology 22: 1136-1146.
10Ellis, N. 2002. Frequency effects in language processing:A review with implications for theories of implicit and explicit language acquisition [J].SSLA 24. 143-188.

共引文献55

1刘逸凡.基于计量风格学的杨绛记叙散文风格研究[J].汉字文化,2022(19):139-141.
2姜孟.语言研究中的小数据统计范式及其人工智能变革——“语言智能学科”方法论构建(之一)[J].英语研究,2023(1):140-160. 被引量：2
3尹景书.词汇触发理论:大学英语学术词汇直接教学[J].浙江海洋学院学报（人文科学版）,2010,27(3):101-105. 被引量：7
4董颖,刘日升,那春光.我国英语语料库计量研究综述[J].图书馆学刊,2011,33(1):126-129.
5陈潇潇.大学英语教材课文词汇分布特征实证研究——《新视野》与Brown语料库的对比分析[J].外语电化教学,2011(2):9-14. 被引量：26
6罗卫华,佟大明.篇际零重复词分布和增长模式实证研究[J].中国外语,2011,8(6):53-58. 被引量：5
7王天剑.语料库语言学研究管窥[J].丽水学院学报,2012,34(4):78-80.
8陈潇潇.大学英语教材的课文篇际词汇重复模式研究[J].江西科技师范学院学报,2012,7(3):65-71. 被引量：3
9黄沭云.语料库驱动下的《21世纪大学英语》词表分析[J].语文学刊（外语教育与教学）,2013(3):10-12.
10邓耀臣,冯志伟.词汇长度与词汇频数关系的计量语言学研究[J].外国语,2013,36(3):29-39. 被引量：20

同被引文献10

1林若谷,林秋玲.英语教师“活动指令语诊断卡”的设计与思考[J].教学与管理（中学版）,2016(6):46-48. 被引量：1
2郭霞.大学英语写作网络自主学习平台构建[J].继续教育研究,2016(7):85-87. 被引量：5
3蔡丽君.浅析初中英语写作教学的有效策略[J].中学生英语,2016,0(22):19-19. 被引量：1
4王学锋.形成性评价对大学生英语写作水平的动态影响研究[J].解放军外国语学院学报,2016,39(4):102-110. 被引量：13
5耿立辉,崔世钢,赵丽.多输入多输出变量带误差模型的最坏情况频域辨识（英文）[J].控制理论与应用,2016,33(10):1366-1372. 被引量：3
6陈大莲.从课堂教学分析的视角探讨英语写作教学——评《英语写作教学》[J].当代教育科学,2017(7). 被引量：4
7皮谨煜.英文语义机器翻译中的模糊语义选取技术[J].现代电子技术,2017,40(22):42-44. 被引量：6
8李春兰.英语口语自动发音校对系统设计[J].现代电子技术,2017,40(24):59-61. 被引量：9
9杨永林,丁韬.资源化与智能化视角下的大学英语写作教学研究[J].外语电化教学,2017(5):9-14. 被引量：14
10王增日,赵晓航,琚成,贾芸芳.基于移动智能终端的LAPS检测系统的设计与实现[J].南开大学学报（自然科学版）,2017,50(6):11-15. 被引量：3

引证文献1

1刘英峰.高校英语写作误差智能诊断系统设计[J].现代电子技术,2018,41(22):159-162.

1罗卫华,赵小东.英语篇际词汇覆盖率研究[J].中国外语,2014,11(6):53-61. 被引量：4
2杨德峰.也说“几乎”——基于语料库的研究[J].国际汉语学报,2015,6(2):183-190. 被引量：1
3王萍.词汇短语体现了折中的外语教学方法[J].西北成人教育学院学报,2006(3):46-47.
4吴芝欣,谭晓平.“再+X+不过”的考察[J].现代语文（下旬．语言研究）,2013(4):62-64. 被引量：4
5范凤祥.轮机英语的篇际词汇重复率[J].大连海事大学学报（社会科学版）,2008,7(3):161-164. 被引量：4
6吴小芬,陈章太(导师).网络传播中话语风格的性别差异研究[J].语言文字应用,2008(3):143-143. 被引量：1
7杨德峰.副词带语气词考察[J].天中学刊,2017,32(1):119-124. 被引量：6
8赵小东,冯志伟.英汉词汇量与篇章长度关系比较研究[J].外语与外语教学,2012(3):51-56. 被引量：2
9宋璟瑶.副词“再”的义项研究[J].武陵学刊,2014,39(3):114-120. 被引量：2
10王林海,孙宁.阅读真实语篇与英文商务信函体裁的习得——基于体裁教学法的行动研究[J].外语电化教学,2010(3):38-42. 被引量：14

外语与外语教学

2016年第4期

浏览历史

内容加载中请稍等...

基于大规模语料的英语词汇重复率研究被引量：1

参考文献28

二级参考文献33

共引文献55

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于大规模语料的英语词汇重复率研究 被引量：1

参考文献28

二级参考文献33

共引文献55

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于大规模语料的英语词汇重复率研究被引量：1