鲁迅小说词汇统计研究

下载PDF

导出

摘要本研究运用多种文本处理和分析工具,对鲁迅小说所用字和词进行了定量统计,并将结果与北京语言大学的相关语料进行了对比。研究结果表明,两种语料形符数(tokens)差异极大,高频词差异显著,但100个高频字相同度高达83%。研究同时发现词性分布的有意义现象:鲁迅小说频次最高的词是动词,而非名词。数量居前三位的依次是动词、名词和副词,三者覆盖全部语料的55.77%。而一般认为居于第三位的形容词,在鲁迅小说中仅处于第六位。笔者对出现上述现象的成因进行了讨论与解释,并建议作进一步探讨。

作者孙鸿仁

机构地区绍兴文理学院外国语学院

出处《绍兴文理学院学报》 2013年第6期26-30,共5页 Journal of Shaoxing University

基金教育部人文社科项目"鲁迅小说中英文平行语料库建设与应用研究"(项目编号:09YJA740080)的阶段性成果之一

关键词鲁迅小说统计分析字频词频词表

分类号 H315.9 [语言文字—英语]

引文网络
相关文献

参考文献12

1刘云.汉语词汇统计研究述评[J].汉语学习,2009(1):62-69. 被引量：6
2Lyne,A.A.Lexicometric Approach to the Description of a Language Variety[M].Sheffield:University of Sheffidd,1981.
3杨奔.20世纪的现代汉语词汇统计研究[J].玉林师范学院学报,2002,23(1):82-85. 被引量：2
4王惠.汉语词汇统计研究[EB/OL].www.huayuqiao.org/articles/wanghui/wanghui06.doc,检索日2012-10-7.
5杨坚定,孙鸿仁.鲁迅小说汉英平行语料库[EB/OL],http://corpus.zscas.edu.cn/2009-09-25,检索日2012-10-7.
6汉语国际教育技术研发中心(a).汉语常用词词频表[EB/OL]http://nlp.blcu.edu.cn/downloads/download-resources/2012-10-7.
7汉语国际教育技术研发中心(b).汉字字频词典[EB/OL]http://nlp.blcu.edu.cn/downloads/download-resources/,检索日2012-10-7.
8ABBYY开发组.www.abbyy.com,检索日2012-10-7.
9张华平.ICTCLAS汉语分词系统[EB/OL].http://ictclas.org,检索日2008-07.
10Anthony,L.AntConc 3.2.4w[EB/OL].http://www.antlab.sci.waseda.ac.jp/software.html,检索日2012-10-7.

二级参考文献33

1张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999(1):35-44. 被引量：49
2陈瑞端,汤志祥.九十年代汉语词汇地域分布的定量研究[J].语言文字应用,1999(3):10-18. 被引量：23
3张普.关于语感与流通度的思考[J].语言教学与研究,1999(2):83-96. 被引量：60
4靳平妥.词汇统计工作[J].外语教学与研究,1962,4(1):55-58. 被引量：1
5张凯.汉语构词基本字的统计分析[J].语言教学与研究,1997(1):43-52. 被引量：64
6尹斌庸,方世增.词频统计的新概念和新方法[J].语言文字应用,1994(2):69-75. 被引量：33
7李兆麟.汉语计量研究初探——兼评《现代汉语频率词典》[J].辞书研究,1989(1):116-123. 被引量：6
8张拱贵,吴晓露.常用词表编制中的若干问题[J].辞书研究,1989(6):88-93. 被引量：1
9王还.汉语词汇的统计研究与词典编纂[J].辞书研究,1986(4):106-108. 被引量：3
10常宝儒.关于《现代汉语频率词典》的编纂问题[J].辞书研究,1986(4):109-117. 被引量：7

共引文献22

1曾小兵,张志平,刘荣,杨尔弘,张普.《中国语言生活状况报告》中成语与习语的调查与思考[J].中文信息学报,2008,22(6):43-49. 被引量：4
2刘云.汉语词汇统计研究述评[J].汉语学习,2009(1):62-69. 被引量：6
3周小兵,刘娅莉.初级汉语综合课教材选词考察[J].语言教学与研究,2012(5):26-33. 被引量：18
4陈曦.《白鹿原》颜色词统计研究[J].文学教育,2013(9):40-41. 被引量：1
5郝瑜鑫.定量研究与汉语学习词典编纂理念的创新[J].云南师范大学学报（对外汉语教学与研究版）,2013,11(5):34-40. 被引量：5
6黄震云,吴晓波,吴俊杰,张燕.立法语言的语体(上)[J].辽东学院学报（社会科学版）,2014,16(2):90-109. 被引量：2
7周剑峰,阳爱民,周咏梅,王璇璇.基于二元搭配词的微博情感特征选择[J].计算机工程,2014,40(6):162-165. 被引量：6
8李湘东,何海红,曹环,黄莉.针对训练集分布偏斜问题的数字资源文本分类方法[J].现代图书情报技术,2014(7):24-33. 被引量：2
9王娟,姜灵敏,胡青,彭碧涛,李碧.面向中文维基百科的检索模型研究[J].情报杂志,2014,33(10):179-183.
10艾孜尔古丽,努尔艾合买提,玉素甫.艾白都拉.现代维吾尔语常用词统计关键技术研究[J].中文信息学报,2014,28(5):192-197. 被引量：8

1娄宝翠.正则表达式与文本处理技术应用[J].河南师范大学学报（哲学社会科学版）,2012,39(3):240-242. 被引量：3
2岳朋雪,姚春林.当代汉语旧词新义词语研究[J].河北联合大学学报（社会科学版）,2014,14(6):87-90.
3邢红兵.中介语词汇与现代汉语词汇对比分析[J].对外汉语研究,2009(1):57-65. 被引量：4
4欧阳丽文,李仕春.从词性的角度看现代汉语同义词的分布规律[J].广西教育学院学报,2013(2):82-85. 被引量：1
5李绍山.命题与文本处理[J].外语研究,2000,17(1):8-12. 被引量：1
6莎日娜.以文本解读为基础提升英语课堂教学的语言运用能力[J].内蒙古师范大学学报（教育科学版）,2015,28(7):124-126. 被引量：4
7郜万伟,李留涛,王德田.翻译技术在翻译教学中的应用[J].吉林工商学院学报,2011,27(1):121-124.
8化振红.《洛阳伽蓝记》中反映魏晋南北朝时代特色的新词[J].西南民族大学学报（人文社会科学版）,2005,26(2):342-346. 被引量：4
9林娜.论中法互译小型建筑类语料库的文本处理[J].哈尔滨职业技术学院学报,2014(1):142-143.
10陈爽.新疆哈萨克语中借词的借入方式和语言特征研究[J].湖北广播电视大学学报,2013,33(7):113-114. 被引量：1

绍兴文理学院学报

2013年第6期

浏览历史

内容加载中请稍等...

鲁迅小说词汇统计研究

参考文献12

二级参考文献33

共引文献22

相关作者

相关机构

相关主题

浏览历史