期刊文献+

鲁迅小说词汇统计研究

下载PDF
导出
摘要 本研究运用多种文本处理和分析工具,对鲁迅小说所用字和词进行了定量统计,并将结果与北京语言大学的相关语料进行了对比。研究结果表明,两种语料形符数(tokens)差异极大,高频词差异显著,但100个高频字相同度高达83%。研究同时发现词性分布的有意义现象:鲁迅小说频次最高的词是动词,而非名词。数量居前三位的依次是动词、名词和副词,三者覆盖全部语料的55.77%。而一般认为居于第三位的形容词,在鲁迅小说中仅处于第六位。笔者对出现上述现象的成因进行了讨论与解释,并建议作进一步探讨。
作者 孙鸿仁
出处 《绍兴文理学院学报》 2013年第6期26-30,共5页 Journal of Shaoxing University
基金 教育部人文社科项目"鲁迅小说中英文平行语料库建设与应用研究"(项目编号:09YJA740080)的阶段性成果之一
  • 相关文献

参考文献12

  • 1刘云.汉语词汇统计研究述评[J].汉语学习,2009(1):62-69. 被引量:6
  • 2Lyne,A.A.Lexicometric Approach to the Description of a Language Variety[M].Sheffield:University of Sheffidd,1981.
  • 3杨奔.20世纪的现代汉语词汇统计研究[J].玉林师范学院学报,2002,23(1):82-85. 被引量:2
  • 4王惠.汉语词汇统计研究[EB/OL].www.huayuqiao.org/articles/wanghui/wanghui06.doc,检索日2012-10-7.
  • 5杨坚定,孙鸿仁.鲁迅小说汉英平行语料库[EB/OL],http://corpus.zscas.edu.cn/2009-09-25,检索日2012-10-7.
  • 6汉语国际教育技术研发中心(a).汉语常用词词频表[EB/OL]http://nlp.blcu.edu.cn/downloads/download-resources/2012-10-7.
  • 7汉语国际教育技术研发中心(b).汉字字频词典[EB/OL]http://nlp.blcu.edu.cn/downloads/download-resources/,检索日2012-10-7.
  • 8ABBYY开发组.www.abbyy.com,检索日2012-10-7.
  • 9张华平.ICTCLAS汉语分词系统[EB/OL].http://ictclas.org,检索日2008-07.
  • 10Anthony,L.AntConc 3.2.4w[EB/OL].http://www.antlab.sci.waseda.ac.jp/software.html,检索日2012-10-7.

二级参考文献33

共引文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部