摘要
本研究运用多种文本处理和分析工具,对鲁迅小说所用字和词进行了定量统计,并将结果与北京语言大学的相关语料进行了对比。研究结果表明,两种语料形符数(tokens)差异极大,高频词差异显著,但100个高频字相同度高达83%。研究同时发现词性分布的有意义现象:鲁迅小说频次最高的词是动词,而非名词。数量居前三位的依次是动词、名词和副词,三者覆盖全部语料的55.77%。而一般认为居于第三位的形容词,在鲁迅小说中仅处于第六位。笔者对出现上述现象的成因进行了讨论与解释,并建议作进一步探讨。
出处
《绍兴文理学院学报》
2013年第6期26-30,共5页
Journal of Shaoxing University
基金
教育部人文社科项目"鲁迅小说中英文平行语料库建设与应用研究"(项目编号:09YJA740080)的阶段性成果之一