摘要
本文以基本统计原则从实证层面讨论计算文学研究中的14篇学术作品,讨论其中所涉及的数据的性质以及导致研究结果的统计工具,指出这其中一系列的技术问题、逻辑谬误和概念缺陷。将所选择的计算文学研究分为两种类型:一种是统计方法严谨,然而并没有提出和解决有意义的学术问题;一种是看似解决了有意义的学术问题,然而或者统计方法并不严谨,或者并没有必要使用统计学和其他机器学习工具。本文通过探讨这些文章所使用的数据以及所使用的计算方法,试图去神秘化计算工具在文学语料库中的应用,重提文学语言修辞和阐释的复杂性,得出的结论是:计算文学批评的方法论和理论前提并不适用于分析文学、文学史和语言学的复杂性。
出处
《山东社会科学》
CSSCI
北大核心
2019年第8期24-39,共16页
Shandong Social Sciences
基金
国家社科基金重大项目“基于大数据技术的古代文学经典文本分析与研究”(项目编号:18ZDA238)的阶段性成果