-
题名基于聚类和分类的金庸与古龙小说风格分析
被引量:12
- 1
-
-
作者
肖天久
刘颖
-
机构
清华大学中国语言文学系
-
出处
《中文信息学报》
CSCD
北大核心
2015年第5期167-177,共11页
-
基金
清华大学人文社科振兴基金(20145081042)
国家自然科学基金(61433015)
-
文摘
该文以金庸与古龙的小说作为语料,从计算风格学的角度考察二人的风格差异。对比了两人小说的文本从众性、句子破碎度,同时,使用文本聚类的方法对词和词类的N元文法,标点符号的N元文法以及多种特征的总体情况进行了考察,还使用主成分分析和文本分类对八种特征从总体上进行了比较,结果证实金庸与古龙小说风格存在较大差异:金庸小说从众性大于古龙,较多使用俚语方言,口语性更强,同时在语法结构、短语结构、文本节奏以及文本可读性和语言变化程度上也有较大的差异。
-
关键词
计算风格学
N元文法
聚类
分类
句子破碎度
-
Keywords
computational stylistics
n-gram
clustering
classification
sentence fragmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-