-
题名基于句类特征的作者写作风格分类研究
被引量:19
- 1
-
-
作者
张运良
朱礼军
乔晓东
张全
-
机构
中国科学技术信息研究所
中国科学院声学研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第22期129-131,223,共4页
-
基金
国家重点基础研究发展规划(973)No.2004CB318104
国家"十一五"科技支撑计划项目资助No.2006BAH03B03~~
-
文摘
不同作家的作品有自己的特点,这些特点体现在词汇、句型、修辞手法等各个方面,尝试使用句类特征进行作者写作风格分类,进一步可以用于作者的识别。利用向量空间模型,以句类作为特征,并通过混合句类分解等技术对句类向量空间降维,使用itc算法对特征项进行权重计算,KNN算法进行分类并利用集成判决技术,形成作者写作风格分类器。本分类器的性能在近现代小说的按作者写作风格的分类和鉴别方面的性能是可以接受的,并有进一步提升的可能。
-
关键词
文本分类
作者写作风格
句类
向量空间模型
概念层次网络(HNC)理论
自然语言理解
-
Keywords
text classification
authorship
sentence category
Vector Space Model (VSM)
Hierarchical Network of Concepts ( HNC ) theory
nature language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-