摘要
在总结常用特征集合的基础上,根据微博文本的特点以及特征选取原则,选取了适合微博文本体裁分析的特征集合,这些特征能典型的反应微博文本和其他文本形式的区别.还分别对不同的文本体裁进行特征值的统计,并将统计结果在不同的文本体裁之间进行了深入的对比分析,并从体裁的角度分析出不同文本体裁的特征值差别的原因.并从体裁特征的角度说明微博文本是一种新的体裁文本.
After summarizing common feature set, according to micro-blog text's characteristics and feature selection principles, this paper selects some feature sets which are suitable for micro-blog text genre analysis. These features can typically reflect the differences between micro-blog text and other text forms. It performs a statistical analysis on different text genre ,and inputs the statistical result to comparison analysis among various text genres, and finds out reasons for characteristic value differences from the perspective of genre feature. It also proves that micro-blog text is a new text genre.
出处
《南华大学学报(自然科学版)》
2015年第2期87-90,96,共5页
Journal of University of South China:Science and Technology
基金
湖南省社科基金资助项目(14YBA335)
湖南省研究生科研创新基金资助项目(2014SCX16)
湖南省自然科学基金资助项目(13JJ4076)
湖南省教育厅优秀青年基金资助项目(13B101)
南华大学重点学科和创新团队建设基金资助项目
衡阳市科技局科技计划基金资助项目(2013KG66
2013KG67)
关键词
微博文本
传统文本
体裁
特征项
micro-blog text
traditional text
genre
feature