期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文文本体裁的自动分类机制 被引量:5
1
作者 方鸷飞 林鸿飞 +1 位作者 杨志豪 赵晶 《中文信息学报》 CSCD 北大核心 2006年第2期24-32,共9页
文本按体裁自动分类属于按文本的形式分类的范畴,所以它与按内容自动分类问题有许多的不同之处,本文提出了一种关于中文文本体裁自动分类的新机制。在体裁分类过程中首要的问题是分类特征的选取,体裁分类特征项分为两种方式加以描述,一... 文本按体裁自动分类属于按文本的形式分类的范畴,所以它与按内容自动分类问题有许多的不同之处,本文提出了一种关于中文文本体裁自动分类的新机制。在体裁分类过程中首要的问题是分类特征的选取,体裁分类特征项分为两种方式加以描述,一是集合形式,如基于分类词典和语料统计的政论性词汇和情感词汇等,二是规则形式,如公文标识信息和条文句等。基于根据特征之间的关联性和差异性,采用样本分布决策的方法抽取相应的特征项。最后利用支撑向量机算法进行自动分类。该机制已经在五类体裁的语料上得到实现,并获得了较好的效果。 展开更多
关键词 计算机应用 中文信息处理 体裁分类 特征项选取 样本分布决策 支撑向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部