-
题名一种富文本分类方法的设计和实现
被引量:2
- 1
-
-
作者
朱斐
刁红军
吕强
-
机构
苏州大学计算机学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2007年第12期121-122,127,共3页
-
文摘
综合考虑了富文本中的标题、关键词、主题、结构、词形、风格等描述信息,实现了一种富文本分类的方法。根据描述信息的范围和影响力不同给予相应的权重,改进了传统文本分类算法,使具有明显分类特征的特征发挥了较好的分类效果,抑制了权重较小的特征的干扰。实验表明,这种方法具有较好的准确率和召回率。
-
关键词
文本分类
富文本分类
opendocument分类建模
特征选择
-
Keywords
Text classification Rich format text classification opendocument Classification modeling Feature selection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种结合结构化信息的富文本分类方法
- 2
-
-
作者
朱斐
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第6期219-221,共3页
-
文摘
随着文本表现形式越来越丰富,文本分类研究的对象正从平文本逐渐转变为富文本,传统的平文本分类方法不能满足实际需要。分析了富文本中的结构化信息和文本内容信息,把它们作为两个重要的因素,综合考虑了其在分类中的作用,提出并实现了标签组件法、结构组件法和综合法三种富文本分类的方法。实验表明,所提出的方法有较好的分类表现,能解决OpenDocument的分类问题。
-
关键词
文本分类
富文本
opendocument
结构化
-
Keywords
Text classification Rich format text opendocument Structurization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP391.1
[自动化与计算机技术—计算机应用技术]
-