期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于类别核心词的朴素贝叶斯中文文本分类 被引量:12
1
作者 袁方 苑俊英 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期111-114,共4页
从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用.在此基础上提出了基于类别核心词的分类模式,从标题、摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用.基于朴素贝叶斯分类方法的... 从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用.在此基础上提出了基于类别核心词的分类模式,从标题、摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用.基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率. 展开更多
关键词 文本分类 朴素贝叶斯分类 类别核心
下载PDF
一种基于类别核心词的概念映射方法 被引量:1
2
作者 苑俊英 袁方 刘博 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期140-144,共5页
由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核... 由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作。实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度。 展开更多
关键词 文本分类 类别核心 概念 《知网》
下载PDF
基于社区极大类发现的大数据并行聚类算法 被引量:6
3
作者 钱晓东 曹阳 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第1期117-123,共7页
为了能在大数据中准确快速地寻找到网络结构,该文提出一种基于社区极大类的大数据聚类算法。对于初始节点不确定和适应度函数计算所带来的时间消耗,引入局部关键节点和对适应度公式进行改进来减少时间消耗。对于初始社区的形成,引入了... 为了能在大数据中准确快速地寻找到网络结构,该文提出一种基于社区极大类的大数据聚类算法。对于初始节点不确定和适应度函数计算所带来的时间消耗,引入局部关键节点和对适应度公式进行改进来减少时间消耗。对于初始社区的形成,引入了极大团的概念并通过分析极大团的特性,得出社区的核心类别是由极大团构成,同时提出通过极大团的发现来得到局部核心类别的方法并提出了极大团发现算法的并行策略,然后提出整个算法的并行策略并在真实数据集上实验。实验结果证明该文提出的算法是可行和有效的,适用于大规模数据的网络结构发现。 展开更多
关键词 大数据 聚类 复杂网络 局部关键节点 核心类别 极大团 适应度 并行算法
下载PDF
一种改进的特征选取方法
4
作者 苑俊英 陈海山 《科技信息》 2009年第4期172-173,共2页
从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用,在特征选取中低DF值的词条可能更能代表文本的类别信息。针对以上两个问题,本文提出了基于类别核心词的特征选取方法。首先,从标题、摘要及关键词中提取类... 从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用,在特征选取中低DF值的词条可能更能代表文本的类别信息。针对以上两个问题,本文提出了基于类别核心词的特征选取方法。首先,从标题、摘要及关键词中提取类别核心词;然后,通过加权方式,强化它们在特征选取中的作用;最后在朴素贝叶斯分类方法上进行实验。实验结果表明,提出的方法能够有效提高中文文本的分类准确率。 展开更多
关键词 特征选取 类别核心 朴素贝叶斯 文本分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部