期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进TFIDF算法的文本特征选择和聚类分析
1
作者
赵军愉
柴小亮
+2 位作者
李士林
徐松晓
王强
《微型电脑应用》
2023年第10期181-183,187,共4页
为了提高大量文本数据的特征选择能力,采用全覆盖粒计算方法对特征选择算法的数据高维性与稀疏性进行分析。针对TFIDF算法存在的缺陷,设计了一种经过改进后的TFIDF_SP算法,以区分文档内处于不同部位的特征词重要性,并根据不同特征选择...
为了提高大量文本数据的特征选择能力,采用全覆盖粒计算方法对特征选择算法的数据高维性与稀疏性进行分析。针对TFIDF算法存在的缺陷,设计了一种经过改进后的TFIDF_SP算法,以区分文档内处于不同部位的特征词重要性,并根据不同特征选择方法对比结果判断算法有效性。研究结果表明,采用bLDA主题模型提取细主题粒度的时候也无法获得理想聚类效果,此时会对相同主题特征词造成弱化,将其判断为不同主题类型的特征词。在γ取值等于0.8时可以获得最优聚类效果,此时改进TFIDF算法能促进权重的进一步提升。所提出的改进TFIDF算法可以获得比TFIDF和bLDA主题模型更好的结果结合高1.62%的聚类准确率,表明当特征词方式词性与位置变化时会引起文档表达效果的显著影响。
展开更多
关键词
文本特征选择
改进TFIDF算法
聚类效果
主题模型
下载PDF
职称材料
基于词条属性聚类的文本特征选择算法
被引量:
4
2
作者
张群
王红军
王伦文
《计算机应用研究》
CSCD
北大核心
2017年第2期369-372,377,共5页
文本挖掘之前首先要对文本集进行有效的特征选择。传统的特征选择算法在维数约减及文本表征方面效果有限,并且因需要用到文本的类别信息而不适用于无监督的文本聚类任务。针对这种情况,设计一种适用于文本聚类任务的特征选择算法,提出...
文本挖掘之前首先要对文本集进行有效的特征选择。传统的特征选择算法在维数约减及文本表征方面效果有限,并且因需要用到文本的类别信息而不适用于无监督的文本聚类任务。针对这种情况,设计一种适用于文本聚类任务的特征选择算法,提出词条属性的概念。首先基于词频、文档频、词位置及词间关联性构建词条特征模型,重点研究了词位置属性及词间关联性属性的权值计算方法,改进了Apriori算法用于词间关联性属性权值计算;然后通过改进的K-means聚类算法对词条特征模型进行多次聚类完成文本特征选择。实验结果表明,与传统特征选择算法相比,该算法在获得较好维数约减率的同时提高了所选特征词的文本表征能力,能有效适用于文本聚类任务。
展开更多
关键词
文本特征选择
词条属性
词位置
词间关联性
关联规则算法
K-均值算法
下载PDF
职称材料
概念语义生成与文本特征选择研究
被引量:
2
3
作者
孙福振
李贞双
《计算机工程与应用》
CSCD
北大核心
2011年第30期116-118,共3页
文本特征选择是文本分类和信息提取的关键技术。针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部...
文本特征选择是文本分类和信息提取的关键技术。针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部特征。采用非负矩阵分解对全局和局部语义空间进行降维处理提高了体征提取效率,对不同概念语义空间中文本分类效果比对分析。实验结果表明基于非负矩阵分解的局部概念语义空间中文本分类精度较高。
展开更多
关键词
概念语义空间
文本特征选择
非负矩阵分解
下载PDF
职称材料
基于包含度和频繁模式的文本特征选择方法
被引量:
2
4
作者
池云仙
赵书良
李仁杰
《中文信息学报》
CSCD
北大核心
2018年第8期91-102,共12页
大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。"基于模式"特征选择方法具有传统"基于词语"方法所没有的优越...
大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。"基于模式"特征选择方法具有传统"基于词语"方法所没有的优越特性,可以进行有效地信息去噪,提升文本挖掘性能。该文提出基于包含度和频繁模式的文本特征选择方法:首先,定义基于包含度的相似性度量原理;然后,提出基于包含度的冗余文本频繁模式过滤方法。基于包含度度量文本频繁模式间相似性,以此去除子模式及相似度较高的交叉模式。再通过冗余模式去噪,提升文本频繁模式挖掘性能;提出基于关联度的文本特征选择方法。以经过过滤处理后的非冗余文本频繁模式为基础,进行文本特征选择,并利用词语与文档的关联度进行词语类别划分及权重分配。使所选特征与文档关联度更加清晰,分类效果更好。通过在数据集Reuters-21578上的实验得知,基于包含度和频繁模式的文本特征选择算法性能,优于当前普遍应用的传统文本特征选择方法和新的特征选择及特征抽取方法。
展开更多
关键词
大数据
文本
挖掘
文本
频繁模式
包含度
文本特征选择
下载PDF
职称材料
文本分类中基于基尼指数的特征选择算法研究
被引量:
38
5
作者
尚文倩
黄厚宽
+3 位作者
刘玉玲
林永民
瞿有利
董红斌
《计算机研究与发展》
EI
CSCD
北大核心
2006年第10期1688-1694,共7页
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的...
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的特征空间对于大多数分类器来说是难以忍受的,因此采用适当的文本特征选择算法降低原始文本特征空间的维数成为文本分类的首要任务.目前也有很多的文本特征选择算法,介绍了另一种新的基于基尼指数的文本特征选择算法,使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的特征选择评估函数.实验表明,基于基尼指数的文本特征选择能进一步提高分类性能,而且计算复杂度小.
展开更多
关键词
文本
分类
文本特征选择
基尼指数
文本
预处理
下载PDF
职称材料
面向层次分类的文本特征选择方法
被引量:
2
6
作者
祝翠玲
马军
张冬梅
《模式识别与人工智能》
EI
CSCD
北大核心
2011年第1期103-110,共8页
提出一种针对层次分类的文本特征选择方法.先给出类别层次相关度的概念,并利用分类树和训练数据在不同层次上的概率分布进行计算,进而得到分类树中不同类别的重要性.最后基于前面的计算结果,计算每个特征对类别的识别能力,并选择识别能...
提出一种针对层次分类的文本特征选择方法.先给出类别层次相关度的概念,并利用分类树和训练数据在不同层次上的概率分布进行计算,进而得到分类树中不同类别的重要性.最后基于前面的计算结果,计算每个特征对类别的识别能力,并选择识别能力大的特征组成用于分类的特征集合.实验表明该方法在选取的特征质量以及在accuracy、F1和micro-Precision等分类测度上均优于传统方法.
展开更多
关键词
文本特征选择
类别层次相关
层次分类
机器学习
原文传递
面向短文本的特征选择及文本表示
被引量:
1
7
作者
马建红
刘广森
+1 位作者
姚爽
杨智
《计算机与现代化》
2019年第3期95-101,126,共8页
短文本由于其稀疏性、实时性、非标准性等特点,在文本特征选择和文本表示方面存在较多问题,从而影响文本分类精度。针对文本特征选择方面存在较高的特征维数灾难的问题,提出一种二阶段的文本特征选择算法。首先在互信息算法的基础上,引...
短文本由于其稀疏性、实时性、非标准性等特点,在文本特征选择和文本表示方面存在较多问题,从而影响文本分类精度。针对文本特征选择方面存在较高的特征维数灾难的问题,提出一种二阶段的文本特征选择算法。首先在互信息算法的基础上,引入平衡因子、频度、集中度、词性及词在文本中的位置等5个指标对互信息值进行计算,然后将排序结果靠前的特征集初始化进行遗传算法的训练从而得到最优特征集合。因为TFIDF在计算时针对的是整篇语料而没有考虑类间分布不均的情况,在计算IDF公式时引入方差,并将改进后的TFIDF公式对Word2Vec词向量进行加权表示文本。将改进算法应用在人工构建的百科用途短文本语料集中进行实验,实验结果表明改进的文本特征选择算法和文本表示算法对分类效果有2%~5%的提升。
展开更多
关键词
文本特征选择
文本
表示
遗传算法
文本
分类
下载PDF
职称材料
基于改进的果蝇优化算法的文本特征选择优化模型
被引量:
3
8
作者
温廷新
李洋子
孙静霜
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第5期59-69,共11页
【目的】降低文本特征向量空间的维度,提高文本分类准确率。【方法】提出一种基于改进果蝇优化算法的文本特征选择优化新模型——IFOATFSO模型,该模型引入分类准确率方差,监控模型收敛程度;引入模拟退火机制及遗传算法的交叉算子、轮盘...
【目的】降低文本特征向量空间的维度,提高文本分类准确率。【方法】提出一种基于改进果蝇优化算法的文本特征选择优化新模型——IFOATFSO模型,该模型引入分类准确率方差,监控模型收敛程度;引入模拟退火机制及遗传算法的交叉算子、轮盘赌选择法,加深全局搜索,提高种群多样性。【结果】在CHI方法基础上应用IFOATFSO模型优化特征选择,大幅度地降低特征维度,提高文本分类准确率,最大提高幅度能够达到10.5%。【局限】IFOATFSO模型优化英文文本特征效果略逊于优化中文文本特征效果。【结论】IFOATFSO模型优化特征选择一定程度上可以改进文本分类效果。
展开更多
关键词
文本特征选择
果蝇优化算法
分类准确率方差
原文传递
大数据时代中文文本褒贬倾向性分类研究
被引量:
2
9
作者
曾凡锋
朱万山
王景中
《信息网络安全》
2014年第11期30-35,共6页
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大...
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF算法对文本褒贬倾向性分类是有效的。
展开更多
关键词
褒贬倾向性分类
文本特征选择
褒贬
特征
提取
下载PDF
职称材料
题名
基于改进TFIDF算法的文本特征选择和聚类分析
1
作者
赵军愉
柴小亮
李士林
徐松晓
王强
机构
国网河北省电力有限公司保定供电分公司
国网河北省电力有限公司
出处
《微型电脑应用》
2023年第10期181-183,187,共4页
文摘
为了提高大量文本数据的特征选择能力,采用全覆盖粒计算方法对特征选择算法的数据高维性与稀疏性进行分析。针对TFIDF算法存在的缺陷,设计了一种经过改进后的TFIDF_SP算法,以区分文档内处于不同部位的特征词重要性,并根据不同特征选择方法对比结果判断算法有效性。研究结果表明,采用bLDA主题模型提取细主题粒度的时候也无法获得理想聚类效果,此时会对相同主题特征词造成弱化,将其判断为不同主题类型的特征词。在γ取值等于0.8时可以获得最优聚类效果,此时改进TFIDF算法能促进权重的进一步提升。所提出的改进TFIDF算法可以获得比TFIDF和bLDA主题模型更好的结果结合高1.62%的聚类准确率,表明当特征词方式词性与位置变化时会引起文档表达效果的显著影响。
关键词
文本特征选择
改进TFIDF算法
聚类效果
主题模型
Keywords
feature selection
improved TFIDF algorithm
clustering effect
topic model
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词条属性聚类的文本特征选择算法
被引量:
4
2
作者
张群
王红军
王伦文
机构
电子工程学院
出处
《计算机应用研究》
CSCD
北大核心
2017年第2期369-372,377,共5页
基金
国家自然科学基金资助项目(61273302)
文摘
文本挖掘之前首先要对文本集进行有效的特征选择。传统的特征选择算法在维数约减及文本表征方面效果有限,并且因需要用到文本的类别信息而不适用于无监督的文本聚类任务。针对这种情况,设计一种适用于文本聚类任务的特征选择算法,提出词条属性的概念。首先基于词频、文档频、词位置及词间关联性构建词条特征模型,重点研究了词位置属性及词间关联性属性的权值计算方法,改进了Apriori算法用于词间关联性属性权值计算;然后通过改进的K-means聚类算法对词条特征模型进行多次聚类完成文本特征选择。实验结果表明,与传统特征选择算法相比,该算法在获得较好维数约减率的同时提高了所选特征词的文本表征能力,能有效适用于文本聚类任务。
关键词
文本特征选择
词条属性
词位置
词间关联性
关联规则算法
K-均值算法
Keywords
text feature selection
vocabulary attribute
term position
term correlation
Apriori algorithm
K-means cluste- ring algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
概念语义生成与文本特征选择研究
被引量:
2
3
作者
孙福振
李贞双
机构
山东理工大学计算机科学与技术学院
南阳师范学院计算机与信息技术系
出处
《计算机工程与应用》
CSCD
北大核心
2011年第30期116-118,共3页
基金
国家自然科学基金No.61003168
河南省重大科技攻关基金(No.092102110274)~~
文摘
文本特征选择是文本分类和信息提取的关键技术。针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部特征。采用非负矩阵分解对全局和局部语义空间进行降维处理提高了体征提取效率,对不同概念语义空间中文本分类效果比对分析。实验结果表明基于非负矩阵分解的局部概念语义空间中文本分类精度较高。
关键词
概念语义空间
文本特征选择
非负矩阵分解
Keywords
concept semantic space
text feature selection
non-negative matrix factorization
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于包含度和频繁模式的文本特征选择方法
被引量:
2
4
作者
池云仙
赵书良
李仁杰
机构
河北师范大学资源与环境科学学院
河北师范大学数学与信息科学学院
出处
《中文信息学报》
CSCD
北大核心
2018年第8期91-102,共12页
基金
国家自然科学资金(71271067)
国家社科基金(13&ZD091)
河北省高等学校科学技术研究项目(QN2014196)
文摘
大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。"基于模式"特征选择方法具有传统"基于词语"方法所没有的优越特性,可以进行有效地信息去噪,提升文本挖掘性能。该文提出基于包含度和频繁模式的文本特征选择方法:首先,定义基于包含度的相似性度量原理;然后,提出基于包含度的冗余文本频繁模式过滤方法。基于包含度度量文本频繁模式间相似性,以此去除子模式及相似度较高的交叉模式。再通过冗余模式去噪,提升文本频繁模式挖掘性能;提出基于关联度的文本特征选择方法。以经过过滤处理后的非冗余文本频繁模式为基础,进行文本特征选择,并利用词语与文档的关联度进行词语类别划分及权重分配。使所选特征与文档关联度更加清晰,分类效果更好。通过在数据集Reuters-21578上的实验得知,基于包含度和频繁模式的文本特征选择算法性能,优于当前普遍应用的传统文本特征选择方法和新的特征选择及特征抽取方法。
关键词
大数据
文本
挖掘
文本
频繁模式
包含度
文本特征选择
Keywords
big data
text mining
text frequent pattern
inclusion degree
text feature selection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本分类中基于基尼指数的特征选择算法研究
被引量:
38
5
作者
尚文倩
黄厚宽
刘玉玲
林永民
瞿有利
董红斌
机构
北京交通大学计算机与信息技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第10期1688-1694,共7页
基金
国家自然科学基金项目(60503017)
北京交通大学人才基金项目(JSJ04002)~~
文摘
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的特征空间对于大多数分类器来说是难以忍受的,因此采用适当的文本特征选择算法降低原始文本特征空间的维数成为文本分类的首要任务.目前也有很多的文本特征选择算法,介绍了另一种新的基于基尼指数的文本特征选择算法,使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的特征选择评估函数.实验表明,基于基尼指数的文本特征选择能进一步提高分类性能,而且计算复杂度小.
关键词
文本
分类
文本特征选择
基尼指数
文本
预处理
Keywords
text categorization
text feature selection
Gini index
text preprocessing
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
面向层次分类的文本特征选择方法
被引量:
2
6
作者
祝翠玲
马军
张冬梅
机构
山东大学计算机科学与技术学院
山东经济学院信息管理学院
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2011年第1期103-110,共8页
基金
国家自然科学基金项目(No.60970047)
山东省自然科学基金项目(No.Y2008G19)
+1 种基金
山东省科技攻关项目(No.2007GG10001002
2008GG10001026)资助
文摘
提出一种针对层次分类的文本特征选择方法.先给出类别层次相关度的概念,并利用分类树和训练数据在不同层次上的概率分布进行计算,进而得到分类树中不同类别的重要性.最后基于前面的计算结果,计算每个特征对类别的识别能力,并选择识别能力大的特征组成用于分类的特征集合.实验表明该方法在选取的特征质量以及在accuracy、F1和micro-Precision等分类测度上均优于传统方法.
关键词
文本特征选择
类别层次相关
层次分类
机器学习
Keywords
Text Feature Selection, Category Hierarchical Correlation, Hierarchical Classification,Machine Learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
面向短文本的特征选择及文本表示
被引量:
1
7
作者
马建红
刘广森
姚爽
杨智
机构
河北工业大学计算机科学与软件学院
出处
《计算机与现代化》
2019年第3期95-101,126,共8页
基金
中国科学技术咨询服务中心计算机辅助创新设计公共服务平台建设服务采购项目(HSZT2015FD/254)
文摘
短文本由于其稀疏性、实时性、非标准性等特点,在文本特征选择和文本表示方面存在较多问题,从而影响文本分类精度。针对文本特征选择方面存在较高的特征维数灾难的问题,提出一种二阶段的文本特征选择算法。首先在互信息算法的基础上,引入平衡因子、频度、集中度、词性及词在文本中的位置等5个指标对互信息值进行计算,然后将排序结果靠前的特征集初始化进行遗传算法的训练从而得到最优特征集合。因为TFIDF在计算时针对的是整篇语料而没有考虑类间分布不均的情况,在计算IDF公式时引入方差,并将改进后的TFIDF公式对Word2Vec词向量进行加权表示文本。将改进算法应用在人工构建的百科用途短文本语料集中进行实验,实验结果表明改进的文本特征选择算法和文本表示算法对分类效果有2%~5%的提升。
关键词
文本特征选择
文本
表示
遗传算法
文本
分类
Keywords
text feature selection
text representation
genetic algorithm
text classification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于改进的果蝇优化算法的文本特征选择优化模型
被引量:
3
8
作者
温廷新
李洋子
孙静霜
机构
辽宁工程技术大学系统工程研究所
辽宁工程技术大学工商管理学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第5期59-69,共11页
文摘
【目的】降低文本特征向量空间的维度,提高文本分类准确率。【方法】提出一种基于改进果蝇优化算法的文本特征选择优化新模型——IFOATFSO模型,该模型引入分类准确率方差,监控模型收敛程度;引入模拟退火机制及遗传算法的交叉算子、轮盘赌选择法,加深全局搜索,提高种群多样性。【结果】在CHI方法基础上应用IFOATFSO模型优化特征选择,大幅度地降低特征维度,提高文本分类准确率,最大提高幅度能够达到10.5%。【局限】IFOATFSO模型优化英文文本特征效果略逊于优化中文文本特征效果。【结论】IFOATFSO模型优化特征选择一定程度上可以改进文本分类效果。
关键词
文本特征选择
果蝇优化算法
分类准确率方差
Keywords
Text Feature Selection Fruit Fly Optimization Algorithm Classification Accuracy Variance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
大数据时代中文文本褒贬倾向性分类研究
被引量:
2
9
作者
曾凡锋
朱万山
王景中
机构
北方工业大学信息工程学院
出处
《信息网络安全》
2014年第11期30-35,共6页
基金
北京市自然科学基金重点项目B类[KZ2010009008]
科技成果转化项目[PXM2013]
北京市创新团队计划项目[HT20130502]
文摘
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF算法对文本褒贬倾向性分类是有效的。
关键词
褒贬倾向性分类
文本特征选择
褒贬
特征
提取
Keywords
appraisive classification
text feature selection
appraisive feature extracting
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进TFIDF算法的文本特征选择和聚类分析
赵军愉
柴小亮
李士林
徐松晓
王强
《微型电脑应用》
2023
0
下载PDF
职称材料
2
基于词条属性聚类的文本特征选择算法
张群
王红军
王伦文
《计算机应用研究》
CSCD
北大核心
2017
4
下载PDF
职称材料
3
概念语义生成与文本特征选择研究
孙福振
李贞双
《计算机工程与应用》
CSCD
北大核心
2011
2
下载PDF
职称材料
4
基于包含度和频繁模式的文本特征选择方法
池云仙
赵书良
李仁杰
《中文信息学报》
CSCD
北大核心
2018
2
下载PDF
职称材料
5
文本分类中基于基尼指数的特征选择算法研究
尚文倩
黄厚宽
刘玉玲
林永民
瞿有利
董红斌
《计算机研究与发展》
EI
CSCD
北大核心
2006
38
下载PDF
职称材料
6
面向层次分类的文本特征选择方法
祝翠玲
马军
张冬梅
《模式识别与人工智能》
EI
CSCD
北大核心
2011
2
原文传递
7
面向短文本的特征选择及文本表示
马建红
刘广森
姚爽
杨智
《计算机与现代化》
2019
1
下载PDF
职称材料
8
基于改进的果蝇优化算法的文本特征选择优化模型
温廷新
李洋子
孙静霜
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018
3
原文传递
9
大数据时代中文文本褒贬倾向性分类研究
曾凡锋
朱万山
王景中
《信息网络安全》
2014
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部