-
题名用于文本挖掘的特征选择方法TFIDF及其改进
被引量:23
- 1
-
-
作者
景丽萍
黄厚宽
石洪波
-
机构
北方交通大学计算机科学与技术学院
-
出处
《广西师范大学学报(自然科学版)》
CAS
2003年第A01期142-145,共4页
-
基金
铁路数据中心体系结构的研究与设计基金资助(2002X039)
-
文摘
文章使用TFIDF特征选择方法对数据源进行预处理,建立了空间矢量模型,为文本分类提供了便利的数据结构.通过分类结果测试该特征选择方法的精确度.根据实验结果分析TFIDF的优缺点,并提出改进的方法.
-
关键词
文本挖掘
tfidf
评估函数
空间矢量模型
特征选择
-
Keywords
text mining
tfidf
evaluation function
SVM model
feature selection
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进TFIDF的文本特征选择方法
被引量:1
- 2
-
-
作者
王珍
维尼拉.木沙江
-
机构
新疆大学信息科学与工程学院
-
出处
《现代计算机》
2009年第7期34-36,86,共4页
-
文摘
分析几种常见的特征选择评价函数,将权值计算函数应用于特征选择,提出一种新的基于改进TFIDF的文本特征选择评价函数,即TFIDF-Dac。它从提高特征项的类区分能力角度考虑,将特征项在类间的分布信息引入公式,弥补了传统的TFIDF的不足。实验测试表明,使用改进的特征选择方法能够有效提高文本分类的准确度。
-
关键词
文本分类
特征选择
评价函数
tfidf
-
Keywords
Text Classification
Feature Selection
Evaluation function
tfidf
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关联规则的检索结果聚类优化
被引量:7
- 3
-
-
作者
王琼
张量
刘闯
-
机构
常熟理工学院信息化办公室
苏州市职业大学计算机工程系
苏州大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第3期47-50,共4页
-
基金
校级教育教学改革基金资助项目(CITJGN200816)
-
文摘
根据元搜索引擎以线性列表的方式为用户提供检索结果的现象,提出一种基于关联规则的检索结果聚类优化方法,在经过分词处理后,提取检索结果中标题和摘要的主要关键词集,从而建立关联词矩阵(AWM)及基于TFIDF函数表示的结果特征向量,实现基于AWM的FCM聚类。仿真实验结果表明,该方法能够提高运行效率及聚类的有效性。
-
关键词
元搜索引擎
FCM算法
关联规则
tfidf函数
关联词矩阵
-
Keywords
meta search engine
FCM algorithm
association rule
tfidf function
Associated Word Matrix(AWM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-