-
题名基于文本分类的商品评价情感分析
被引量:10
- 1
-
-
作者
钟将
杨思源
孙启干
-
机构
重庆大学计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2014年第8期2317-2321,共5页
-
基金
国家自然科学基金资助项目(61103114)
中央高校基本科研业务费资助项目(CDJZR 185502)
-
文摘
为了在准确判断商品评价情感倾向的同时提高识别效率,提出了基于矩阵投影(MP)和归一化向量(NLV)的文本分类算法实现对商品评价的情感分析。首先,利用矩阵投影提取商品评价的特征词;然后,计算每一类别中特征词的平均特征频率(FF),采用归一化函数(NLF)对平均特征频率进行归一化处理,得到每一类别的归一化向量;最后,通过比较评价的特征向量与每一类别的归一化向量的相似度预测评价的情感倾向。与k近邻(kNN)、朴素贝叶斯(NB)和支持向量机(SVM)算法进行了对比,实验结果表明该算法具有较高的预测准确度和分类速度:尤其与kNN算法相比该算法有明显优势,该算法的宏平均F1值比kNN高出12%以上,分类时间缩短了11/12;与SVM算法相比分类速度也大幅提高。
-
关键词
商品评价
情感分析
文本分类
矩阵投影
归一化向量
-
Keywords
goods evaluation
sentiment analysis
text classification
Matrix Projection (MP)
Normalized Vector(NLV)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于归一化向量的文本分类算法
被引量:7
- 2
-
-
作者
钟将
孙启干
李静
-
机构
重庆大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第8期47-49,共3页
-
基金
国家科技支撑计划基金资助项目(2008BAH37B04)
重庆市自然科学基金资助重点项目(CSTC2008BB2195)
-
文摘
基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。
-
关键词
文本分类
矩阵投影
向量空间模型
归一化向量
-
Keywords
text classification
matrix projection
vector space model
Normalized Vector(NV)
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向Web信息检索的虚核文本分类算法
被引量:4
- 3
-
-
作者
李静
杨小帆
孙启干
-
机构
重庆大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
2012年第10期182-184,187,共4页
-
基金
重庆市自然科学基金资助项目(CSTC2010BB2046)
中央高校研究生科研创新基金资助项目(CDJXS11181164)
-
文摘
提出一种虚核文本分类算法。通过单类别下标记数据的特征词频计算该类别虚核在每个特征项处的特征引力场强,进而获得类别虚核,根据类别虚核对待标记文本产生的引力大小判断其所属类别。实验结果表明,与k近邻算法和朴素贝叶斯算法相比,虚核算法在分类精度和时间开销方面具有较大的优势。
-
关键词
信息检索
文本分类
特征选择
向量空间模型
引力场模型
虚核
-
Keywords
information retrieval
text categorization
feature selection
vector space model
attraction field model
Virtual Kernel(VK)
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种新型的桥梁健康检测算法
- 4
-
-
作者
李静
杨小帆
孙启干
-
机构
重庆大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第6期234-236,共3页
-
基金
教育部新世纪优秀人才支持计划基金资助项目(NCET-05-0759)
重庆市自然科学基金资助重点项目(CSTC2008BB2195)
-
文摘
针对大型桥梁故障诊断问题,提出一种新型高效的诊断算法。该算法将一座桥梁系统看成由大量的"团"组成,每个"团"由一个挠度检测点及其相应的传感器构成,具体分3个阶段进行:(1)受到"挠度共振"的启发,根据线性回归预测理论建立一个测试模型;(2)利用测试模型对所有"团"进行测试;(3)在测试基础上进行综合分析得出检测结果。对真实桥梁进行检测实验,结果表明该方法故障检测率达81.8%。
-
关键词
桥梁系统
健康检测
挠度共振
线性回归
异常“团”
-
Keywords
bridge system
health detection
deflection resonance
linear regression
abnormal clique
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向文本分类的矩阵投影算法
- 5
-
-
作者
钟将
孙启干
李静
-
机构
重庆大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第35期129-132,165,共5页
-
基金
国家自然科学基金(No.60803027)
国家"十一五"科技支撑计划重大项目资助(No.2008BAH37B04)
重庆市自然科学基金(No.CSTC2008BB2195)~~
-
文摘
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。
-
关键词
文本分类
向量空间模型
矩阵投影
特征选择
-
Keywords
text classification
vector space model
matrix projectionf
eature selection
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP393
[自动化与计算机技术—计算机应用技术]
-