-
题名基于改进特征提取及聚类的网络评论挖掘研究
被引量:4
- 1
-
-
作者
李昌兵
庞崇鹏
凌永亮
王强
-
机构
重庆邮电大学经济管理学院
-
出处
《现代情报》
CSSCI
2018年第2期68-74,共7页
-
基金
国家自然科学基金资助项目"基于群体智能的多Agent协作模型与适应性研究"(项目编号:60905066/F030707)
重庆邮电大学自然科学基金资助项目"时间序列数据挖掘技术应用研究"(项目编号:A2009-03)
电子商务与现代物流重庆市高校市级重点实验室重点项目"基于多主体博弈的供应链契约选择与协调控制机制研究"(项目编号:ECML201403)
-
文摘
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。
-
关键词
APRIORI算法
特征提取
PMI算法
K-MEANS算法
语义相似度
-
Keywords
Apriori algorithm
feature extraction
PMI algorithm
K-means algorithm
semantic similarity
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于兴趣度的Web访问用户关联规则挖掘
被引量:8
- 2
-
-
作者
李昌兵
凌永亮
汪尔晶
-
机构
重庆邮电大学经济管理学院
-
出处
《计算机工程与设计》
北大核心
2017年第4期852-856,975,共6页
-
基金
国家自然科学基金项目(60905066)
重庆邮电大学自然科学基金项目(A2009-03)
电子商务与现代物流重庆市高校市级重点实验室重点基金项目(ECML201403)
-
文摘
传统关联规则算法中事务扫描的重复性以及最小支持度设定的不可靠性会导致计算最大频繁集运行效率低并产生大量冗余的、无趣的规则问题,提出一种改进的Apriori关联规则挖掘算法。对候选项目进行约减,引入兴趣度测量因子对提取的关联规则进行优化。数据实验结果表明,该方法可提高传统关联规则挖掘算法的效率,避免传统关联算法中扫描的重复性,对Web访问用户行为分析具有一定的指导意义。
-
关键词
WEB使用挖掘
WEB用户
APRIORI算法
兴趣度
行为分析
-
Keywords
Web usage mining
Web users
Apriori algorithm
interest measure
behavior analysis
-
分类号
TP393.091
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络评论中产品特征的提取优化
被引量:1
- 3
-
-
作者
李昌兵
凌永亮
陶娅芝
-
机构
重庆邮电大学经济管理学院
-
出处
《兰州理工大学学报》
CAS
北大核心
2017年第5期105-109,共5页
-
基金
国家自然科学基金(60905066)
-
文摘
针对现有网络评论中产品特征提取算法运行效率低和准确率低的问题,提出了改进Apriori算法并用于候选特征集合的抽取,结合单字词规则和邻近剪枝规则对候选特征集合进行初步过滤,采用频繁项名词非特征规则及PMI阈值过滤技术对候选产品特征集进行筛选,得到最终产品特征集.以从互联网下载的手机评论语料作为实验对象进行实验,结果验证了该方法具有较高的准确率和查全率.
-
关键词
产品特征
关联规则
剪枝
网络评论
评论挖掘
-
Keywords
product features
association rules
pruning
network reviews
review mining
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名转机换制闯市场 苦练内功创效益
- 4
-
-
作者
凌永亮
-
出处
《决策探索》
1995年第3期46-46,共1页
-
-
关键词
河南省人造板厂
经营管理
企业发展
-
分类号
F426.83
[经济管理—产业经济]
-