-
题名基于情感主题特征词加权的微博评论聚类算法研究
被引量:2
- 1
-
-
作者
吴迪
杨瑞欣
申超
-
机构
河北工程大学信息与电气工程学院
河北省安防信息感知与处理重点实验室
-
出处
《现代电子技术》
北大核心
2020年第23期67-71,75,共6页
-
基金
国家自然科学基金资助项目(61802107)
国家重点研发计划(2018YFF0301004)
+2 种基金
河北省高等学校科技攻关项目(ZD2018087,ZD2016017)
河北省专业学位研究生教学案例建设项目(KCJSZ2018083)
河北省自然科学基金青年基金项目(F2019402428)。
-
文摘
为了提高微博评论的情感分析聚类效果,提出一种基于情感主题特征词加权的微博评论聚类算法。该算法首先通过定义情感主题词袋提取情感主题词;然后利用语义相似度计算获得情感主题特征词,进一步通过定义情感主题特征词重要度和分布度对其进行加权,充分考虑情感主题特征词对主题的贡献度;最后通过LDA聚类获得加权的情感主题特征词。实验结果表明,该算法表现出较好的情感分析聚类效果,对网络舆情分析有一定的指导作用。
-
关键词
微博评论
聚类算法
LDA聚类
情感分析
特征词加权
主题词提取
-
Keywords
microblog comment
clustering algorithm
LDA clustering
sentiment analysis
feature word weighting
topic word extraction
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于“VASE”特征词的网络查询分类研究
被引量:3
- 2
-
-
作者
王俞霖
孙乐
李文波
-
机构
中国科学院软件研究所基础软件国家工程研究中心
中国科学院研究生院
-
出处
《中文信息学报》
CSCD
北大核心
2009年第3期39-44,共6页
-
基金
国家自然科学基金资助项目(60773027,60736044)
国家863计划重点资助项目(2006AA010108,2008AA01Z145)
-
文摘
网络查询分类对提高搜索引擎的搜索质量有重要的意义。该文通过对真实用户查询日志的分析和标注,发现四种特征词(称之为"VASE"特征词)对查询分类起决定性作用。我们提取特征词并构造了一个特征词倒排索引,用于对查询进行主题分类。在此基础之上,提出了基于网络扩展和加权特征词的方法改善分类的效果。实验结果显示,基于此分类方法的正确率和召回率分别达到78.2%和77.3%。
-
关键词
计算机应用
中文信息处理
网络查询分类
“VASE”特征词
网络扩展
加权特征词
-
Keywords
computer application
Chinese information processing
Web query classification
"VASE" characteristic words
Web extension
weighted words
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名个性化商品推荐系统的混合推荐算法研究
被引量:2
- 3
-
-
作者
王晖
张慧
-
机构
泰州机电高等职业技术学校
-
出处
《科技资讯》
2023年第22期248-252,共5页
-
文摘
推荐算法是推荐系统的核心内容,推荐算法的评价标准包含预分类准确性和测准确性。传统的推荐算法有两个明显缺陷,使用词频作为搜索文本的特征向量与无法克服高频词汇干扰。通过TF/IDF特征词加权改进算法提升分类准确性。提出混合模型LDTF,从信息增益的角度计算每个词性对词义的贡献增益,来判断一个特定词在此词性下能够代表的词义权重,用动态的计算不同词性的词性比,解决传统TF/IDF算法在文本识别的缺陷,使用CW-TF/IDF优化算法提升特征词的分类效果综合提升推荐准确度。为了解决内容推荐稀疏矩阵问题引入WSBCF协作推荐算法,提升推荐系统的用户体验,实验结果表明能在不同评分矩阵稀疏度下,统计能显著且明显提高。
-
关键词
商品推荐
特征词加权
推荐算法
稀疏矩阵
词义权重
-
Keywords
Product recommendation
Weighted feature words
Recommendation algorithm
Sparse matrix
Semantic weight
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征词权重变更的检索优化策略
被引量:5
- 4
-
-
作者
黄思思
-
机构
华东师范大学工商管理学院
-
出处
《情报科学》
CSSCI
北大核心
2016年第7期70-75,共6页
-
文摘
以无限逼近用户的真实检索需求为目的,基于传统检索系统的运行机制,提出了以用户行为数据为输入的检索优化策略。综合考虑用户的选择文档与忽略文档,对选择文档进行整合融为阶段性最能表征目标需求的目标文档,同时提取选择文档与忽略文档的特征词,进行分析以按照一定的规则进行权重调整。从而形成更新后的相似度,进一步进行检索结果的重排序。经实证证明,该策略相较于传统的相似度计算及排序方法有着更好的效果。除了在植物形态特征描述这一专业领域主题下能够发挥出相对优势,在其他主题领域内同样有着优化作用,具备一定的适用性。
-
关键词
特征词加权
信息检索
文本相似度
信息需求表征
-
Keywords
weighted feature words
information retrieval
text similarity
measuring of information needs
-
分类号
G254.9
[文化科学—图书馆学]
-