-
题名基于关键词相似度的Web用户挖掘研究与实现
被引量:1
- 1
-
-
作者
刘城霞
吴菲滢
-
机构
北京邮电大学计算机学院
北京信息科技大学计算机学院
-
出处
《计算机科学与应用》
2013年第4期232-238,共7页
-
基金
北京市人才强教计划——骨干教师(PHR201008428)
北京市教委科技发展计划项目(KM201110772013)资助。
-
文摘
在Web挖掘极度盛行的今天,收集大量网络数据已经不是问题,而如何在海量数据中抽取去噪后的有用数据成为要解决的关键问题。本文研究将网站用户的搜索关键词分析聚类,作为用户的兴趣、爱好标签,以供运营分析人员参考。文中根据世界知识或分类体系计算词语语义距离后转化为词语相似度的方法,将词语间距离依据词频、词权重等因子加工计算出关键词集合间相似度矩阵后,用欧式距离表示其关键字集的相似度;之后聚类算法利用现有R软件中开源算法包——基于隐马尔科夫模型的depmix算法包进行的用户聚类算法。最终用某搜索引擎用户的真实数据,经过数据去噪后所得实验数据进行聚类,并于前台展示聚类及用户周边相关结果。
-
关键词
词语相似度
关键词集合相似度
用户聚类
-
Keywords
The Similarity of Words
The Similarity Between Clients (Keyword Sets)
User Clustering
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征融合的主观题智能阅卷算法研究
被引量:2
- 2
-
-
作者
乔亚男
胡名凯
薄钧戈
-
机构
西安交通大学计算机学院
-
出处
《电气电子教学学报》
2021年第6期104-111,共8页
-
基金
教育部基础学科拔尖学生培养计划2.0研究课题(项目编号:20212086)
西安交通大学教学改革研究专项项目(项目编号:17ZX026)
+1 种基金
陕西高等教育教学改革研究项目(项目编号:19BY002)
西安交通大学本科教学改革研究项目(项目编号:20BJ05Y)。
-
文摘
为了实现主观题智能阅卷,本文提出了一个基于多特征融合的主观题智能阅卷算法。首先,分别设计两种算法:关键词相似度算法和语义相似度算法,计算学生答案和标准答案之间的关键词相似度和语义相似度;然后,以题目的题型和科目作为特征值,分别计算出两相似度的权值,并利用权值计算出学生答案的得分实验表明,本文提出的算法,能有效主观题智能阅卷算法的准确性,具有较好的应用前景。
-
关键词
智能阅卷
关键词相似度
语义相似度
特征融合
-
Keywords
intelligent marking
keywords similarity
semantic similarity
feature fusion
-
分类号
G63
[文化科学—教育学]
-