-
题名面向专题检测的主题与社群联合聚类模型
被引量:3
- 1
-
-
作者
熊玲
周文瑄
唐建
洪宇
-
机构
苏州大学计算机科学与技术学院
-
出处
《指挥信息系统与技术》
2017年第4期64-70,共7页
-
基金
国家自然科学基金(61373097
61672368
+3 种基金
61672367
61331011)
江苏省科技计划(SBK2015022101)
教育部-中国移动科研基金(MCM20150602)资助项目
-
文摘
专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索。通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类模型。该模型通过主题一致性辨识内容相关的文本,并借助文本中的命名实体社群,进一步细分内容相关的文本聚类,从而避免大规模文本中"事同人不同"的类似专题错误合并。最后,借助该模型在专题检测的层次和粒度上进一步求精,在搜狐人工标记的69项专题万余篇文档上进行专题检测测试。试验结果表明,该模型聚类纯度高于82%,具有实用价值。
-
关键词
专题检测
主题与社群联合聚类模型
层次聚类
-
Keywords
topic detection(TD)
joint clustering model for theme and community
hierarchical clustering
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文本分析的在线课程画像研究
被引量:1
- 2
-
-
作者
龚雪敏
罗凌
郭育研
杨露
-
机构
重庆师范大学计算机与信息科学学院
-
出处
《情报探索》
2024年第6期64-71,共8页
-
基金
重庆市高等教育学会“新工科背景下程序设计类课程教学创新与课程数字化实践研究”(项目编号:cqgj2305B)
2023年度重庆师范大学基础教育研究专项项目“基于特征融合的师生互动行为模型构建及应用研究”(项目编号:23XJY03)
2022年重庆师范大学智慧教育研究院专项课题“基于学习者画像的个性化推荐系统构建”(项目编号:YZH22007)成果之一。
-
文摘
[目的/意义]在“互联网+教育”的时代,网络课程丰富,类型众多,学习者难以快速找到适合的在线课程。传统在线课程简介无法提供适配性引导,而课程画像能描述课程整体定义,满足学习者差异化课程适配需求。[方法/过程]基于文本分析建立相关语言模型,构建在线课程画像。以学习者在线评论文本作为数据集,从课程基本信息、联合主题模型、情感判别三个维度构建课程画像的概念模型。联合主题模型先通过基于词向量的Word2Vec算法计算词语之间的相关性,构建初始相似词库;接下来结合K-means文本聚类算法从两个维度提取评论主题;最后利用ROST_CM6软件进行评论文本情感判别并解析语义网络,数据可视化后得到课程画像。[结果/结论]最终画像能清晰呈现学习者视角的课程描述,促进整体学习效率。
-
关键词
课程画像
联合主题模型
在线课程
K均值聚类算法
-
Keywords
course portrait
joint topic model
online course
K-mean clustering algorithm
-
分类号
G434
[文化科学—教育技术学]
-