期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向专题检测的主题与社群联合聚类模型 被引量:3
1
作者 熊玲 周文瑄 +1 位作者 唐建 洪宇 《指挥信息系统与技术》 2017年第4期64-70,共7页
专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索。通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类... 专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索。通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类模型。该模型通过主题一致性辨识内容相关的文本,并借助文本中的命名实体社群,进一步细分内容相关的文本聚类,从而避免大规模文本中"事同人不同"的类似专题错误合并。最后,借助该模型在专题检测的层次和粒度上进一步求精,在搜狐人工标记的69项专题万余篇文档上进行专题检测测试。试验结果表明,该模型聚类纯度高于82%,具有实用价值。 展开更多
关键词 专题检测 主题与社群联合聚类模型 层次
下载PDF
基于舆情数据的群体性事件识别研究
2
作者 李艳艳 李晓群 +1 位作者 居强 黄虹 《中国新技术新产品》 2024年第9期35-37,共3页
针对国网客服中心客户重复诉求问题,面对舆情群体性事件的冲击,须了解舆情群体性事件的演化规律,确定事件类别,提炼事件特征。基于不同类别的网络群体性事件,基于海量的95598工单数据集,通过LDA主题模型与高斯混合聚类算法相结合,利用LD... 针对国网客服中心客户重复诉求问题,面对舆情群体性事件的冲击,须了解舆情群体性事件的演化规律,确定事件类别,提炼事件特征。基于不同类别的网络群体性事件,基于海量的95598工单数据集,通过LDA主题模型与高斯混合聚类算法相结合,利用LDA模型实现文本潜在语义的识别构建的网络群体性事件动态识别模型,通过大量的文本训练,当事件聚类数为6时有良好的解释性。利用LDA主题模型和高斯混合聚类算法,减少了模型的迭代次数,确定最佳主题数,提高了网络群体性事件识别结果的准确性。 展开更多
关键词 高斯 舆情数据 体性事件 主题模型 动态识别
下载PDF
基于主题分类的旅游路线推荐规划模型——以北京市为例
3
作者 韩天祎 白千雪 李霈雯 《计算机科学与应用》 2021年第8期2126-2136,共11页
随着经济的发展,旅游逐渐成为人们生活的刚需,但计划行程、旅途的疲惫常常牵绊住人们外出的步伐。因此,本文基于北京市景点的文本评论运用LDA模型、K均值聚类进行主题提取、运用TF-IDF值进行评价打分为用户推荐最适宜的景点,节省了用户... 随着经济的发展,旅游逐渐成为人们生活的刚需,但计划行程、旅途的疲惫常常牵绊住人们外出的步伐。因此,本文基于北京市景点的文本评论运用LDA模型、K均值聚类进行主题提取、运用TF-IDF值进行评价打分为用户推荐最适宜的景点,节省了用户阅读攻略、规划行程的时间。不同于以往的数据分析,文本评论可以更直接反映用户的想法、更接近实际。除此之外,对于被选出来的景点,通过转化为旅行商问题,运用运筹学的蚁群算法为用户合理规划路线,减少步行时间以及交通时间。 展开更多
关键词 文本挖掘 LDA主题模型 TF-IDF K均值 算法
下载PDF
基于文本分析的在线课程画像研究
4
作者 龚雪敏 罗凌 +1 位作者 郭育研 杨露 《情报探索》 2024年第6期64-71,共8页
[目的/意义]在“互联网+教育”的时代,网络课程丰富,类型众多,学习者难以快速找到适合的在线课程。传统在线课程简介无法提供适配性引导,而课程画像能描述课程整体定义,满足学习者差异化课程适配需求。[方法/过程]基于文本分析建立相关... [目的/意义]在“互联网+教育”的时代,网络课程丰富,类型众多,学习者难以快速找到适合的在线课程。传统在线课程简介无法提供适配性引导,而课程画像能描述课程整体定义,满足学习者差异化课程适配需求。[方法/过程]基于文本分析建立相关语言模型,构建在线课程画像。以学习者在线评论文本作为数据集,从课程基本信息、联合主题模型、情感判别三个维度构建课程画像的概念模型。联合主题模型先通过基于词向量的Word2Vec算法计算词语之间的相关性,构建初始相似词库;接下来结合K-means文本聚类算法从两个维度提取评论主题;最后利用ROST_CM6软件进行评论文本情感判别并解析语义网络,数据可视化后得到课程画像。[结果/结论]最终画像能清晰呈现学习者视角的课程描述,促进整体学习效率。 展开更多
关键词 课程画像 联合主题模型 在线课程 K均值算法
下载PDF
基于聚类分析的串标审计模型建设研究
5
作者 汪黎 《江汉石油职工大学学报》 2021年第4期93-95,共3页
审计工作可以利用机器学习技术,提升审计的质量和效率,逐步向智能化发展。使用聚类分析法建设识别串标组合的审计模型,提取工程招投标系统的承包商信息一中标结果历史数据,计算节点互信息,挖掘投标方行为相关性,在关联投标方较多的条件... 审计工作可以利用机器学习技术,提升审计的质量和效率,逐步向智能化发展。使用聚类分析法建设识别串标组合的审计模型,提取工程招投标系统的承包商信息一中标结果历史数据,计算节点互信息,挖掘投标方行为相关性,在关联投标方较多的条件下,根据投标人的中标概率,将其分为不同的投标行为异常组,可用于最大范围地发掘串标舞弊行为的线索。 展开更多
关键词 审计模型 串标
下载PDF
鸡西荣华立井采区巷道布置及回采工艺方式合理选择的研究
6
作者 梁敬东 王世远 刘永尊 《辽宁工程技术大学学报(自然科学版)》 CAS 1991年第S1期6-7,共2页
1 煤层群分组的数学模型煤层群分组应遵循以下原则经济效益好;各层组巷道易于布置;各层组间煤厚不要相差过于悬殊,以便于组织生产;具有涌水、沼气、煤突出的煤层应单独回采。
关键词 采区巷道 回采工艺 煤层 数学模型 顶底板岩性 联合布置 最佳分 夹矸厚度 影响面积
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部