期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于文本分析的在线课程画像研究
1
作者 龚雪敏 罗凌 +1 位作者 郭育研 杨露 《情报探索》 2024年第6期64-71,共8页
[目的/意义]在“互联网+教育”的时代,网络课程丰富,类型众多,学习者难以快速找到适合的在线课程。传统在线课程简介无法提供适配性引导,而课程画像能描述课程整体定义,满足学习者差异化课程适配需求。[方法/过程]基于文本分析建立相关... [目的/意义]在“互联网+教育”的时代,网络课程丰富,类型众多,学习者难以快速找到适合的在线课程。传统在线课程简介无法提供适配性引导,而课程画像能描述课程整体定义,满足学习者差异化课程适配需求。[方法/过程]基于文本分析建立相关语言模型,构建在线课程画像。以学习者在线评论文本作为数据集,从课程基本信息、联合主题模型、情感判别三个维度构建课程画像的概念模型。联合主题模型先通过基于词向量的Word2Vec算法计算词语之间的相关性,构建初始相似词库;接下来结合K-means文本聚类算法从两个维度提取评论主题;最后利用ROST_CM6软件进行评论文本情感判别并解析语义网络,数据可视化后得到课程画像。[结果/结论]最终画像能清晰呈现学习者视角的课程描述,促进整体学习效率。 展开更多
关键词 课程画像 联合主题模型 在线课程 K均值聚类算法
下载PDF
一种面向观点挖掘的多粒度话题情感联合模型 被引量:4
2
作者 赵煜 蔡皖东 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2011年第3期181-188,共8页
为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有... 为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有方法存在的领域依赖问题.通过在测试语料库上进行实验,该模型在文本情感倾向性分类任务中的准确率达到82.6%,具有和监督分类系统相当的性能;挖掘话题集合呈现层次化、语义相关的特点,证明了MG-TSJ模型对观点挖掘是可行的和有效的. 展开更多
关键词 观点挖掘 话题模型 多粒度话题情感联合模型 非监督学习 蒙特卡罗模拟法
下载PDF
用户自适应的社会标签推荐模型 被引量:1
3
作者 卢露 赵靖 魏登月 《计算机工程》 CAS CSCD 2014年第7期165-169,共5页
针对传统模型不能真实反映标签的生成过程以及无法加入用户角色等问题,提出一种新的用户-内容联合标注模型。该模型中标签的生成同时受用户兴趣和资源主题的影响,反映用户真实的标注过程,能够学习到包括用户的兴趣分布概率、资源的主题... 针对传统模型不能真实反映标签的生成过程以及无法加入用户角色等问题,提出一种新的用户-内容联合标注模型。该模型中标签的生成同时受用户兴趣和资源主题的影响,反映用户真实的标注过程,能够学习到包括用户的兴趣分布概率、资源的主题分布概率、词语的主题分布概率以及标签的主题分布概率等参数。实验结果表明,与CI-LD、ACorrLDA等模型相比,该推荐模型的正确率提高了10%。 展开更多
关键词 社会标注 标签 隐含主题模型 狄利克雷分配模型 用户·内容联合标注模型 GIBBS抽样
下载PDF
面向专题检测的主题与社群联合聚类模型 被引量:3
4
作者 熊玲 周文瑄 +1 位作者 唐建 洪宇 《指挥信息系统与技术》 2017年第4期64-70,共7页
专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索。通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类... 专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索。通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类模型。该模型通过主题一致性辨识内容相关的文本,并借助文本中的命名实体社群,进一步细分内容相关的文本聚类,从而避免大规模文本中"事同人不同"的类似专题错误合并。最后,借助该模型在专题检测的层次和粒度上进一步求精,在搜狐人工标记的69项专题万余篇文档上进行专题检测测试。试验结果表明,该模型聚类纯度高于82%,具有实用价值。 展开更多
关键词 专题检测 主题与社群联合聚类模型 层次聚类
下载PDF
主题关键词信息融合的中文生成式自动摘要研究 被引量:26
5
作者 侯丽微 胡珀 曹雯琳 《自动化学报》 EI CSCD 北大核心 2019年第3期530-539,共10页
随着大数据和人工智能技术的迅猛发展,传统自动文摘研究正朝着从抽取式摘要到生成式摘要的方向演化,从中达到生成更高质量的自然流畅的文摘的目的.近年来,深度学习技术逐渐被应用于生成式摘要研究中,其中基于注意力机制的序列到序列模... 随着大数据和人工智能技术的迅猛发展,传统自动文摘研究正朝着从抽取式摘要到生成式摘要的方向演化,从中达到生成更高质量的自然流畅的文摘的目的.近年来,深度学习技术逐渐被应用于生成式摘要研究中,其中基于注意力机制的序列到序列模型已成为应用最广泛的模型之一,尤其在句子级摘要生成任务(如新闻标题生成、句子压缩等)中取得了显著的效果.然而,现有基于神经网络的生成式摘要模型绝大多数将注意力均匀分配到文本的所有内容中,而对其中蕴含的重要主题信息并没有细致区分.鉴于此,本文提出了一种新的融入主题关键词信息的多注意力序列到序列模型,通过联合注意力机制将文本中主题下重要的一些关键词语的信息与文本语义信息综合起来实现对摘要的引导生成.在NLPCC 2017的中文单文档摘要评测数据集上的实验结果验证了所提方法的有效性和先进性. 展开更多
关键词 联合注意力机制 序列到序列模型 生成式摘要 主题关键词
下载PDF
基于联合非负矩阵分解的话题变迁检测方法 被引量:1
6
作者 陈梦伟 吕钊 崔修涛 《计算机工程》 CAS CSCD 北大核心 2018年第1期35-43,共9页
在大规模时序文档集中,异同话题缺乏从时序文档集中识别跟踪分析话题随时间变迁的能力。为此,提出一种面向时序文档语料库的话题变迁检测方法。该方法从时序文档语料库中发现相似话题和异同话题。利用改进的联合非负矩阵分解算法,从多... 在大规模时序文档集中,异同话题缺乏从时序文档集中识别跟踪分析话题随时间变迁的能力。为此,提出一种面向时序文档语料库的话题变迁检测方法。该方法从时序文档语料库中发现相似话题和异同话题。利用改进的联合非负矩阵分解算法,从多个数据集中提取话题集合。为避免引入噪声话题,计算所有话题的话题熵,以获取优质话题,并通过运用词云和趋势图来分析话题变迁趋势。在20Newsgroups和LTN2011数据集上的实验结果表明,该方法可以有效地从时序文档集中发现异同话题,且提取的话题效果好、准确率高。 展开更多
关键词 联合非负矩阵分解 话题模型 时序异同话题 优质话题 话题变迁检测
下载PDF
基于主题情感联合分析的游客画像研究 被引量:1
7
作者 李琴 李少波 胡杰 《计算机工程》 CAS CSCD 北大核心 2022年第6期278-287,294,共11页
网络文本作为现代游客承载感知和表达观点的载体,已成为游客画像构建与分析的重要数据来源。现有的自然语言处理技术在游客画像的挖掘过程中主要关注游客的需求和情感,缺少技术与旅游应用的有效衔接,然而现有的文本挖掘技术中文本的主... 网络文本作为现代游客承载感知和表达观点的载体,已成为游客画像构建与分析的重要数据来源。现有的自然语言处理技术在游客画像的挖掘过程中主要关注游客的需求和情感,缺少技术与旅游应用的有效衔接,然而现有的文本挖掘技术中文本的主题和情感通常被割裂分析,缺乏相互指向性,无法有效提取用户细粒度的意见。提出一种基于变分自编码的有监督主题情感联合分析模型。将词频权重引入到先验知识中,同时通过截断高斯模型构造变参数,有效捕获离散数据中的相关性,利用情感标签辅助主题的训练和生成,以提升主题挖掘及情感预测的准确率。通过变分自编码模型计算贝叶斯主题模型的后验分布,采用主题分布下的情感分类预测实现主题情感的联合分析。实验结果表明,当主题数为10~100时,该模型的情感预测平均准确率约为85%,相比LDA、SAGE、NVDM模型,能够有效挖掘酒店用户评论的特征。 展开更多
关键词 游客画像 变分自编码器 主题情感联合分析 意见挖掘 隐含狄利克雷分布模型
下载PDF
基于联合神经网络模型的学生编程题目理解
8
作者 杨佳诺 张丽萍 闫盛 《内蒙古师范大学学报(自然科学版)》 CAS 2022年第3期312-318,共7页
现有的自然语言处理技术对学生编程题目理解不能达到很好的效果,基于深度学习优势提出一种基于联合神经网络模型的题目理解方法。通过联合模型分析编程题目语义并提取关键信息,充分理解编程题目。结果表明,联合神经网络模型在使用双向... 现有的自然语言处理技术对学生编程题目理解不能达到很好的效果,基于深度学习优势提出一种基于联合神经网络模型的题目理解方法。通过联合模型分析编程题目语义并提取关键信息,充分理解编程题目。结果表明,联合神经网络模型在使用双向学习和机器提取特征的情况下,准确率、召回率和F1值都有更高的精确度。 展开更多
关键词 编程题目理解 深度学习 联合模型
下载PDF
基于深度学习的多模态新闻数据主题发现研究
9
作者 倪亮 吴鹏 周雪晴 《数据分析与知识发现》 EI CSCD 北大核心 2024年第3期85-97,共13页
【目的】基于多模态学习方法,对新闻中文本和图片相结合内容,构建多模态主题模型,自动挖掘新闻中的潜在主题。【方法】采用结合词嵌入的主题模型,从图片和文本两方面进行主题建模,并且使用多模态联合表征学习和协同表征学习的方法进行... 【目的】基于多模态学习方法,对新闻中文本和图片相结合内容,构建多模态主题模型,自动挖掘新闻中的潜在主题。【方法】采用结合词嵌入的主题模型,从图片和文本两方面进行主题建模,并且使用多模态联合表征学习和协同表征学习的方法进行特征融合。最后,对发现的多模态新闻主题进行可视化分析,结合N15News数据集进行实证研究。【结果】实验结果表明,相对于仅使用文本特征的Label-ETM,多模态主题建模方法可以获得更好的主题的可解释性和多样性。这说明多模态主题建模方法具有一定的可行性与合理性。【局限】本文假设新闻中的图片和文字在语义和主题上是相关的,在弱相关和不相关领域多模态融合方法仍需要改善。【结论】多模态主题建模可以发现不同模态数据之间的联系,提高发现主题的多样性。 展开更多
关键词 主题模型 多模态联合表征 多模态协同表征 新闻主题发现
原文传递
在线健康社区慢性病患者评论主题情感协同挖掘研究——以甜蜜家园为例
10
作者 余佳琪 赵豆豆 刘蕤 《数据分析与知识发现》 EI CSCD 北大核心 2023年第10期95-108,共14页
【目的】为及时掌握慢性病患者在不同患病阶段的关注主题与情感类型,构建评论主题情感协同挖掘模型。【方法】在LDA主题模型的基础上融入情感信息与时间信息,提出动态主题情感混合模型dUTSU。基于糖尿病患者评论数据,从主题识别效果、... 【目的】为及时掌握慢性病患者在不同患病阶段的关注主题与情感类型,构建评论主题情感协同挖掘模型。【方法】在LDA主题模型的基础上融入情感信息与时间信息,提出动态主题情感混合模型dUTSU。基于糖尿病患者评论数据,从主题识别效果、情感分类准确率验证模型有效性,开展主题-情感词分析和主题情感演化分析实现糖尿病患者不同患病阶段评论主题与情感协同挖掘。【结果】dUTSU的困惑度、主题平均相似度、情感分类准确率均优于JST、ASUM、UTSU等同类模型;利用dUTSU分析糖尿病患者评论数据,共识别出15个主题,得到疾病确诊阶段、并发症阶段等共7个时间片内的热点主题与伴生的情感强度及类型,揭示了主题情感随时间演化的特征。【局限】采用糖尿病患者评论数据开展实验,研究场景较为单一;在建模时仅考虑了时间属性,没有考虑患者的地理位置、个人属性、社交关系等因素对主题与情感的影响。【结论】dUTSU模型能够有效实现患者不同患病阶段的评论主题与情感协同挖掘,分析结果可为在线健康社区、医疗机构及患者自身进行健康服务与干预提供依据。 展开更多
关键词 在线健康社区 主题情感混合模型 演化分析 慢性病
原文传递
网络虚拟学习社区重要用户与核心主题联合分析 被引量:4
11
作者 蔡永明 刘璐 王科唯 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第6期69-79,共11页
【目的】自动分析网络虚拟学习社区的资源,解决信息过载选择困难问题。【方法】本文提出一种基于"用户-文档-词汇"三维权重矩阵的超网络嵌入LDA模型,通过引入"用户-词汇"超网络分析,以超网络临近性信息修正LDA模型... 【目的】自动分析网络虚拟学习社区的资源,解决信息过载选择困难问题。【方法】本文提出一种基于"用户-文档-词汇"三维权重矩阵的超网络嵌入LDA模型,通过引入"用户-词汇"超网络分析,以超网络临近性信息修正LDA模型,加大超网络结构中连接紧密的词汇或用户在同一主题下的分配概率,提高主题凝聚性。【结果】与传统社会网络分析的用户活跃程度不同,超网络嵌入LDA模型根据"用户-词汇"频度矩阵、"用户-主题"分布概率,发现论坛重要用户、核心主题以及两者的互动关系,分析用户兴趣偏好特征。【局限】超网络分析技术目前并不成熟,本文加权无向超网络,未对虚拟学习社区的发帖回复等有向关系进一步深入研究。【结论】超网络嵌入LDA模型是传统作者主题模型的改进,可以有效分析社区短文本主题,了解社区用户之间的互动主题关系,对参与社区学习者和论坛管理者都有重要意义。 展开更多
关键词 虚拟学习社区 超网络嵌入LDA模型 重要用户 核心主题 联合分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部