期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
话题跟踪中静态和动态话题模型的核捕捉衰减 被引量:19
1
作者 洪宇 仓玉 +2 位作者 姚建民 周国栋 朱巧明 《软件学报》 EI CSCD 北大核心 2012年第5期1100-1119,共20页
话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3... 话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(National Institute of Standards and Technology)提出的最小检测错误权衡系数评测法,并结合所提出的核捕捉衰减评价方法,对各类主要话题模型进行测试.实验结果显示,结构化的动态话题模型具有最佳的跟踪性能,且突发式增量式学习和时序事件链的更新算法分别给予动态话题模型0.4%和3.3%的性能改进. 展开更多
关键词 话题跟踪 静态话题模型 动态话题模型 核捕捉衰减 突发式增量式学习 时序事件链
下载PDF
基于半监督话题模型的用户查询日志命名实体挖掘 被引量:6
2
作者 曹雷 郭嘉丰 +1 位作者 白露 程学旗 《中文信息学报》 CSCD 北大核心 2012年第5期26-32,共7页
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体... 基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。 展开更多
关键词 用户查询日志 命名实体挖掘 半监督话题模型
下载PDF
基于知识话题模型的文本蕴涵识别 被引量:4
3
作者 任函 盛雅琦 +1 位作者 冯文贺 刘茂福 《中文信息学报》 CSCD 北大核心 2015年第6期119-126,共8页
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之... 该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。 展开更多
关键词 文本蕴涵识别 话题模型 蕴涵分类 推理知识
下载PDF
基于话题模型的科技文献话题发现和趋势分析 被引量:26
4
作者 贺亮 李芳 《中文信息学报》 CSCD 北大核心 2012年第2期109-115,共7页
自动挖掘科技文献话题,总结发展趋势及最新研究动态,有助于科技工作者的研究。该文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后针对热门和冷门话题以及影响力高和... 自动挖掘科技文献话题,总结发展趋势及最新研究动态,有助于科技工作者的研究。该文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后针对热门和冷门话题以及影响力高和影响力低的话题,进行了趋势分析。该文提出的话题强度和影响力计算方法,可以针对任何文集。对ACL论文集的实验,显示了计算语言学领域过去的发展状况。和其他方法的对比实验,也验证了该文提出的话题强度和影响力的计算方法是正确和可行的。 展开更多
关键词 话题模型 趋势分析
下载PDF
一种面向涌现的比较性话题模型 被引量:2
5
作者 谭文堂 王桢文 +2 位作者 殷风景 葛斌 肖卫东 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期146-155,共10页
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进... 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。 展开更多
关键词 比较性文本挖掘 涌现 话题模型 CDCMLDA模型
下载PDF
基于反馈报道的话题模型动态修正方法 被引量:3
6
作者 郑燕 鲁燃 赵爱华 《计算机应用》 CSCD 北大核心 2012年第5期1343-1346,共4页
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同... 在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同话题的特性,提出了在修正话题模型时增大相关命名实体权重的方法,从而获得更准确的话题表示模型。实验结果表明,该方法能有效避免话题漂移现象,降低话题追踪过程中的漏报率和错报率。 展开更多
关键词 话题追踪 话题模型 动态阈值 命名 实体 反馈报道
下载PDF
基于话题模型的学术社会网络建模及应用 被引量:3
7
作者 唐杰 宫继兵 +1 位作者 刘柳 杨文军 《中国科技论文在线》 CAS 2011年第1期25-31,共7页
传统方法通常对异构数据进行独立建模,忽略了它们之间的依赖关系。针对这一问题,重点研究了如何对学术网络进行统一建模;如何利用学术网络中的网络信息提高建模效果。提出学术社会网络的统一建模模型——作者会议引用话题模型(Author-co... 传统方法通常对异构数据进行独立建模,忽略了它们之间的依赖关系。针对这一问题,重点研究了如何对学术网络进行统一建模;如何利用学术网络中的网络信息提高建模效果。提出学术社会网络的统一建模模型——作者会议引用话题模型(Author-conference Citation Topic Model,简称ACCT模型),该模型通过话题分布统一描述了学术社会网络中的多种异构数据的特点,如论文、会议、作者和引用等,并描述了这些不同数据之间的依赖关系。其建模结果可直接用于学术信息检索和学术推荐。在ArnetMiner系统的数据集上对ACCT模型进行了实验验证,实验结果表明,ACCT模型在学术推荐上优于基线模型。 展开更多
关键词 学术社会网络 话题模型 学术推荐 正则化
下载PDF
基于深度神经网络的嵌入式向量及话题模型 被引量:4
8
作者 何永强 秦勤 王俊鹏 《计算机工程与设计》 北大核心 2016年第12期3384-3388,3399,共6页
在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档... 在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档的嵌入式向量计算过程中,采用LSTM(long short-term memory)描述单词间的前向依赖关系,提出一种反馈神经网络用于描述单词间的后向依赖关系。在话题分析模型中,采用原文档和变异文档对作为正样本,采用原文档和随机文档对作为负样本进行模型的训练。实验结果表明,该方法时间和空间复杂度低,具有更好的话题分析效果。 展开更多
关键词 话题模型 递归神经网络 深度学习 反馈机制 嵌入式
下载PDF
网络场域、文化认同与劳工关注社群 基于话题模型与社群侦测的大数据分析 被引量:26
9
作者 黄荣贵 《社会》 CSSCI 北大核心 2017年第2期26-50,共25页
基于"网络与文化"和关系社会学的理论,本文指出网络场域与所沟通的文化内容之间存在互构关系。本文使用话题模型分析了关注劳工议题的用户所发布的51 288条博文,结果显示,劳工话题大致涉及以下几方面:文化与公益、工人的困境... 基于"网络与文化"和关系社会学的理论,本文指出网络场域与所沟通的文化内容之间存在互构关系。本文使用话题模型分析了关注劳工议题的用户所发布的51 288条博文,结果显示,劳工话题大致涉及以下几方面:文化与公益、工人的困境与问题、维权行动与工人组织、制度与劳工权。对用户间互动模式的社群侦测揭示了5个主要社群,结合社群关注的议题,作者将其称为:工人家园社群、工人维权社群、工人文化社群、劳工制度关注社群、工人权益关注社群。本文进一步指出劳工研究领域的两个新趋势:(1)随着新生代工人群体的壮大,工人文化与城市融入等议题受到较多关注;(2)微博促进研究者与劳工组织的互动,在一定程度上有助于后者从制度层面反思工人的境况。最后,本文讨论了大数据分析在网络文化与社会心态研究中的应用。 展开更多
关键词 劳工NGO 大数据 话题模型 互动社群 社会网络分析
下载PDF
中美“人工智能+教育”研究的话题比较分析——兼论基于结构话题模型的文献主题数据挖掘方法探析 被引量:5
10
作者 李海峰 《情报杂志》 CSSCI 北大核心 2020年第12期179-187,共9页
[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及... [目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及话题时序变化等进行了模型估计和比较分析。[结果/结论]研究结果发现,中美“人工智能+教育”研究涵盖了15个主要话题。美国研究者倾向于机器学习、教育机器人以及智能知识管理系统等11个智能技术性话题,中国研究者关注教育游戏、教学代理和智能医疗等4个教学性话题。他们在同一话题的预期比例和话题关键词内容等方面存在着显著差异,大部分研究话题的时序发展强度各异。基于结构话题模型的文献分析,不仅揭示了两国在话题数量、内容偏好以及强度时序发展等方面的异同,而且为我国人工智能教育的基础性研究、研究体系创建、建立健全研发机制等建议的提出提供了依据。 展开更多
关键词 人工智能+教育 结构话题模型 人工智能教育应用 教育人工智能比较 文本数据挖掘
下载PDF
中美数字孪生研究主题的比较分析——兼论基于结构话题模型的文献主题数据挖掘方法 被引量:3
11
作者 李海峰 《情报杂志》 CSSCI 北大核心 2022年第1期156-163,共8页
[研究目的]数字孪生是实现工业4.0的关键技术,揭示中美两国数字孪生研究主题的异同对我国数字孪生的研究与发展具有重要意义。[研究方法]以WOS核心合集中的期刊文献作为分析样本,利用结构话题模型分析方法获得了15个主要的研究主题,然... [研究目的]数字孪生是实现工业4.0的关键技术,揭示中美两国数字孪生研究主题的异同对我国数字孪生的研究与发展具有重要意义。[研究方法]以WOS核心合集中的期刊文献作为分析样本,利用结构话题模型分析方法获得了15个主要的研究主题,然后进行了主题数量、主题内容和主题时序演化等维度的比较分析。[研究结论]中美两国数字孪生研究主题存在较小的共同研究旨趣,研究内容总体差异较大,主题数量差异较小,研究范围差异较大。中美研究者对同一话题的关注内容具有各自鲜明特征。大部分研究主题的强度随着时间发展呈现出了显著变化。根据中美数字孪生研究的主题差异,未来我国需要推动数字孪生关键技术的研发,建立健全数字孪生的研发机制,加速推进数字孪生技术应用领域。 展开更多
关键词 数字孪生 中美比较 工业4.0 数据挖掘 结构话题模型
下载PDF
基于时序话题模型的新事件检测 被引量:3
12
作者 仓玉 洪宇 +1 位作者 姚建民 朱巧明 《智能计算机与应用》 2011年第1X期74-78,共5页
新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模... 新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模型(TemporalTopicModel,简称TTM)。TYM将话题和报道切分为若干对应不同时间表达式的事件。其中,时间表达式描述事件发生的特定时间。TTM基于时间表达式在话题中出现的频率和增长率,估量对应时间表达式的事件作为种子事件或相关新颖事件的概率。此外,时间表达式的频率与增长率也用于衡量事件在相关性匹配中权重。在此基础上,NED依赖时间特性快速遏制不同时间发生的事件匹配,并借助种子事件和新颖事件调整相关性判定的权重分配。 展开更多
关键词 新事件检测 时间表达式 时序话题模型
下载PDF
基于节点重要性的LDA社会网络话题模型研究
13
作者 叶娟 陈启买 《计算机应用研究》 CSCD 北大核心 2016年第3期693-695,共3页
在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(late... 在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(latent Dirichlet allocation)社会网络话题模型。在该模型中,提出了流行性组件的概念,并提出了一种包含了流行性组件的扩展话题模型。通过实验结果表明,提出的包含流行性组件的扩展话题模型具有更好的预测能力,其预测结果的准确性明显优于现有的相关研究。 展开更多
关键词 LDA 话题模型 社会网络 流行性组件
下载PDF
基于词语关联和话题模型的反腐败文献分析
14
作者 李莉 吴江 《江西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2018年第4期34-41,共8页
本项研究以定量方法对2016年中国的反腐败研究情况进行了系统梳理。基于关键词-摘要指数和加权中心度指数的典型词语提炼和语义网络图显示,"政治生活""廉政文化""从严治党"等词语在反腐败研究中占据的地... 本项研究以定量方法对2016年中国的反腐败研究情况进行了系统梳理。基于关键词-摘要指数和加权中心度指数的典型词语提炼和语义网络图显示,"政治生活""廉政文化""从严治党"等词语在反腐败研究中占据的地位,反映了政策实践层面与学术研究之间紧密的对应关系。基于LDA话题模型的分析进一步展现了当下中国反腐败研究的热点议题和创新路径,体现了相关领域研究的丰富性与深入性。 展开更多
关键词 反腐败 廉政 文本分析 话题模型
下载PDF
基于组话题模型的政务微博话题预测
15
作者 李文 黄克文 《荆楚理工学院学报》 2021年第6期89-93,共5页
为了提高政府部门应对网络舆情的处理效率,采用一种产生式的组话题模型对微博政务话题进行挖掘与分析。组话题模型对每个话题产生一个多项式分布,对相似性质事件进行合并生成相关矩阵。由于每个实体可以属于多个话题,并且网络规模大,用G... 为了提高政府部门应对网络舆情的处理效率,采用一种产生式的组话题模型对微博政务话题进行挖掘与分析。组话题模型对每个话题产生一个多项式分布,对相似性质事件进行合并生成相关矩阵。由于每个实体可以属于多个话题,并且网络规模大,用Gibbs采样对提出的模型进行了验证,并与其他话题预测模型进行对比分析。实验结果表明:本文提出的组话题模型不仅执行时间短、效率高,而且具有很高的准确率。 展开更多
关键词 微博 话题模型 社会网络
下载PDF
网民对无人驾驶态度的调查——基于微博数据的话题模型与情感分析
16
作者 徐琳 穆春宇 《杭州电子科技大学学报(社会科学版)》 2021年第6期72-76,共5页
基于“无人车致死不负刑责”这一事件,对相关微博数据采用话题模型与情感分析实证考察了网民的态度。研究发现,网民对该事件的讨论集中在人机对比、法律与判责、行人违规、车辆驾驶、无人驾驶技术五个方面。在对事件的评价中出现了态度... 基于“无人车致死不负刑责”这一事件,对相关微博数据采用话题模型与情感分析实证考察了网民的态度。研究发现,网民对该事件的讨论集中在人机对比、法律与判责、行人违规、车辆驾驶、无人驾驶技术五个方面。在对事件的评价中出现了态度极化,网民的正面情感较为分散,而负面情感容易发生聚集。在五个话题中,除了人机对比的情感比较中立,其他四个话题均聚集了较多的负面情感,这反映了网民对行人违规的反感,对无人驾驶技术不成熟的担忧,和对无人车所带来的法律困境的关注。 展开更多
关键词 无人驾驶 话题模型 情感分析 态度
下载PDF
基于话题模型的专家发现方法 被引量:6
17
作者 刘健 李绮 +1 位作者 刘宝宏 张云 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第2期127-131,共5页
专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词... 专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。 展开更多
关键词 实体检索 专家发现 基于话题模型 排序截断
下载PDF
基于层次话题模型的煤矿安全事故致因要素研究 被引量:8
18
作者 林永明 《安全与环境学报》 CAS CSCD 北大核心 2018年第2期619-623,共5页
为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因... 为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因隐含的规律及各类事故之间的关联与共性,并进一步研究发现不同致因要素随时间的演化规律及致灾倾向,为煤矿安全管理找出重点,指导煤矿安全生产管理实践。 展开更多
关键词 安全管理工程 煤矿安全事故 致因要素 层次话题模型
下载PDF
基于用户兴趣及迁移的话题模型分析
19
作者 蓝友枢 张章学 《软件导刊》 2018年第6期49-52,共4页
社交网络中各种推广应用都依赖于用户兴趣的获取。用户兴趣获取方法多种多样,但大多集中于用户关注信息、用户浏览网页的分析,用户发表的语义信息与兴趣的潜在联系很少被深度发掘。提出基于标签的话题分割模型,将所有文本转化为带标签... 社交网络中各种推广应用都依赖于用户兴趣的获取。用户兴趣获取方法多种多样,但大多集中于用户关注信息、用户浏览网页的分析,用户发表的语义信息与兴趣的潜在联系很少被深度发掘。提出基于标签的话题分割模型,将所有文本转化为带标签的文本以便聚类。通过分析话题变化状态推测用户兴趣迁移状况,注重社交网络用户兴趣及迁移状况与话题动态变化过程的潜在关联,利用Word2vec对话题进行相似度分析,充分利用词的上下文信息表征丰富的语义信息,通过分析社交网络平台数据,得到用户兴趣分布、兴趣动态变化过程以及话题迁移状况。将结果进行拟合后发现,用户的兴趣及变化状况很大程度上取决于用户发表的话题。 展开更多
关键词 社交网络 用户兴趣 话题模型
下载PDF
基于话题决策模型的英文文本切题度计算方法研究
20
作者 胡婷 《自动化技术与应用》 2024年第4期60-62,98,共4页
为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,... 为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,所提出的话题决策模型在精确率、召回率等方面具有一定的应用优势,并在ASAP数据集上表现出较为理想的切题度判断效果。 展开更多
关键词 英文文本 切题度 话题决策模型
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部