期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于主题异构图嵌入的Token粒度实体解析方法
1
作者 初慧琳 申德荣 +2 位作者 窦文周 聂铁铮 寇月 《小型微型计算机系统》 CSCD 北大核心 2023年第7期1398-1404,共7页
实体解析是数据集成、数据挖掘等技术中不可或缺的步骤,其具体任务是查找引用自同一真实世界的实体的数据记录.现有的方法多数是通过计算实体记录的属性相似度来评估是否为同一实体,由于该方法需要预先对齐记录属性,无法适应属性中toke... 实体解析是数据集成、数据挖掘等技术中不可或缺的步骤,其具体任务是查找引用自同一真实世界的实体的数据记录.现有的方法多数是通过计算实体记录的属性相似度来评估是否为同一实体,由于该方法需要预先对齐记录属性,无法适应属性中token误放的情形,也不能有效利用跨属性中tokens的语义和结构信息,影响实体识别准确性.本文提出了一种采用主题异构图嵌入的token粒度的实体解析方法(THGE-ER).在token、属性和记录基础上,利用LDA模型为实体记录添加一个主题层级,并构建了一个由token、属性、记录和主题4类节点组成的主题异构图;采用区分节点类型的异构图嵌入表示方法,并将节点间的语义和结构信息嵌入到token层级的嵌入向量中;进一步结合多层次注意力机制,完成最终的实体解析决策.经过大量的实验证明,本文提出的方法表现出了良好的性能. 展开更多
关键词 实体解析 lda文档主题模型 异构图 多层注意力机制
下载PDF
一种基于政策文本计算的政策内容分析方法实证研究——以互联网租赁自行车为例 被引量:26
2
作者 张涛 蔡庆平 马海群 《信息资源管理学报》 CSSCI 2019年第1期66-76,共11页
政策文本计算是信息科学、政策科学与计算科学交叉融合的产物,通过对政策文件及政策评论内容进行计算分析,使政策制定研究过程更加科学有效。文章首先利用关键词抽取法对政策文件进行框架提取;其次利用主题分析法对政策评论数据进行聚... 政策文本计算是信息科学、政策科学与计算科学交叉融合的产物,通过对政策文件及政策评论内容进行计算分析,使政策制定研究过程更加科学有效。文章首先利用关键词抽取法对政策文件进行框架提取;其次利用主题分析法对政策评论数据进行聚类分析;再次利用共现分析法对政策文件及政策评论共现强度数据计算;最后依据计算所得数据对政策内容进行综合分析,进而形成一种新的政策内容分析方法并以互联网租赁自行车为例证实了该方法的有效性,此方法的提出也为未来政策分析研究提供了新思路。 展开更多
关键词 政策文本计算 政策内容分析 互联网租赁自行车 文档主题生成模型(lda) 内容分析方法
下载PDF
基于社交媒体的森林火灾舆情信息脉动分析 被引量:2
3
作者 吕蓓茹 彭玲 +2 位作者 陈嘉辉 陈若男 葛星彤 《地理信息世界》 2021年第3期61-66,共6页
2019年和2020年四川省发生了两起大型森林火灾,受到政府高度重视,也在网络上引发了广泛讨论。为了呈现森林火灾后微博文本中蕴含的舆情信息,有效地了解舆情,掌握规律,对四川凉山前后两起重特大森林火灾发生后的舆情进行了数据挖掘和对... 2019年和2020年四川省发生了两起大型森林火灾,受到政府高度重视,也在网络上引发了广泛讨论。为了呈现森林火灾后微博文本中蕴含的舆情信息,有效地了解舆情,掌握规律,对四川凉山前后两起重特大森林火灾发生后的舆情进行了数据挖掘和对比分析。使用核密度、地理探测器方法对两起森林火灾舆情时空扩散和空间分异进行了研究,使用LDA主题提取模型、朴素贝叶斯、词云方法对两起火灾舆情进行主题提取、情感分析和可视化表达。研究结果表明:时空扩散和主题分布上,四川省两起重大森林火灾舆情具有较强相似性;空间分异上,两起火灾舆情空间分异与区域经济发展水平显著相关;情感演变上,重复发生同类灾害事故对于网民的情绪冲击明显。 展开更多
关键词 森林火灾 社交媒体 舆情分析 地理探测器 lda文档主题生成模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部