期刊文献+
共找到217篇文章
< 1 2 11 >
每页显示 20 50 100
基于数理统计和文本挖掘的埋地钢制燃气管道失效分析 被引量:1
1
作者 岑康 魏源 +3 位作者 黎登辉 张瀚月 罗聆溪 沈娇 《安全与环境学报》 CAS CSCD 北大核心 2024年第4期1266-1274,共9页
近年来燃气管道事故频发,严重威胁周边人民群众生命财产安全。为准确认识埋地钢制燃气管道失效特征及致因,针对性开展风险管控,以某管道燃气公司2018—2021年共计1338条埋地钢制燃气管道失效记录为分析蓝本,采用数理统计方法分析失效总... 近年来燃气管道事故频发,严重威胁周边人民群众生命财产安全。为准确认识埋地钢制燃气管道失效特征及致因,针对性开展风险管控,以某管道燃气公司2018—2021年共计1338条埋地钢制燃气管道失效记录为分析蓝本,采用数理统计方法分析失效总体趋势及管道敷设位置、压力等级、外防腐层类型、失效原因、管龄对应的失效特征;采用文本挖掘技术共计提取26项埋地钢制燃气管道潜在失效致因,通过词云可视化方式分析高频失效致因;构建失效致因共现网络探索不同致因之间的耦合关系,并根据特征向量中心性辨识主要失效致因。结果表明:中压庭院管道是风险管理的重点;腐蚀失效频次与管龄总体呈正相关,且从第4 a开始失效频次快速增长,在第19 a左右达到峰值;土壤腐蚀、防腐层破损、杂散电流、未安装阴极保护系统、管道服役年限较长、管体缺陷、防腐层老化和敷设环境发生变化是埋地钢制燃气管道失效主要致因,是风险管控的关键点。 展开更多
关键词 安全工程 埋地钢制燃气管道 失效特征 失效致因 文本挖掘 共现分析 数理统计
下载PDF
建筑工程施工安全生产事故致因的共现特征分析
2
作者 晋良海 王抒情 +2 位作者 邵波 王昕煜 闵露 《安全与环境工程》 CAS CSCD 北大核心 2024年第6期26-34,共9页
解析事故致因之间的关系图谱,厘清事故致因的共现特征,对于揭示建筑工程施工安全生产事故的发生、发展规律至关重要。收集近10年来300起典型建筑工程施工安全生产事故调查报告文本数据,通过对文本数据进行分词处理和特征项降噪,基于事... 解析事故致因之间的关系图谱,厘清事故致因的共现特征,对于揭示建筑工程施工安全生产事故的发生、发展规律至关重要。收集近10年来300起典型建筑工程施工安全生产事故调查报告文本数据,通过对文本数据进行分词处理和特征项降噪,基于事故致因理论提取建筑工程施工安全生产事故致因要素;通过改进词频-逆文件频率(TF-IDF)算法,挖掘高权重事故致因关键词,构建可视化共现网络图谱,探究事故致因的共现规律;运用层次聚类分析方法,探究事故致因特征相关性,确定事故致因类团。结果表明:建筑工程施工安全生产事故致因具有显著的共现规律,部分直接致因与间接致因之间呈现出耦合共现特征,部分事故致因呈现显著的类团结构,可将共现致因联系起来作为“集群”风险进行重点防控。 展开更多
关键词 建筑工程施工 安全生产事故 事故致因 共现特征 文本挖掘
下载PDF
利用网络游记分析成都市旅游景区空间结构
3
作者 张红 李玥 +1 位作者 邓雯 王艺 《地理空间信息》 2024年第7期31-35,共5页
从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城... 从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城山—都江堰、金牛—武侯主城区为高热度中心的“双核摄动”格局;成都市旅游景区文本共现网络具有较高的集聚系数和较短的平均路径,等级圈层结构和马太效应较显著,热门景区对邻近热门景区的空间溢出效应显著,但对邻近低等级景区的带动效果有限;成都市旅游景区空间结构由条带状和团簇式向轴辐式和网络化方向转变,在区域旅游一体化发展中的作用日益显著。 展开更多
关键词 旅游景区 网络游记 空间结构 文本共现 复杂网络分析
下载PDF
信息茧房视域下在线问答社区用户健康信息需求对比研究
4
作者 邹筱 刘垣春 周欢 《衡阳师范学院学报》 2024年第3期59-67,共9页
信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等... 信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等自然语言处理技术,利用不同类型在线问答社区中真实的用户提问数据,分析用户健康信息需求热点,并对其需求特征的异同进行对比分析。实验结果表明:一方面,综合型与垂直型在线问答社区对于疾病的基础病理知识、药物信息以及饮食方面的关注度较高,且均具有适老化需求。另一方面,综合型在线问答社区对于疾病的预防关注度较高,而垂直型在线问答社区更加关注于疾病治疗,综合型在线问答社区用户存在情感支持需求,但总体上国内在线问答社区的情感支持需求均不高。 展开更多
关键词 信息茧房 在线健康问答社区 健康信息需求 主题提取 文本共现网络
下载PDF
基于词-主题-文本异质网络的短文本分类方法
5
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 短文本分类
下载PDF
高斯混合模型与文本图卷积网络结合的虚假评论识别算法
6
作者 王星 刘贵娟 陈志豪 《计算机应用》 CSCD 北大核心 2024年第2期360-368,共9页
针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评... 针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。 展开更多
关键词 高斯混合模型 虚假评论识别 文本图卷积神经网络 邻接矩阵 词汇共现网络
下载PDF
中国高质量发展政策评价研究——基于政策文本的量化分析
7
作者 张少峰 陈昕 魏玖长 《华东经济管理》 CSSCI 北大核心 2024年第9期61-72,共12页
高质量发展是中国式现代化的本质要求,而政策文本是顶层设计逐级落实并指导实践的关键载体。文章采用文本共现网络和PMC指数模型,基于“政策主体—政策议题—政策效果”的理论分析框架,对中国高质量发展政策文本进行全景式分析。研究发... 高质量发展是中国式现代化的本质要求,而政策文本是顶层设计逐级落实并指导实践的关键载体。文章采用文本共现网络和PMC指数模型,基于“政策主体—政策议题—政策效果”的理论分析框架,对中国高质量发展政策文本进行全景式分析。研究发现:国家层面文件具有战略引领作用,省级文件则以专项政策为主,政策体系具有战略部署—专项执行的层级特征;高质量发展政策核心议题呈现放射性网络,国家政策与省级政策各有特点,且有四个子议题对高质量发展政策目标形成支撑;高质量发展政策平均为“可接受”水平,国家政策效果明显优于省级政策。在中国高质量发展“一盘棋”的背景下,要进一步强化政策议题的协调性,为高质量发展创造良好的制度条件。 展开更多
关键词 中国式现代化 高质量发展 政策文本 PMC指数模型 文本共现网络
下载PDF
融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略
8
作者 刘东旭 段利国 +1 位作者 崔娟娟 常轩伟 《计算机科学》 CSCD 北大核心 2024年第12期250-258,共9页
短文本语义匹配任务的目的是判断两个短文本句子的语义是否一致。然而,现有的许多方法往往存在短文本语义信息不足、无法有效识别同义词等问题。针对这些不足,提出一种融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略。首先,... 短文本语义匹配任务的目的是判断两个短文本句子的语义是否一致。然而,现有的许多方法往往存在短文本语义信息不足、无法有效识别同义词等问题。针对这些不足,提出一种融合义原相似度矩阵与字词向量双通道的短文本语义匹配策略。首先,利用预训练模型Bert对输入的句子对进行编码;然后,对于句子中词级别的语义信息,利用FastText模型训练并获取文本的词向量,并加入BiLSTM模型进一步提取上下文语义信息。为了有效利用义原信息,在上述的双通道中分别加入多头注意力和用于对分离向量进行交互计算的协同注意力,并在注意力中分别融入对应的义原相似度矩阵,最后综合上述两部分向量推断出语义的一致性。在金融领域数据集BQ和开放域数据集LCQMC上的实验证明了所提算法的有效性。 展开更多
关键词 自然语言处理 短文本 义原 协同注意力 字词向量
下载PDF
数据驱动的城镇燃气管道风险因素识别及关联分析
9
作者 张晓雷 郑春宏 +4 位作者 刘露 葛彦泽 徐小峰 黄玉萍 马俊 《中国石油大学学报(社会科学版)》 2024年第3期10-17,共8页
城镇燃气管网作为重要的满足群众生活需求的基础设施,其安全性对于保障广大人民群众的财产与生命安全具有重要意义。以810件国内城镇燃气管道泄漏、爆炸事故案例为样本,采用文本挖掘技术对样本案例进行分词处理,根据TF-IDF算法统计词频... 城镇燃气管网作为重要的满足群众生活需求的基础设施,其安全性对于保障广大人民群众的财产与生命安全具有重要意义。以810件国内城镇燃气管道泄漏、爆炸事故案例为样本,采用文本挖掘技术对样本案例进行分词处理,根据TF-IDF算法统计词频并确定导致燃气管道泄漏的关键风险因素;通过共现分析实现风险因素间关系的可视化,计算中心性指标,确定风险因素集合;基于Apriori算法揭示了燃气管道安全风险因素之间的关联规则。研究发现:在城镇燃气管道关键风险因素识别过程中,文本挖掘方法与传统方法分析结果基本一致;在次要因素分析中,管道设备老化、安全生产过程中的员工培训、安全保护措施、审批程序不完善等因素,相较以往研究都呈现出了与燃气事故更强的关联程度,这为管道安全管理提供了新的视角。 展开更多
关键词 城镇燃气管道 风险因素 文本挖掘 共现分析 关联规则挖掘
下载PDF
洪涝灾害研究主题的时空差异性:中英文文献比较研究
10
作者 贺蔚杰 田健 +2 位作者 宋苑震 张家豪 曾坚 《安全与环境学报》 CAS CSCD 北大核心 2024年第11期4391-4400,共10页
在全球气候变化背景下,洪涝灾害已成为威胁人群生命财产安全的世界性问题。目前,关于洪涝灾害的研究已较为丰富,需进行系统性梳理和总结。为探究国内外洪涝灾害的研究现状与趋势,采用文献计量的分析方法,对2003—2022年中国知网(China N... 在全球气候变化背景下,洪涝灾害已成为威胁人群生命财产安全的世界性问题。目前,关于洪涝灾害的研究已较为丰富,需进行系统性梳理和总结。为探究国内外洪涝灾害的研究现状与趋势,采用文献计量的分析方法,对2003—2022年中国知网(China National Knowledge Infrastructure,CNKI)和WoS(Web of Science)数据库中主题为洪涝灾害的中英文文献进行文本分析。从关键词共现模式、研究主题的时间聚类及空间分布三个角度,探索洪涝灾害相关研究的主题演进模式和地理分布特征,并总结未来发展方向。结果表明:(1)在研究关键词共现模式方面,中文研究更加关心洪涝灾害区域影响及管理策略等灾害的后续影响方面,英文研究则更倾向于探究洪涝灾害的成因,从气候变化与孕灾环境角度分析洪涝灾害。中英文研究均强调新兴技术在洪涝灾害研究中的应用。(2)在研究主题时间聚类方面,中文研究在21世纪初期追随英文研究的关注热点,并在2015年前后逐渐形成具有中国本土化特色的研究框架,强调使用多源数据和多种算法模型进行定量化分析,主要着眼于城市化发展对洪涝灾害的多时段、多尺度干预效应。(3)在研究主题空间分布方面,沿海经济发达地区受到研究者更多的关注,表明洪涝灾害研究的主题与数量受到研究区域的地理位置、气候条件和社会经济发展水平的影响。 展开更多
关键词 公共安全 洪涝灾害 文本分析 共现网络 潜在狄利克雷分配(LDA)模型 地理解析 对比分析
下载PDF
基于文本挖掘的开放政府数据与数字经济政策协同研究 被引量:1
11
作者 陈美 赵子莜 《情报杂志》 CSSCI 北大核心 2024年第4期184-191,88,共9页
[研究目的]政府数据开放已经成为政府转型过程中的重要目标之一,研究数字经济政策和开放政府数据政策之间的协同性,有助于政府的数字化转型及政策更有效的实施。[研究方法]使用LDA模型对采集到的省级和市级政策文本进行预处理,将政策文... [研究目的]政府数据开放已经成为政府转型过程中的重要目标之一,研究数字经济政策和开放政府数据政策之间的协同性,有助于政府的数字化转型及政策更有效的实施。[研究方法]使用LDA模型对采集到的省级和市级政策文本进行预处理,将政策文本高频词分成政策执行主体、政策目标以及政策工具三个维度,使用共现网络分析和关联规则两种方法分别对高频词进行挖掘,探讨两种政策之间的协同性,并对两种方法得出的结论进行对比,探讨两种方法之间的差异性。[研究结论]市级开放政府数据与数字经济政策在政策执行主体、政策目标和政策工具三个维度上具备一定协同性,但两种政策也在某方面存在较大差异,省级政策文件则体现出了纵向和横向的协同性;关联规则和共现网络分析得出的结论具有较高一致性,但两种方法在信息的挖掘上各有优劣。 展开更多
关键词 开放政府数据 数字经济政策 政策协同 LDA 关联规则 共现网络分析 文本挖掘
下载PDF
我国新型研发机构政策注意力与政策工具探析——基于长三角与珠三角地区的政策量化研究 被引量:1
12
作者 蔡艳青 常晓然 《科技与经济》 2024年第1期36-40,共5页
新型研发机构逐步上升为中国创新驱动发展的主力军。利用文本挖掘、共词语义网络分析等方法,全面剖析长三角和珠三角地区新型研发机构政策的注意力焦点和政策工具,为支持高水平新型研发机构建设与发展提供参考。研究发现:政策类型以“... 新型研发机构逐步上升为中国创新驱动发展的主力军。利用文本挖掘、共词语义网络分析等方法,全面剖析长三角和珠三角地区新型研发机构政策的注意力焦点和政策工具,为支持高水平新型研发机构建设与发展提供参考。研究发现:政策类型以“通知”和“意见”为主,体现了政府的弹性管理机制,但执行力度较弱;政策注意力与新型研发机构的使命、功能内涵密切相关,鼓励政产学研高度融合,突出企业主体地位,强调体制机制创新;政策工具运用存在结构性失衡,注重供给型政策工具,环境型和需求型政策工具使用不足。 展开更多
关键词 新型研发机构 政策注意力 政策工具 文本挖掘 共词语义网络分析
下载PDF
多词共现分析方法在暴雨-地质灾害应急任务研究中的应用
13
作者 杨炼卿 许铭 +3 位作者 马成龙 戴彩岩 赵红 龙昭岳 《灾害学》 CSCD 北大核心 2024年第2期208-211,234,共5页
为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例... 为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例文本中的频繁项集作为共现词集,分析解释共现词集与应急任务之间的关系。最后,运用Gephi软件将共现词语网络可视化,进一步分析应急任务中要素之间的相关关系。以暴雨引发的地质灾害事故为例,对该方法进行了实验,结果表明该方法能有效的将暴雨-地质灾害事故案例文本中的应急任务提取出来,并通过网络可视化分析发现,在救援过程中,应急任务之间是联动配合的一个体系,协调好各个应急任务能缩短应急响应的时间,为制定或完善救援行动方案提供参考。 展开更多
关键词 暴雨-地质灾害 应急任务 文本挖掘 多词共现 关联规则挖掘 K-MEANS聚类算法
下载PDF
融合注意力机制和评论文本特征的推荐算法
14
作者 潘莹 李浩 +1 位作者 王世辉 许杏 《计算机工程与设计》 北大核心 2024年第9期2764-2770,共7页
为区分基于评论文本推荐算法中不同评论文本数据对不同用户或物品的差异,提出一种融合注意力机制和评论文本特征的推荐算法(RAAM)。在卷积神经网络中加入三级注意力机制,分别从单词级别、语句级别和评论级别为不同用户或物品区分评论数... 为区分基于评论文本推荐算法中不同评论文本数据对不同用户或物品的差异,提出一种融合注意力机制和评论文本特征的推荐算法(RAAM)。在卷积神经网络中加入三级注意力机制,分别从单词级别、语句级别和评论级别为不同用户或物品区分评论数据的重要性,引入共同注意力网络模拟用户与物品之间的交互,获取更多用户和物品的交互信息,提高推荐效果。在Amazon的5个数据集上的对比实验结果验证了算法的有效性。 展开更多
关键词 推荐算法 注意力机制 共同注意力网络 评论文本 评分预测 文本特征 卷积神经网络
下载PDF
基于文本挖掘的高校网络舆情研究热点及趋势分析
15
作者 黄钦 杨芳 +1 位作者 朱礼龙 张秀娟 《宜春学院学报》 2024年第1期24-31,共8页
为系统分析国内高校网络舆情研究热点及研究趋势,采用共现分析、LDA主题模型等文本挖掘方法对国内高校网络舆情研究的学术论文进行分析。从宏观和微观两个层面展开分析,宏观层面以关键词共现网络为基础,利用社区挖掘方法抽取关键词语义... 为系统分析国内高校网络舆情研究热点及研究趋势,采用共现分析、LDA主题模型等文本挖掘方法对国内高校网络舆情研究的学术论文进行分析。从宏观和微观两个层面展开分析,宏观层面以关键词共现网络为基础,利用社区挖掘方法抽取关键词语义社区,分析高校网络舆情主要研究内容;微观层面以学术论文摘要语料库为基础,利用LDA主题模型抽取潜在研究主题,度量主题强度及其演化趋势,发现当前研究热点。研究结果发现当前国内高校网络舆情有6大热点研究主题,其中高校网络舆情引导、监测和演化分析的研究热度将持续增强。最后对高校网络舆情研究进行展望,提出未来研究方向和研究问题。 展开更多
关键词 高校网络舆情 文本挖掘 共现分析 主题模型 研究热点
下载PDF
以学科竞赛促进商科大学生能力培养--四届浙江省大学生经济管理案例竞赛一等奖作品分析
16
作者 常晓然 廖红 王洪涛 《江苏商论》 2024年第5期117-122,共6页
在深入实施创新驱动发展的战略背景下,商科大学生作为“双创”的生力军,学科竞赛的开展对于提升他们创新创业能力、增强创新活力具有重要意义。本文以浙江省大学生经济管理案例竞赛2018—2021年间120篇一等奖作品为研究对象,通过文本和... 在深入实施创新驱动发展的战略背景下,商科大学生作为“双创”的生力军,学科竞赛的开展对于提升他们创新创业能力、增强创新活力具有重要意义。本文以浙江省大学生经济管理案例竞赛2018—2021年间120篇一等奖作品为研究对象,通过文本和共词分析,探讨获奖高校、案例企业、研究主体和研究理论的分布情况,总结竞赛现状及发展趋势,并从院校支持、案例选题、学生培养等角度提出建议与启示。 展开更多
关键词 商科大学生 能力培养 案例竞赛 一等奖作品 文本分析 共词分析
下载PDF
融合多特征及协同注意力的医学命名实体识别
17
作者 刘歆宁 《计算机工程与应用》 CSCD 北大核心 2024年第6期188-198,共11页
针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型... 针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型得到原始医学文本的向量表示,再利用双向门控循环神经网络(BiGRU)获取字粒度的特征向量。结合医疗领域命名实体鲜明的部首特征,利用迭代膨胀卷积神经网络(IDCNN)提取部首级别的特征向量。使用协同注意力网络(co-attention network)整合特征向量,生成<文字-部首>对的双相关特征,再利用条件随机场(CRF)输出实体识别结果。实验结果表明,在CCKS数据集上,相较于其他的实体识别模型能取得更高的准确率、召回率和F1值,同时虽然增加了识别模型的复杂程度,但性能并没有明显的降低。 展开更多
关键词 中文医学文本 命名实体识别 多特征融合 协同注意力机制 BERT模型
下载PDF
文献数据库中书目信息共现挖掘系统的开发 被引量:545
18
作者 崔雷 刘伟 +4 位作者 闫雷 张晗 侯跃芳 黄莹娜 张浩 《现代图书情报技术》 CSSCI 北大核心 2008年第8期70-75,共6页
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共... 针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。 展开更多
关键词 文本挖掘 共现分析 书目信息 科学计量学
下载PDF
基于文本挖掘技术的油田集输管道失效诱因关联分析
19
作者 陈喜鸿 刘颖 +2 位作者 孙玮 王雷 梁昌晶 《石油工程建设》 2024年第2期33-38,共6页
为有效预防油田集输管道失效事故的发生,以某油田2018—2021年管道失效记录为基础,采用数理统计方法分析各类管道的失效特征,利用词云图和Apriori算法分析事故类型、常见诱因及诱因间的关联规则,再通过共现矩阵构建共现网络,明确集输管... 为有效预防油田集输管道失效事故的发生,以某油田2018—2021年管道失效记录为基础,采用数理统计方法分析各类管道的失效特征,利用词云图和Apriori算法分析事故类型、常见诱因及诱因间的关联规则,再通过共现矩阵构建共现网络,明确集输管道失效事故发生的关键诱因项和不同诱因发生的加速项集合,最后采用多项文本挖掘技术确定事故发展的耦合关系。结果表明,位于高后果III级区域的原油低压管段和天然气中压管段是风险管控的重点;管道泄漏、油气聚集、油池火、闪火是常见事故类型,施工破坏、土壤腐蚀、防腐层破损、管道占压、含有腐蚀性物质等是常见的事故诱因;管道泄漏和油气聚集具有强关联性,在管道泄漏条件下,发生油气聚集的概率为85.21%,两者同时出现的概率为18.21%;施工破坏、土壤腐蚀、外加电流保护失效、管道占压的共同出现是导致管道失效的主要因素;诱发土壤腐蚀和内腐蚀加速的主控原因与多项诱因相关,在后续风险管控中应尽量避免多项诱因的同时出现。 展开更多
关键词 集输管道 诱因 文本挖掘 词云图 APRIORI算法 共现网络
下载PDF
基于文本挖掘的专利技术主题分析研究综述 被引量:42
20
作者 胡阿沛 张静 +1 位作者 雷孝平 张晓宇 《情报杂志》 CSSCI 北大核心 2013年第12期88-92,61,共6页
为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括... 为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括主题词词频分析、共词分析、文本聚类分析和与引文聚类结合的分析方法,总结其常用的分析工具并介绍新的科学图谱分析软件——SciMAT。最后总结基于文本挖掘的专利技术主题分析方法的优点与不足,为其将来的研究提供建议。 展开更多
关键词 文本挖掘 技术主题 专利分析 词频分析 共词分 析文本聚类
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部