期刊文献+
共找到791篇文章
< 1 2 40 >
每页显示 20 50 100
WINDOWS环境下的算法图视化的实现 被引量:1
1
作者 沈翼之 程景云 +2 位作者 王汇丰 张益民 林怿 《计算机工程》 CAS CSCD 北大核心 1994年第S1期558-564,共7页
算法图视是算法的一种可见形式,它对程序员和用户研究算法行为提供了有力的支持。本文描述了在Windows环境下开发算法图视的技术和方法,它们可作为进一步开展算法图视应用的基础。
关键词 运行指定 算法图 代码重人 时间片 分时
下载PDF
面向算法图视的算法预处理──算法的事件步分解方程 被引量:1
2
作者 张益民 沈翼之 程景云 《上海海运学院学报》 1995年第4期22-28,共7页
在过去的算法图视开发系统中,算法必须按系统接口的规范书写,以便与其所建立的公共的图视系统接口。笔者提出了一种可在计算机上实现的算法预处理方法,即事件步分解方法。按传统方式书写的算法经过这种预处理后即能满足系统接口规范... 在过去的算法图视开发系统中,算法必须按系统接口的规范书写,以便与其所建立的公共的图视系统接口。笔者提出了一种可在计算机上实现的算法预处理方法,即事件步分解方法。按传统方式书写的算法经过这种预处理后即能满足系统接口规范。这种方法大大提高了算法图视系统对用户的友好性,目前已在我们的算法图视系统中得到良好应用。 展开更多
关键词 算法 预处理 算法图 事件步分解
下载PDF
基于算法图的并行计算优化
3
作者 席裕庚 王轶 《控制与决策》 EI CSCD 北大核心 1997年第1期8-13,共6页
研究基于算法图的并行计算优化设计方法。通过引入算法图,从数学机理上对算法的并行结构进行描述,针对不同要求提出了对计算网络的并行优化设计方法,为设计并行算法提供了新的有效途径。
关键词 并行算法 算法图 算法结构 优化 并行计算机
下载PDF
基于顶点组重分配的动态增量图划分算法
4
作者 李贺 刘延娜 +2 位作者 杨舒琪 黄健斌 乔少杰 《软件学报》 EI CSCD 北大核心 2024年第4期1819-1840,共22页
图划分是分布式图计算中的一项基础工作,其作用是将大规模图进行划分并分配到集群中的不同机器上.图划分的质量对分布式图计算的性能有很大的影响,其目标是降低负载平衡和最小化边割.如今,现实中的图数据通常呈动态增长态势,这就需要一... 图划分是分布式图计算中的一项基础工作,其作用是将大规模图进行划分并分配到集群中的不同机器上.图划分的质量对分布式图计算的性能有很大的影响,其目标是降低负载平衡和最小化边割.如今,现实中的图数据通常呈动态增长态势,这就需要一种能够处理动态增量图的划分方法,在图数据动态增长的过程中确保划分的质量不受影响.目前虽然有一些动态图划分算法被提出,但它们不能同时专注于实时处理动态变化和获得高质量的划分结果.提出基于顶点组重分配的动态增量图划分算法(ED-IDGP)来解决大规模动态增量图的划分问题.在ED-IDGP算法中,设计实时处理4种不同单元更新类型的动态处理器,并在每次处理完单元更新后通过在分区发生动态变化的附近执行局部优化器进一步提高图划分的质量.在ED-IDGP的局部优化器中,利用基于改进标签传播算法的顶点组搜索策略搜索顶点组,并利用提出的顶点组移动增益公式衡量最有益的顶点组,将该顶点组移动到目标分区中做优化.在真实数据集上从不同的角度和度量指标评估了ED-IDGP算法的性能和效率. 展开更多
关键词 划分 局部优化 动态增量划分算法
下载PDF
结合力导向图分布算法的特征加权深度嵌入聚类
5
作者 吕维 钱宇华 +2 位作者 王婕婷 李飞江 胡深 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1318-1324,共7页
聚类分析作为无监督学习领域的一个重要研究方向,是许多数据驱动应用的核心.但是高维数据特有的高维距离趋同特性,使得高维空间样本近邻结构遭到破坏,从而使得大量基于距离(基于近邻)的聚类算法性能急剧下降.目前,大量研究者认为,高维... 聚类分析作为无监督学习领域的一个重要研究方向,是许多数据驱动应用的核心.但是高维数据特有的高维距离趋同特性,使得高维空间样本近邻结构遭到破坏,从而使得大量基于距离(基于近邻)的聚类算法性能急剧下降.目前,大量研究者认为,高维数据往往包含大量与任务不相关特征及相互关联的特征,其真实特征维度往往要比原始特征维度低很多.在学习样本低维等价表示上,基于深度自编码器的深度嵌入学习尽可能地保留重构信息.然而,现有此类方法往往需要聚类损失引导聚类,这虽然提高了聚类性能,但聚类损失与重构损失间的内在矛盾,限制了聚类性能的进一步提高.基于力导向图分布算法的降维算法则是尽可能保留近邻结构信息的基础上学习样本低维表示,但是高维距离趋同的特性使得此类算法较难准确获取样本高维近邻结构信息.本文在深度自编码器与力导向图分布算法的基础上引入特征加权思想,使模型在具有强大的低维等价表示能力及根据数据近邻结构凸显簇结构能力的同时考虑特征对聚类任务的适合程度.5个数据集上与最新高维聚类算法的对比实验充分证明了本文算法的合理性与优越性. 展开更多
关键词 高维聚类 深度自编码器 特征加权 力导向分布算法
下载PDF
基于图搜索的陆空两栖平台3D路径规划算法
6
作者 孟庆京 司俊德 +3 位作者 张新钰 孙弘麟 王小宇 荣松松 《汽车安全与节能学报》 CAS CSCD 北大核心 2024年第2期253-260,共8页
为了解决陆空两栖平台路径规划能效与寻径效率问题,提出了一种基于图搜索算法的全局路径规划算法。考虑了空中飞行能耗与地面行驶能耗模型的不同,结合起飞阈值、地面移动成本系数、空中移动成本系数等参数决定模态切换机制,在遇到难以... 为了解决陆空两栖平台路径规划能效与寻径效率问题,提出了一种基于图搜索算法的全局路径规划算法。考虑了空中飞行能耗与地面行驶能耗模型的不同,结合起飞阈值、地面移动成本系数、空中移动成本系数等参数决定模态切换机制,在遇到难以越过的障碍时使用逃脱算法脱困,当允许地面通过时优先采用地面行驶的方式到达目标点以提升寻径效率与能效。为验证该算法,分别建立了针对陆空2种模式下的能耗模型,在现有交通规则约束下完成城市场景和虚拟迷宫测试。结果表明:本算法的搜索效率相较于对照组算法提升了30%以上,有效提升搜寻效率的同时降低了能量消耗。 展开更多
关键词 陆空两栖平台 跨模态路径规划 搜索算法 模态切换策略
下载PDF
基于图分析算法的信用卡交易欺诈检测
7
作者 袁立宁 唐雨霞 +2 位作者 黄琬雁 罗恒雨 何佩遥 《现代信息科技》 2024年第15期138-141,共4页
当前,在线信用卡交易欺诈案件快速增加,作案手段和方法更加多变,信用卡交易欺诈检测已成为银行风险防控的重点内容。文章依托近年人工智能领域热门的图分析理论与算法,将信用卡交易数据转化为图结构数据,从而分析信用卡交易欺诈图的社... 当前,在线信用卡交易欺诈案件快速增加,作案手段和方法更加多变,信用卡交易欺诈检测已成为银行风险防控的重点内容。文章依托近年人工智能领域热门的图分析理论与算法,将信用卡交易数据转化为图结构数据,从而分析信用卡交易欺诈图的社区信息。在此基础上,应用图表示学习算法Deepwalk和机器学习分类器,构建信用卡交易欺诈检测模型,用于预测欺诈行为。实验结果表示,该模型对欺诈行为的检测准确率达70%。 展开更多
关键词 信用卡交易 欺诈检测 分析算法 表示学习
下载PDF
高光谱结合图分割算法快速鉴别不同尺度产地陈皮 被引量:9
8
作者 张悦 王游游 +4 位作者 张婷 覃驭楚 南铁贵 杨健 吕炎杰 《化学试剂》 CAS 北大核心 2023年第1期136-143,共8页
以中药材陈皮为研究对象,建立一种高光谱结合图分割算法实现不同尺度产地陈皮样本快速无损鉴别方法。采集陈皮样品的高光谱图像并利用图分割算法快速获得相对反射率数据集,多种预处理算法对光谱数据降噪处理后,结合偏最小二乘判别分析(P... 以中药材陈皮为研究对象,建立一种高光谱结合图分割算法实现不同尺度产地陈皮样本快速无损鉴别方法。采集陈皮样品的高光谱图像并利用图分割算法快速获得相对反射率数据集,多种预处理算法对光谱数据降噪处理后,结合偏最小二乘判别分析(PLS-DA)、随机森林(RF)和支持向量机(SVM)建立分类模型,利用预测集准确率筛选最佳模型,混淆矩阵评估模型性能。图分割算法相比常规人工提取方法时间减少80%。融合光谱一阶导结合PLS-DA模型是不同尺度产地陈皮样品的最优鉴别模型,省级行政区域和新会不同区域的陈皮样品的鉴别准确率分别为98.41%和99.05%。该新型图分割算法能够实现高光谱兴趣区域信息的快速、准确获取,结合高光谱技术可实现不同尺度产地陈皮样品的快速鉴别。 展开更多
关键词 高光谱技术 分割算法 化学计量学 陈皮 产地鉴别
下载PDF
动态图划分算法研究综述 被引量:1
9
作者 李贺 刘延娜 +5 位作者 袁航 杨舒琪 韵晋鹏 乔少杰 黄健斌 崔江涛 《软件学报》 EI CSCD 北大核心 2023年第2期539-564,共26页
图划分是大规模分布式图处理的首要工作,对图应用的存储、查询、处理和挖掘起基础支撑作用.随着图数据规模的不断扩大,真实世界中的图表现出动态性.如何对动态图进行划分,已成为目前图划分研究的热点问题.从不同动态图划分算法的关注点... 图划分是大规模分布式图处理的首要工作,对图应用的存储、查询、处理和挖掘起基础支撑作用.随着图数据规模的不断扩大,真实世界中的图表现出动态性.如何对动态图进行划分,已成为目前图划分研究的热点问题.从不同动态图划分算法的关注点和特点出发,系统性地介绍当前可用于解决动态图划分问题的各类算法,包括流式图划分算法、增量式图划分算法和图重划分算法.首先介绍图划分的3种不同的划分策略及问题定义、图的两种不同的动态性来源以及动态图划分问题;然后介绍3种不同的流式图划分算法,包括基于Hash的划分算法、基于邻居分布的划分算法以及基于流的优化划分算法;其次介绍单元素增量式划分和批量增量式划分这两种不同的增量式图划分算法;再次,分别介绍针对图结构动态的重划分算法和针对图计算动态的重划分算法;最后,在对已有方法分析和比较的基础上,总结目前动态图划分面临的主要挑战,提出相应的研究问题. 展开更多
关键词 划分 动态 分布式处理 算法
下载PDF
基于类别图增强算法的融合异构数据会话推荐分析
10
作者 李彩霞 《电子产品世界》 2023年第8期69-71,共3页
为了提高融合异构数据会话推荐效率,设计了一种通过类别图来实现增强效果的推荐算法。在融合层内融合物品与类别表征结果,确保物品表征中包含类别数据;根据注意力机制建立全局表征,再通过局部表征建立最终表示;通过预测层计算各候选对... 为了提高融合异构数据会话推荐效率,设计了一种通过类别图来实现增强效果的推荐算法。在融合层内融合物品与类别表征结果,确保物品表征中包含类别数据;根据注意力机制建立全局表征,再通过局部表征建立最终表示;通过预测层计算各候选对象推荐参数。研究结果表明:设计得到的CaSe4SR模型对各类数据集都表现出了最优推荐性能,CaSe4SR-W模型表现出了比Concat与CaSe4SR两种模型更差的性能,推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。 展开更多
关键词 会话推荐 类别增强算法 异构数据 全局表征
下载PDF
图类算法可重用设计及其实现 被引量:1
11
作者 轩瑞 陈磊 石海鹤 《江西师范大学学报(自然科学版)》 CAS 北大核心 2023年第1期52-60,共9页
为了提高图算法生成效率和可靠性,该文提出一种将领域特征模型与构件组装技术相结合的可重用的图类算法开发方法.首先,通过对一族图算法的深入分析,揭示出图类算法领域的共性特征和可变特征,建立领域特征模型;然后,分析特征之间的交互过... 为了提高图算法生成效率和可靠性,该文提出一种将领域特征模型与构件组装技术相结合的可重用的图类算法开发方法.首先,通过对一族图算法的深入分析,揭示出图类算法领域的共性特征和可变特征,建立领域特征模型;然后,分析特征之间的交互过程,设计图类算法的可重用构件,并对构件依赖关系做出描述;最后,借助高可靠平台对算法构件进行开发,建立高可靠可重用构件库,进一步由构件组装出多种图算法,提高了图算法的开发效率和可靠性.实验表明开发出的图算法可重用构件库具有一定的实用性. 展开更多
关键词 算法生成 特征模型 可重用设计 构件
下载PDF
无小区大规模MIMO系统中基于图着色的导频分配与功率控制算法 被引量:5
12
作者 肖海林 何怡玲 +2 位作者 胡智群 谢湘伟 张中山 《信号处理》 CSCD 北大核心 2023年第7期1309-1318,共10页
无小区大规模MIMO(Cell-Free Massive MIMO,CF-mMIMO)系统中大量的无线接入点在同一时间频率资源中服务所有的用户,具有较高的网络覆盖率和频谱效率,是下一代无线通信的前沿技术之一。然而,正交导频数量的限制以及用户信道质量的差异造... 无小区大规模MIMO(Cell-Free Massive MIMO,CF-mMIMO)系统中大量的无线接入点在同一时间频率资源中服务所有的用户,具有较高的网络覆盖率和频谱效率,是下一代无线通信的前沿技术之一。然而,正交导频数量的限制以及用户信道质量的差异造成了较严重的用户间干扰。为了优化这一干扰问题,本文提出了无小区大规模MIMO系统中基于图着色的导频分配与功率控制算法。利用基于图着色的导频分配算法降低导频污染,提高了信道估计精度。在此基础上,通过最大-最小功率控制算法降低多用户同频干扰,满足了系统中用户的混合服务质量需求。数值仿真结果表明:所提出的基于图着色的导频分配与功率控制算法可以显著提高系统的95%用户频谱效率以及最小用户速率,较好抑制了CF-mMIMO系统中的用户间干扰。 展开更多
关键词 无小区大规模MIMO系统 导频污染 功率控制 AP选择 着色算法
下载PDF
邻域知识图算法在旋转机械设备故障诊断中的应用 被引量:1
13
作者 邓宇翔 李正红 《计算机测量与控制》 2023年第11期16-21,30,共7页
旋转机械应用过程中极易出现内环故障、外环故障、滚动体故障的情况,而这也直接影响机械部件的使用寿命;为准确诊断设备元件的故障行为,达到延长旋转机械设备寿命水平的目的,针对邻域知识图算法在旋转机械设备故障诊断中的应用展开研究... 旋转机械应用过程中极易出现内环故障、外环故障、滚动体故障的情况,而这也直接影响机械部件的使用寿命;为准确诊断设备元件的故障行为,达到延长旋转机械设备寿命水平的目的,针对邻域知识图算法在旋转机械设备故障诊断中的应用展开研究;求解邻域知识图算法的函数表达式,并以此为基础,完成对故障数据的推荐,再通过预处理的方式,实现对旋转机械设备故障数据的深度挖掘;融合关键故障数据,并对其进行降维处理,根据核特征定义条件,完善具体的故障诊断流程,完成基于邻域知识图算法的旋转机械设备故障诊断算法的设计;实验结果表明,上述方法的应用,可将内环故障、外环故障、滚动体故障三种故障表现行为的诊断准确率均提升至90%以上,可以达到延长旋转机械设备使用寿命的目的。 展开更多
关键词 邻域知识算法 旋转机械设备 故障诊断 数据推荐 数据降维 故障特征 故障行为
下载PDF
基于超图嵌入的行车故障多元关系知识表示方法
14
作者 张飞 周彬 +1 位作者 鲍劲松 李心雨 《计算机集成制造系统》 EI CSCD 北大核心 2024年第2期445-459,共15页
鉴于常规知识图谱仅能处理二元关系,而故障知识包含大量“多现象—多原因—多方法”的多元耦合关系,强制转化将会破坏关系的完整性,造成严重的信息失真,为采用知识超图处理此类复杂多元关系以保证数据的完整性,设计了一种基于超图嵌入... 鉴于常规知识图谱仅能处理二元关系,而故障知识包含大量“多现象—多原因—多方法”的多元耦合关系,强制转化将会破坏关系的完整性,造成严重的信息失真,为采用知识超图处理此类复杂多元关系以保证数据的完整性,设计了一种基于超图嵌入的行车故障多元关系知识表示方法。通过梳理行车故障单中现象、原因、方法等数据之间的多元关联,构建适用于表征多元耦合关系的行车故障本体模型,以该本体模型为知识超图的模式层建立行车故障知识超图;基于BERT模型和超图卷积网络获取故障知识的嵌入向量表示,并实现了相似故障检索。最后,以上海某钢铁公司收集的行车故障调查单为实例,验证了所提方法的有效性。 展开更多
关键词 知识超 多元耦合关系 知识表示 嵌入算法 行车故障
下载PDF
图神经网络研究综述 被引量:2
15
作者 侯磊 刘金环 +1 位作者 于旭 杜军威 《计算机科学》 CSCD 北大核心 2024年第6期282-298,共17页
随着人工智能的快速发展,深度学习已经在图像、文本和语音等可在欧氏空间表示的数据中取得了巨大成功,但却一直无法很好地应用于非欧氏空间。近年来,图神经网络在非欧几里得空间中展现出了强大的表示学习能力,并广泛应用于推荐系统、自... 随着人工智能的快速发展,深度学习已经在图像、文本和语音等可在欧氏空间表示的数据中取得了巨大成功,但却一直无法很好地应用于非欧氏空间。近年来,图神经网络在非欧几里得空间中展现出了强大的表示学习能力,并广泛应用于推荐系统、自然语言处理以及机器视觉等众多领域。图神经网络模型基于信息的传播机制,具体地,图中的目标节点通过聚合邻居节点的信息来更新自身的嵌入表示。利用图神经网络,可将众多现实问题(如社交网络、知识图谱和药物化学成分等)抽象成图网络,借助图中的连接边,对不同节点之间的依赖关系进行合理建模。鉴于此,对图神经网络进行了系统综述,首先介绍了图结构数据方面的基础知识,然后对图游走算法和不同类型的图神经网络模型进行了系统梳理。进一步地,详细阐述了当前图神经网络的通用框架和应用领域,最后对图神经网络的未来进行了总结与展望。 展开更多
关键词 结构数据 游走算法 卷积神经网络 注意力网络 残差网络 递归网络
下载PDF
基于多准则采样的自然图像抠图算法
16
作者 苟洪山 杨圆 +2 位作者 张远 吴磊 谭棉 《软件导刊》 2023年第2期28-34,共7页
抠图作为图像处理领域的热点难题,已广泛应用于目标识别、虚拟现实和前景提取等方面。然而,图像高质量像素较少时难以获取高质量像素对的问题一直存在,鉴于此,提出基于多准则采样的抠图算法。该算法通过多准则采样策略从全局相似性到局... 抠图作为图像处理领域的热点难题,已广泛应用于目标识别、虚拟现实和前景提取等方面。然而,图像高质量像素较少时难以获取高质量像素对的问题一直存在,鉴于此,提出基于多准则采样的抠图算法。该算法通过多准则采样策略从全局相似性到局部相似性的角度获取高质量的候选子集,从而解决高质量像素对较少时易丢失等问题。在此基础上,设计多评价联合的最优像素对选取策略,该策略通过联合多个像素对评价函数,以避免单一评价函数估计的解不是当前最优解。为了验证该算法优越性,选用Alpha matting基准数据集作为实验数据。实验结果表明,在图像高质量像素较少时难以获取高质量像素对的问题上,该算法估计前景透明度遮罩优于目前典型的抠图算法。 展开更多
关键词 多准则采样 联合评价函数 采样抠算法 像处理
下载PDF
基于知识图谱的直升机部件装配序列规划方法
17
作者 蒋明杰 张炜才 +2 位作者 荣浩明 张俊起 黄少华 《图学学报》 CSCD 北大核心 2024年第5期1062-1070,共9页
由于直升机组件数量多且组件之间约束关系复杂,传统的装配序列规划方法存在指数爆炸和易陷入局部最优解的问题。为了应对装配序列求解时间随组件数量指数增长和多约束关系矩阵运算复杂的难点,引入知识图谱(KG)建立直观的语义装配信息模... 由于直升机组件数量多且组件之间约束关系复杂,传统的装配序列规划方法存在指数爆炸和易陷入局部最优解的问题。为了应对装配序列求解时间随组件数量指数增长和多约束关系矩阵运算复杂的难点,引入知识图谱(KG)建立直观的语义装配信息模型,并提出了一种基于KG的直升机部件装配序列规划方法。首先,基于三维模型解析和知识推理技术实现结构信息和约束关系等关键装配信息的提取。其次,基于本体构建KG形式的装配信息模型。最后,利用带反馈的图规划算法从KG中求解直升机部件的装配序列。KG提供的优先关系减少了算法搜索空间,在优先关系的约束下,带反馈的图规划算法以装配方向改变次数最小和装配工具变化次数最少为目标,逐步规划序列并反馈规划结果以避免重复搜索。直升机的中机身中段部件被作为实验对象以验证该方法的有效性,对比启发式算法能获得更高适应度值的装配序列且求解时间更短。 展开更多
关键词 知识 直升机部件 装配序列规划 语义信息模型 算法 三维模型解析
下载PDF
基于图数据库和图算法的转供电方案在配电网智能操作票系统的研究和应用 被引量:4
18
作者 陈根奇 黄振华 +2 位作者 王少春 孙伟刚 陈艳 《电力学报》 2023年第1期73-82,共10页
在智能操作票系统的研发中,调电操作票的设计需要对配网故障或者检修的停电范围及线路转供路径进行评估,考虑到电网超大规模的实际因素,常规的关系型数据库难以支撑电网的实时划分和转供电方案的决策。为解决这个问题,通过结合Dijkstra... 在智能操作票系统的研发中,调电操作票的设计需要对配网故障或者检修的停电范围及线路转供路径进行评估,考虑到电网超大规模的实际因素,常规的关系型数据库难以支撑电网的实时划分和转供电方案的决策。为解决这个问题,通过结合Dijkstra、深/广度优先搜索等图论算法,提出了一种基于图数据库的大规模电网故障影响区域划分和转供电决策方案,实现了调电过程中的最优路径规划,并将其应用在调电操作票的设计当中,实现开票快、准的设计要求。该方案除了应用在操作票系统当中,还可以应用到其他场景中,如电网因故障或检修需要调电时,可以直接给出最优调电方案供调控员使用,能够节省电网调度的经济成本,降低电力传输过程中的电能损耗,避免人为因素导致的电力调度决策失误问题,与目前我国电力行业的“碳中和”目标相符合。为超大规模电网转供电方案的自动规划和选择提供了一种可行的参考案例。 展开更多
关键词 配电网 转供电方案 Neo4j数据库 算法 调电最优路径 DIJKSTRA 深/广度优先搜索法 碳中和
下载PDF
基于图嵌入算法和用户画像的学术情报推荐模型
19
作者 庞家乐 张彦 《价值工程》 2023年第12期138-141,共4页
当今过载的在线学术资源给用户造成了一定程度的信息压迫,如何从巨量资源里,在用户的简单操作下,快速有效地筛选出满足高校师生科研需求的文献资源,正在成为一个复杂的问题;本文以传统的用户画像方法为基础,构建出适合的数据模型,利用... 当今过载的在线学术资源给用户造成了一定程度的信息压迫,如何从巨量资源里,在用户的简单操作下,快速有效地筛选出满足高校师生科研需求的文献资源,正在成为一个复杂的问题;本文以传统的用户画像方法为基础,构建出适合的数据模型,利用较新的图嵌入算法对已有的用户行为大数据和文献元数据进行语义向量构建,最终计算人、文献之间的关联权重,为构建个性化的学术信息推送系统提供了新的尝试。 展开更多
关键词 学术资源 嵌入算法 用户画像 相似度计算 智能推送
下载PDF
基于领域概念图的航天新闻自动摘要模型
20
作者 黄浩宁 陈志敏 +1 位作者 徐聪 张晓燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第1期317-327,共11页
互联网海量的航天新闻中隐含着大量航天情报信息,对其进行理解与压缩是提高后续情报分析效率的基础。然而通用的自动摘要算法往往会忽略很多航天领域关键信息,且有监督自动摘要算法需要对领域文本进行大量的数据标注,费时费力。因此,提... 互联网海量的航天新闻中隐含着大量航天情报信息,对其进行理解与压缩是提高后续情报分析效率的基础。然而通用的自动摘要算法往往会忽略很多航天领域关键信息,且有监督自动摘要算法需要对领域文本进行大量的数据标注,费时费力。因此,提出一种基于领域概念图的无监督自动摘要(DCG-TextRank)模型,利用领域术语辅助引导图排序,提高模型对领域文本的理解力。该模型分3个模块:领域概念图生成、图权重初始化、图排序及语义筛选。根据句向量相似度和领域术语库,将文本转换为包含句子节点和领域术语节点的领域概念图;根据航天新闻文本特征初始化领域概念图权值;采用TextRank模型对句子进行排序,并在语义筛选模块通过图节点聚类及设置摘要语义保留度的方法改进TextRank的输出,充分保留文本的多语义信息并降低冗余。所提模型具有领域可移植性,且实验结果表明:在航天新闻数据集中,所提模型相比传统TextRank模型性能提升了14.97%,相比有监督抽取式文本摘要模型BertSum和MatchSum性能提升了4.37%~12.97%。 展开更多
关键词 自动文本摘要 领域概念 预训练语言模型 排序算法 节点聚类
下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部