期刊文献+
共找到119篇文章
< 1 2 6 >
每页显示 20 50 100
改进变分自编码器的工业时序数据异常检测
1
作者 张志昂 廖光忠 《计算机工程与设计》 北大核心 2024年第1期17-23,共7页
为解决传统的异常检测模型对工业时序数据异常点检测方面误判率大和抗干扰性差的问题,提出一种改进的变分自编码器模型。考虑到工业时序数据的不规律性,使用变分自编码器模型作为基础架构;由于变分自编码器本身存在难以准确检测出异常... 为解决传统的异常检测模型对工业时序数据异常点检测方面误判率大和抗干扰性差的问题,提出一种改进的变分自编码器模型。考虑到工业时序数据的不规律性,使用变分自编码器模型作为基础架构;由于变分自编码器本身存在难以准确检测出异常时序数据的问题,在编码和解码过程中分别引入时间卷积网络和通道注意力机制,实现扩大感受野和增强特征权重;对数据时序数据使用随机森林进行特征排序,提高检测的准确性。通过进行对比测试实验,验证了该模型可以有效提高对异常工业时序数据点检测的准确性和可靠性。 展开更多
关键词 异常检测 时间卷积网络 变分自编码器 通道注意力机制 时序数据 随机森林 感受野
下载PDF
非对称策略下基于前景信息的TIoU回归损失计算
2
作者 邵容 陈东方 王晓峰 《计算机工程与应用》 CSCD 北大核心 2023年第11期112-118,共7页
回归损失函数是目标检测网络的重要组成部分之一。现有的回归损失中,无论是L范式损失还是基于IoU的损失都采用一种对称策略处理输入的两个边界框,这使得它们对前景信息的利用不够充分,影响了回归的质量。为此,提出了一种非对称策略,用... 回归损失函数是目标检测网络的重要组成部分之一。现有的回归损失中,无论是L范式损失还是基于IoU的损失都采用一种对称策略处理输入的两个边界框,这使得它们对前景信息的利用不够充分,影响了回归的质量。为此,提出了一种非对称策略,用以增强前景信息在回归损失中的作用,并在该策略的指导下设计了TIoU(Target-IoU)损失来保证网络对真值框内的特征予以有效利用,使得边界框的回归更贴近真实值。实验结果表明,TIoU损失在Faster R-CNN和RetinaNet下精度分别提升了0.2个百分点和0.5个百分点,实验数据集采用的是PASCAL VOC数据集。 展开更多
关键词 目标检测 回归损失 前景信息 深度学习
下载PDF
改进YOLOv5s的明渠漂浮垃圾实时检测方法
3
作者 石露露 廖光忠 《计算机技术与发展》 2023年第9期83-90,共8页
针对航拍图像上明渠漂浮垃圾尺寸小,且易受水面倒影、强光等因素干扰从而造成漂浮垃圾漏检和误检的问题,提出了一种基于改进YOLOv5s的明渠漂浮垃圾实时检测方法。首先,通过数据增强的方式对数据集进行扩充,避免数据量过少产生过拟合现象... 针对航拍图像上明渠漂浮垃圾尺寸小,且易受水面倒影、强光等因素干扰从而造成漂浮垃圾漏检和误检的问题,提出了一种基于改进YOLOv5s的明渠漂浮垃圾实时检测方法。首先,通过数据增强的方式对数据集进行扩充,避免数据量过少产生过拟合现象;然后,结合加权双向特征融合网络(BiFPN),对YOLOv5s结构的特征融合过程进行修改,以提高检测精度和速度;并且在Neck和Head部分之间添加3个改进的三维CBAM注意力机制模块,加强网络信息的提取和定位能力,能够有效地降低检测的漏检率和误检率;最后,增大网络输入的分辨率,使图像具有更加丰富的细节信息和更加精确的位置信息,有利于小目标特征信息的提取。实验结果显示改进的YOLOv5s算法检测的平均精度达到了89.9%,与原YOLOv5s算法相比提高了9.5%,而且与其他目标检测算法对比,能够提高明渠漂浮垃圾检测的精度,确保检测的实时性。 展开更多
关键词 YOLOv5s 实时检测 加权双向特征融合 注意力机制 小目标
下载PDF
基于改进自编码模型的工业时序数据异常检测
4
作者 肖鉴涛 廖光忠 《计算机与数字工程》 2023年第11期2627-2632,2670,共7页
针对传统异常检测模型在处理工业多维时序数据时特征提取不充分、抗干扰能力弱等问题,提出一种改进的自编码模型,有效结合了门控循环网络的时序信息记忆能力和收缩自编码器的鲁棒特征提取能力,能够同时捕获不同特征变量之间的非线性相... 针对传统异常检测模型在处理工业多维时序数据时特征提取不充分、抗干扰能力弱等问题,提出一种改进的自编码模型,有效结合了门控循环网络的时序信息记忆能力和收缩自编码器的鲁棒特征提取能力,能够同时捕获不同特征变量之间的非线性相关性和单个变量自身的时序相关性。采取半监督学习异常检测方法,使用正常数据训练模型收敛,并根据待检测数据输入模型后计算出的异常得分来判定异常样本。基于真实的工业传感器数据进行实验后的结果表明,该方法有效提高了异常检测的准确度和可靠性。 展开更多
关键词 异常检测 时序数据 半监督学习 收缩自编码器 门控循环网络
下载PDF
基于字典的压缩加密查询方案研究
5
作者 田萍芳 郭万涛 《计算机技术与发展》 2024年第2期120-126,共7页
RDF(资源描述框架,Resource Description Framework)压缩方案可以有效压缩庞大的RDF数据集,RDF加密方案可以有效提高数据的安全性。结合这两种方案,该文提出了一种基于字典的压缩加密查询方案。首先,通过原始的RDF数据集构建字典集,实... RDF(资源描述框架,Resource Description Framework)压缩方案可以有效压缩庞大的RDF数据集,RDF加密方案可以有效提高数据的安全性。结合这两种方案,该文提出了一种基于字典的压缩加密查询方案。首先,通过原始的RDF数据集构建字典集,实现数据的压缩;然后,通过字典集生成密文ID三元组,实现数据的加密。将字典集存放在可信区域,密文ID三元组存储在不可信区域。查询时,首先通过字典集将查询语句中的关键词转换成对应的密文关键词,然后在密文ID三元组上查询与密文关键词相关的数据,将得到的密文数据传送至可信区域,在可信区域进行解密和解压缩操作,得到最终的明文数据。该方案将查询操作与解密解压缩操作分开,查询只在不可信区域操作,解密解压缩则在可信区域操作,从而进一步提高数据的安全性。最后,在5个数据集上与其他RDF加密方案进行了对比实验,实验结果证明了该压缩加密查询方案在查询性能上有一定的提升,验证了该方案是可行的和有效的。 展开更多
关键词 RDF压缩 RDF加密 字典 加密查询 资源描述框架
下载PDF
引入信息熵的CURE聚类算法 被引量:14
6
作者 伍恒 李文杰 蒋旻 《计算机应用研究》 CSCD 北大核心 2017年第8期2303-2305,共3页
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数... 为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。 展开更多
关键词 层次聚类 CURE算法 信息熵 代表点选取
下载PDF
MedKGGPT:基于知识图谱的医疗大型语言模型设计方法
7
作者 顾鹏辉 李涛 高阳 《计算机技术与发展》 2024年第6期178-184,共7页
大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGL... 大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGLM的模型,并提出一种面向医疗领域的知识图谱(Knowledge Graphs,KGs)和LLM相结合的框架。框架主要包含两个部分:首先,通过KG三元组中的实体和关系,提出了一种基于KG结构数据的提示工程方法,使得LLM更加具有医学领域的专用知识,提高LLM的可解释性;其次,提出一种利用KG来对齐LLM的方法,将LLM的输出与KG的相关知识进行比较,验证LLM输出结果的一致性和准确性,从而增强了LLM在医疗领域的安全性。实验结果表明,最终生成的MedKGGPT模型能够输出更加具有安全性的结果,说明KG能够有效增强LLM的可解释性,为LLM应用在医疗领域提供了帮助。 展开更多
关键词 大型语言模型 医疗 知识图谱 提示工程 ChatGLM
下载PDF
融合多尺度门控卷积和窗口注意力的结肠息肉分割
8
作者 汪鹏程 张波涛 顾进广 《计算机系统应用》 2024年第6期70-80,共11页
结肠息肉的准确分割对于切除异常组织和降低息肉转换为结肠癌的风险具有重要意义.目前的结肠息肉分割模型在对息肉图像进行分割时存在着较高的误判率和分割精度较低的问题.为了实现对息肉图像的精准分割,提出了一种融合多尺度门控卷积... 结肠息肉的准确分割对于切除异常组织和降低息肉转换为结肠癌的风险具有重要意义.目前的结肠息肉分割模型在对息肉图像进行分割时存在着较高的误判率和分割精度较低的问题.为了实现对息肉图像的精准分割,提出了一种融合多尺度门控卷积和窗口注意力的结肠息肉分割模型(MGW-Net).首先,设计一种改进的多尺度门控卷积块(MGCM)取代U-Net的卷积块,来实现对结肠息肉图像信息的充分提取.其次,为了减少跳跃连接处的信息损失并充分利用网络底部信息,结合改进的空洞卷积和混合增强的残差窗口注意力构建了多信息融合增强模块(MFEM),以优化跳跃连接处的特征融合.在CVC-ClinicDB和Kvasir-SEG数据集上的实验结果表明,MGW-Net的相似性系数分别为93.8%和92.7%,平均交并比分别为89.4%和87.9%,在CVC-ColonDB、CVC-300和ETIS数据集上的实验结果表明其拥有较强的泛化性能,从而验证了MGW-Net可以有效地提高对结肠息肉分割的准确性和鲁棒性. 展开更多
关键词 医学图像分割 结肠息肉图像 U-Net 注意力门 窗口注意力
下载PDF
对等云存储系统中抗Sybil攻击的准入控制机制 被引量:3
9
作者 何亨 夏薇 +2 位作者 李鹏 金瑜 顾进广 《中国科技论文》 CAS 北大核心 2015年第2期150-158,共9页
提出了一个对等云存储系统中基于身份密码的准入控制机制,包括4个协议,分别为不同实际场景中的用户安全高效地分配身份标识,并有效地抵抗Sybil攻击。在基本协议中,云服务器使用回叫的方式认证用户,再为合法用户基于其IP地址分配随机的... 提出了一个对等云存储系统中基于身份密码的准入控制机制,包括4个协议,分别为不同实际场景中的用户安全高效地分配身份标识,并有效地抵抗Sybil攻击。在基本协议中,云服务器使用回叫的方式认证用户,再为合法用户基于其IP地址分配随机的身份标识并产生对应的公私钥对。扩展协议1使云服务器能够将工作代理给多个可信节点。另外两个协议针对使用网络地址转换的用户,对上述协议进行扩充,基于用户的IP地址和端口号来为其分配身份,并在分发私钥时加入密码难题,无需进行复杂的身份证书管理,具有高安全性;协议维持合理的计算时间,可限制恶意用户获取身份的速率,具备良好的可扩展性。 展开更多
关键词 对等云存储系统 准入控制 SYBIL攻击 身份密码 密码难题
下载PDF
基于加减性色彩系统的视频偏色盲估计方法 被引量:3
10
作者 祝大伟 陈黎 田菁 《计算机工程与设计》 CSCD 北大核心 2014年第6期2060-2064,2113,共6页
针对视频图像在获取过程中产生的偏色现象,提出了一种基于加减性色彩系统的视频偏色盲估计方法。计算图像RGB三通道的颜色比率和能量差,根据颜色比率判断图像的色彩系统类型及偏色通道,融合偏色通道的颜色比率和能量差得到偏色因子,实... 针对视频图像在获取过程中产生的偏色现象,提出了一种基于加减性色彩系统的视频偏色盲估计方法。计算图像RGB三通道的颜色比率和能量差,根据颜色比率判断图像的色彩系统类型及偏色通道,融合偏色通道的颜色比率和能量差得到偏色因子,实现偏色图像的检测及偏色程度估计。依据本文所设计的评价标准,对图像库进行实验测试,实验结果表明,基于加减性色彩系统的视频盲估计方法与主观评价结果具有较好的吻合。 展开更多
关键词 颜色比率 能量差 偏色因子 色彩系统类型 偏色程度估计
下载PDF
基于YOLOv5-SSA的水炮射击半遮挡目标检测
11
作者 向河汉 陈黎 陈姚节 《计算机与数字工程》 2024年第3期915-921,共7页
船舶水炮射击时容易产生水花,造成对射击目标的遮挡,现有水炮控制跟踪系统在水炮射击场景中容易丢失目标,难以获得有效的瞄准效果。论文提出一种基于深度学习的目标检测方法,将水炮射击时拍摄的图像作为输入,实时检测出要射击目标的位置... 船舶水炮射击时容易产生水花,造成对射击目标的遮挡,现有水炮控制跟踪系统在水炮射击场景中容易丢失目标,难以获得有效的瞄准效果。论文提出一种基于深度学习的目标检测方法,将水炮射击时拍摄的图像作为输入,实时检测出要射击目标的位置,来达到良好的瞄准效果,实现对目标准确有效的射击。论文设计一个轻量级的深度学习目标检测网络YOLOv5-SSA对水炮射击的目标进行实时检测,在实际场景中进行测试时,在目标检测准确率达到93.2%的前提下,处理速度达到了21.18ms,实现了对目标的实时检测。 展开更多
关键词 目标检测 实时 深度学习 水炮
下载PDF
基于改进DenseNet模型的滚动轴承故障诊断
12
作者 雷伟 廖光忠 裴浪 《计算机技术与发展》 2024年第3期207-213,共7页
滚动轴承是机械设备的关键部件,为了检测滚动轴承设备的正常运转并且提高识别轴承故障的准确率,提出一种优化变分模态分解(VMD)结合改进密集神经网络(DenseNet)的故障诊断模型方法。首先,使用多种群差分进化(MPDE)算法以局部极小包络熵... 滚动轴承是机械设备的关键部件,为了检测滚动轴承设备的正常运转并且提高识别轴承故障的准确率,提出一种优化变分模态分解(VMD)结合改进密集神经网络(DenseNet)的故障诊断模型方法。首先,使用多种群差分进化(MPDE)算法以局部极小包络熵为优化搜索的目标函数,对VMD方法中的相关参数进行优化搜索以获取最佳参数组合;然后,使用最佳参数组合优化的VMD方法分解处理原始滚动轴承的故障信号,并得到若干本征模态分量信号(IMFs);最后,通过引入通道注意力模块(MECANet)的改进密集神经网络模型对分解得到的IMF分量信号进行深层故障特征提取与识别,最终完成滚动轴承的故障诊断。实验结果表明:提出的优化VMD结合改进DenseNet模型对滚动轴承故障识别的准确率达到了99.23%,并且对比一些其他常见故障诊断模型的准确率有明显的提升,而且与先进的故障诊断模型对比其准确率存在较小差距,验证了此模型在滚动轴承故障诊断方面的有效性。 展开更多
关键词 滚动轴承 变分模态分解 多种群差分进化 密集神经网络 MECANet 故障诊断
下载PDF
面向销售数据的多项缺失值关联性的增量填补
13
作者 刘智 李涛 袁冲 《计算机系统应用》 2024年第4期288-295,共8页
数据缺失会影响数据的质量,可能导致分析结果的不准确和降低模型的可靠性,缺失值填补能减低偏差方便后续分析.大多数的缺失值填补算法,都是假设多项缺失值之间是弱相关甚至无相关,很少考虑缺失值之间的相关性以及填补顺序.在销售领域中... 数据缺失会影响数据的质量,可能导致分析结果的不准确和降低模型的可靠性,缺失值填补能减低偏差方便后续分析.大多数的缺失值填补算法,都是假设多项缺失值之间是弱相关甚至无相关,很少考虑缺失值之间的相关性以及填补顺序.在销售领域中对缺失值进行独立填补,会减少缺失值信息的利用,从而对缺失值填补的准确度造成较大的影响.针对以上问题,本文以销售领域为研究目标,根据销售行为的多维度特征,利用不同模型输出值的空间分布特征特性,探索多项缺失值的填补更新机制,研究面向销售数据多项缺失值增量填补方法,根据特征相关性,对缺失特征排序并用已填补的数据作为信息要素融合对后面的缺失值进行增量填补.该算法同时考虑了模型的泛化性和缺失数据之间的信息相关问题,并结合多模型融合,对多项缺失值进行有效填补.最后基于真实连锁药店销售数据集通过大量实验对比验证了所提算法的有效性. 展开更多
关键词 缺失值处理 增量填补 多模型混合 Stacking算法 药店销售
下载PDF
边缘计算中基于区块链的轻量级密文访问控制方案
14
作者 郑嘉诚 何亨 +1 位作者 陈月佳 肖天哲 《计算机系统应用》 2024年第4期69-81,共13页
密文策略属性基加密(ciphertext-policy attribute-based encryption,CP-ABE)技术可以在保证数据隐私性的同时提供细粒度访问控制.针对现有的基于CP-ABE的访问控制方案不能有效解决边缘计算环境中的关键数据安全问题,提出一种边缘计算... 密文策略属性基加密(ciphertext-policy attribute-based encryption,CP-ABE)技术可以在保证数据隐私性的同时提供细粒度访问控制.针对现有的基于CP-ABE的访问控制方案不能有效解决边缘计算环境中的关键数据安全问题,提出一种边缘计算环境中基于区块链的轻量级密文访问控制方案(blockchain-based lightweight access control scheme over ciphertext in edge computing,BLAC).在BLAC中,设计了一种基于椭圆曲线密码的轻量级CP-ABE算法,使用快速的椭圆曲线标量乘法实现算法加解密功能,并将大部分加解密操作安全地转移,使得计算能力受限的用户设备在边缘服务器的协助下能够高效地完成密文数据的细粒度访问控制;同时,设计了一种基于区块链的分布式密钥管理方法,通过区块链使得多个边缘服务器能够协同地为用户分发私钥.安全性分析和性能评估表明BLAC能够保障数据机密性,抵抗共谋攻击,支持前向安全性,具有较高的用户端计算效率,以及较低的服务器端解密开销和存储开销. 展开更多
关键词 边缘计算 区块链 访问控制 密文策略属性基加密 椭圆曲线
下载PDF
杂乱场景中多尺度注意力特征融合抓取检测网络
15
作者 徐衍 林云汉 闵华松 《计算机系统应用》 2024年第5期76-84,共9页
GSNet使用抓取度区分杂乱场景的可抓取区域,显著地提高了杂乱场景中机器人抓取位姿检测准确性,但是GSNet仅使用一个固定大小的圆柱体来确定抓取位姿参数,而忽略了不同大小尺度的特征对抓取位姿估计的影响.针对这一问题,本文提出了一个... GSNet使用抓取度区分杂乱场景的可抓取区域,显著地提高了杂乱场景中机器人抓取位姿检测准确性,但是GSNet仅使用一个固定大小的圆柱体来确定抓取位姿参数,而忽略了不同大小尺度的特征对抓取位姿估计的影响.针对这一问题,本文提出了一个多尺度圆柱体注意力特征融合模块(Ms-CAFF),包含注意力融合模块和门控单元两个核心模块,替代了GSNet中原始的特征提取方法,使用注意力机制有效地融合4个不同大小圆柱体空间内部的几何特征,从而增强了网络对不同尺度几何特征的感知能力.在大规模杂乱场景抓取位姿检测数据集GraspNet-1Billion的实验结果表明,在引入模块后将网络生成抓取位姿的精度最多提高了10.30%和6.65%.同时本文将网络应用于实际实验,验证了方法在真实场景当中的有效性. 展开更多
关键词 点云 机器人抓取位姿检测 多尺度特征融合 杂乱场景 注意力机制
下载PDF
面向平层多房间的内墙作业移动机器人路径规划
16
作者 靳徐明 林云汉 +1 位作者 张磊 闵华松 《计算机系统应用》 2024年第5期254-261,共8页
本文针对多房间的移动机器人内墙作业的路径规划任务,提出一种两阶段路径规划方法.第1阶段针对沿墙作业过程中环境存在灰尘或雾气造成的传感器失效问题,以及房间多出口时路径规划不完整问题,我们提出起点自动选择沿墙路径规划方法,基于... 本文针对多房间的移动机器人内墙作业的路径规划任务,提出一种两阶段路径规划方法.第1阶段针对沿墙作业过程中环境存在灰尘或雾气造成的传感器失效问题,以及房间多出口时路径规划不完整问题,我们提出起点自动选择沿墙路径规划方法,基于栅格地图离线生成沿墙规划路径.第2阶段,针对点到点路径规划过程中的动态避障问题,我们提出一种基于PSAC (prioritized experience replay soft actor critic)算法的点到点路径规划方法,在软行动者-评论家(soft actor critic,SAC)的中引入优先级经验回放策略,实现机器人的动态避障.实验部分设计了沿墙路径规划对比实验和动态避障的对比实验,验证本文所提出的方法在室内沿墙路径规划和点到点路径规划的有效性. 展开更多
关键词 两阶段路径规划方法 沿墙路径规划 强化学习 PSAC
下载PDF
动态船舶行驶场景下的实时单目测距算法研究 被引量:4
17
作者 夏红杰 陈姚节 +1 位作者 徐新 王薇 《计算机技术与发展》 2022年第2期167-171,共5页
为了利用单目视觉实时监测船舶行驶过程中与周围船舶之间的距离,首先分析单目视觉测距现状及其成功应用实例,基于小孔成像原理建立单目相机模型,通过几何推导,得到世界坐标系、相机坐标系、图像坐标系及像素坐标系之间三层坐标转换关系... 为了利用单目视觉实时监测船舶行驶过程中与周围船舶之间的距离,首先分析单目视觉测距现状及其成功应用实例,基于小孔成像原理建立单目相机模型,通过几何推导,得到世界坐标系、相机坐标系、图像坐标系及像素坐标系之间三层坐标转换关系。随后通过实验验证pitch俯仰角与yaw水平角对单目视觉测距的影响程度,从而分析出动态船舶行驶场景下包括相机姿态、船舶在水面摇晃等实时单目测距误差。进而在引入包含俯仰角、水平角的相似三角形测距算法的基础上,采用高精度陀螺仪相机姿态补偿策略提出改进的基于单目视觉的相似三角形目标船舶测距算法。实验结果表明,该算法能在动态船舶行驶过程中较为准确地测量周围水域目标船舶之间的距离,可以满足船舶实时安全监测系统的要求。 展开更多
关键词 船舶工程 单目视觉 单目测距 陀螺仪标定 深度估计
下载PDF
一种面向药物-靶点相互作用预测的不平衡数据处理方法 被引量:1
18
作者 叶志威 张晓龙 林晓丽 《武汉科技大学学报》 CAS 北大核心 2022年第1期68-74,共7页
为了解决药物-靶点相互作用(DTI)预测中数据集样本分布不平衡的问题,提出了一种新的数据处理方法。通过词向量特征提取,将原始蛋白质序列信息和药物化学结构信息转换为低维向量特征,组合药物特征和靶点特征来表征药物-靶点相互作用;采用... 为了解决药物-靶点相互作用(DTI)预测中数据集样本分布不平衡的问题,提出了一种新的数据处理方法。通过词向量特征提取,将原始蛋白质序列信息和药物化学结构信息转换为低维向量特征,组合药物特征和靶点特征来表征药物-靶点相互作用;采用Borderline-SMOTE技术合成少数类样本,以改善数据集的样本分布;最后将处理好的数据输入到梯度提升决策树(GBDT)分类器中进行分类预测。实验结果表明,本文方法不仅能有效提取药物-靶点相互作用的特征,加快特征提取和特征选择的过程,还能缓解数据集的不平衡性对预测结果的不利影响,提高了预测模型的性能。 展开更多
关键词 不平衡数据处理 药物-靶点相互作用 词向量 特征提取 Borderline-SMOTE 梯度提升决策树
下载PDF
基于DCA算法的微博虚假信息检测 被引量:2
19
作者 杨超 项振辉 李涛 《计算机测量与控制》 2019年第3期183-187,191,共6页
通过对微博虚假信息的分析,基于DCA算法的思想,提出一种检测微博虚假信息的方法;以新浪微博为例,从虚假信息发布者的用户属性和虚假信息评论的文本内容两个方面进行分析;从用户方面选取用户的特征属性,如是否认证、有无简介、地址信息... 通过对微博虚假信息的分析,基于DCA算法的思想,提出一种检测微博虚假信息的方法;以新浪微博为例,从虚假信息发布者的用户属性和虚假信息评论的文本内容两个方面进行分析;从用户方面选取用户的特征属性,如是否认证、有无简介、地址信息是否详细、关注数、粉丝数等,从评论内容方面选取评论与微博内容的相关性、评论的支持性及其置信度等特征属性,将以上属性的分析结果作为区别虚假信息与真实信息的特征信号,并基于树突状细胞算法(Dendritic Cells Algorithm,DCA)实现新浪微博虚假信息的识别;使用新浪微博真实数据对算法有效性进行了验证和对比实验,结果表明该方法能够有效检测出新浪微博中的虚假信息,具有较高的检测准确率。 展开更多
关键词 微博 虚假信息 人工免疫 危险理论 树突状细胞算法
下载PDF
基于资源紧迫度的实时ETL弹性调度机制
20
作者 王萌 刘旋律 +1 位作者 高峰 顾进广 《计算机应用研究》 CSCD 北大核心 2021年第7期2118-2124,共7页
在ETL系统中,当数据生产速度遇到较大的波动时,为了使现有资源在有限的条件下极大程度地满足用户的使用需求,提出了基于资源紧迫度的ETL弹性调度机制。首先,构建基于历史数据的时间序列预测模型,用来预测数据生产速度;然后,根据各个ETL... 在ETL系统中,当数据生产速度遇到较大的波动时,为了使现有资源在有限的条件下极大程度地满足用户的使用需求,提出了基于资源紧迫度的ETL弹性调度机制。首先,构建基于历史数据的时间序列预测模型,用来预测数据生产速度;然后,根据各个ETL过程提交的资源清单和各个服务器负载情况,对单个用户的多个ETL过程的资源进行调整。该调度机制将资源调度问题转换为多维背包问题,提出了基于资源紧迫度的动态调度算法。实验结果表明,当用户资源对所有的ETL过程稀缺的时候,该调度算法会使资源得到更好的利用。通过实验验证了弹性调度比传统的调度方式在资源利用方面具有优势。 展开更多
关键词 实时ETL 弹性调度 资源调度 多维背包
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部