期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
针对宫颈异常细胞检测的 SER-DC YOLO
1
作者 李超炜 杨晓娜 +1 位作者 赵司琦 何勇军 《哈尔滨理工大学学报》 CAS 北大核心 2024年第1期115-123,共9页
由于宫颈细胞样本的液基薄层细胞学检测(thin prep cytologic test,TCT)图像内容复杂,背景颜色丰富多样,而且不同女性的宫颈细胞具有一定程度的天然差异,这给宫颈异常细胞的检测带来了很大的困难。为解决这一难题,提出了一种名为基于特... 由于宫颈细胞样本的液基薄层细胞学检测(thin prep cytologic test,TCT)图像内容复杂,背景颜色丰富多样,而且不同女性的宫颈细胞具有一定程度的天然差异,这给宫颈异常细胞的检测带来了很大的困难。为解决这一难题,提出了一种名为基于特征压缩与激发和可变形卷积(SE-ResNet-deformable convolution you only look once,SER-DC YOLO)的目标检测网络。该网络在YOLOv5的Backbone中融合注意力机制,添加了SE-ResNet模块,然后改进了SPP层的网络结构,并且使用可变形卷积来替换普通卷积,最后修改了边界框的损失计算函数,将广义交并比(generalized intersection over union,GIoU)改为α-IOU Loss。实验表明,该网络与YOLOv5网络相比,在宫颈图片数据集上召回率提高了19.94%,精度提高了3.52%,平均精度均值提高了7.19%。相关代码链接:https://github.com/sleepLion99/SER-DC_YOLO。 展开更多
关键词 SER-DC YOLO YOLOv5 目标检测 注意力机制 可变形卷积
下载PDF
基于MMTS-AdaBoost的高维结直肠癌癌前病变分类
2
作者 茅婷 张月义 +1 位作者 孙叶芳 虞岚婷 《计算机应用与软件》 北大核心 2024年第1期291-296,共6页
为实现通过提高癌前病变分类准确率,以降低结直肠癌的发生率和死亡率,提出一种基于MMTS-AdaBoost的高维数据分类算法,优化高维数据分类算法,提高分类性能。通过将本征正交思想引入马田系统,构建改进马田系统获取重要特征变量实现降维。... 为实现通过提高癌前病变分类准确率,以降低结直肠癌的发生率和死亡率,提出一种基于MMTS-AdaBoost的高维数据分类算法,优化高维数据分类算法,提高分类性能。通过将本征正交思想引入马田系统,构建改进马田系统获取重要特征变量实现降维。使用降维得到的特征,应用AdaBoost算法对癌前病变类型进行分类。实验结果表明,与使用降维处理的mrmr-AdaBoost和chisquare-AdaBoost算法,以及AdaBoost、BP网络、NB、SVM等经典分类算法相比,MMTS-AdaBoost的F1和G-mean更高,分类性能更优。 展开更多
关键词 结直肠癌癌前病变 高维数据分类 马田系统 ADABOOST 本征正交分解
下载PDF
基于深度学习的云模式机场客户行为预测
3
作者 段冬生 《现代科学仪器》 2024年第5期315-320,共6页
为提高航空运营管理效率,研究从云模式机场客户行为分析的角度,选择改进支持向量回归模型,预测机场旅客出行指数,选择先来先服务算法进行座位的推荐与分配。结果显示,当航班数为525次时,先来先服务算法的整体平均满意度大于0.800,大于... 为提高航空运营管理效率,研究从云模式机场客户行为分析的角度,选择改进支持向量回归模型,预测机场旅客出行指数,选择先来先服务算法进行座位的推荐与分配。结果显示,当航班数为525次时,先来先服务算法的整体平均满意度大于0.800,大于历史座位分配结果。云模式下的管理效率得分为0.75,比非云模式下大0.22。云模式下的满意度比非云模式下大0.24。研究方法能有效预测旅客出行指数,可促进旅客整体平均满意度的提高。 展开更多
关键词 云模式 深度学习 客户行为 出行指数
下载PDF
利用深度迁移学习靶向GPCRs的配体活性预测
4
作者 汤丽华 卢宁 +2 位作者 兰闯闯 陈荣华 吴建盛 《计算机工程与应用》 CSCD 北大核心 2023年第13期120-128,共9页
G蛋白偶联受体(GPCRs)是最重要的药物靶标之一,约占市场上药物靶标的34%。药物发现过程中,配体生物活性的准确建模和解释对于筛选苗头化合物至关重要。研究表明,同源的G蛋白偶联受体能提升配体分子生物活性的预测性能和可解释性。提出... G蛋白偶联受体(GPCRs)是最重要的药物靶标之一,约占市场上药物靶标的34%。药物发现过程中,配体生物活性的准确建模和解释对于筛选苗头化合物至关重要。研究表明,同源的G蛋白偶联受体能提升配体分子生物活性的预测性能和可解释性。提出了一种新的方法GLEM,用多任务下的深度迁移学习来预测配体的生物活性,并通过组稀疏来识别相关的关键子结构。GLEM方法在9组30个具有代表性的人类GPCR数据集上进行了实验,这些GPCRs涵盖了大部分人类GPCRs的子家族,每个GPCR数据集都包含60~3000个配体。实验结果表明,GLEM方法在绝大多数数据集中都获得了最好的性能。与单任务学习方法相比,GLEM方法在r2上平均提升了31.72%;与深度学习方法相比,GLEM方法在r2上平均提升了22.45%。此外,还评估了不同数量的训练样本对模型性能的影响,实验发现GLEM方法在小样本情况下表现最好。 展开更多
关键词 G蛋白偶联受体(GPCRs) 扩展连通性指纹 配体活性 多任务学习 深度迁移学习
下载PDF
基于深度学习的学生课堂行为识别方法 被引量:4
5
作者 闫兴亚 匡娅茜 +1 位作者 白光睿 李月 《计算机工程》 CAS CSCD 北大核心 2023年第7期251-258,共8页
学生课堂行为动作能够直接反映课堂质量,通过人工智能和大数据对课堂行为进行分析和评估,有助于提高教学质量。传统的学生课堂行为识别方法通过老师直接观察学生状态,或者是课后通过监控视频进行分析,该课堂行为识别方法耗时耗力且识别... 学生课堂行为动作能够直接反映课堂质量,通过人工智能和大数据对课堂行为进行分析和评估,有助于提高教学质量。传统的学生课堂行为识别方法通过老师直接观察学生状态,或者是课后通过监控视频进行分析,该课堂行为识别方法耗时耗力且识别率较低,难以实时反映课堂以及考试中存在的问题。提出基于深度学习的姿态识别方法 BetaPose。采用数据增强技术提高后续检测模型的鲁棒性,通过改进的YOLOv5目标检测算法得到人体检测框,并基于MobileNetV3模型设计轻量级姿态识别模型,提高在拥挤场景下的姿态识别准确率,将得到的人体关键点图输入到线性分类器中,获得最终行为结果,有效提高模型的建模和表达能力。实验结果表明,所提轻量级姿态识别方法 BetaPose对人体各个部位的平均识别准确率最高可达82.6%,在简易和拥挤场景下对各种行为的识别率分别达到91%和85%以上,能够有效识别课堂的多种行为。 展开更多
关键词 计算机视觉 行为识别 目标检测 姿态识别 深度学习
下载PDF
基于BERT模型的糖尿病在线健康社区命名实体识别
6
作者 梁宇进 符传山 +3 位作者 陈劲松 陈铭 周跃 徐倩 《吉首大学学报(自然科学版)》 CAS 2023年第5期28-34,76,共8页
为了解决糖尿病患者-患者在线健康社区文本实体识别中的内容异质、复杂度高、无法准确理解上下文语义等问题,构建了BERT嵌入BiLSTM-CRF模型,来识别糖尿病社区“甜蜜家园”文本中的疾病、临床表现、药物、检验、身体部位和情绪这6类实体... 为了解决糖尿病患者-患者在线健康社区文本实体识别中的内容异质、复杂度高、无法准确理解上下文语义等问题,构建了BERT嵌入BiLSTM-CRF模型,来识别糖尿病社区“甜蜜家园”文本中的疾病、临床表现、药物、检验、身体部位和情绪这6类实体.训练过程中,BERT-BiLSTM-CRF模型的精确率为90.83%,召回率为76.30%,综合评估指标F1达到82.93%,显示出良好的识别效果. 展开更多
关键词 糖尿病 在线健康社区 命名实体识别 BERT模型
下载PDF
长尾分布下的宫颈细胞分割与分类框架
7
作者 杨晓娜 李超炜 +1 位作者 邵慧丽 何勇军 《哈尔滨理工大学学报》 CAS 北大核心 2023年第6期121-129,共9页
目前利用深度学习识别宫颈异常细胞有两个难题:(1)宫颈细胞种类多样且宫颈细胞图像因人而异;(2)宫颈细胞呈现长尾分布,影响宫颈细胞的分类精度。本文提出了一种基于深度学习的宫颈细胞分割与分类框架。本框架首先进行细胞核分割,使用U-... 目前利用深度学习识别宫颈异常细胞有两个难题:(1)宫颈细胞种类多样且宫颈细胞图像因人而异;(2)宫颈细胞呈现长尾分布,影响宫颈细胞的分类精度。本文提出了一种基于深度学习的宫颈细胞分割与分类框架。本框架首先进行细胞核分割,使用U-Net作为基础模型进行减层,加入AG模块,并使用ACBlock模块代替传统标准卷积块;然后使用ResNeSt对分割数据进行粗分类,将根据医生经验提取的人工特征和ResNeSt网络提取的机器特征进行融合进行细分类,利用主动学习迭代地扩充宫颈细胞类别,并在BBN模型中融合ACBlock模块处理长尾数据;最后根据TBS诊断标准和医生的诊断经验提炼出异常细胞的诊断指标,筛选异常细胞。实验表明,本文的分割算法较原方法提升了3.52%,加入所有特征的分类算法提升了1.2%。针对阳性病人,癌细胞诊断准确率达到91%。 展开更多
关键词 U-Net ResNeSt 细胞核分割 细胞核分类 长尾分布
下载PDF
细胞病理图像质量评价方法
8
作者 彭晨辉 刘皓晨 +1 位作者 高玮宁 何勇军 《哈尔滨理工大学学报》 CAS 北大核心 2023年第5期75-84,共10页
智能病理辅助诊断系统可以辅助医生诊断宫颈癌,筛除低质量的样本图像能够有效减少智能病理辅助诊断系统的漏诊和误诊,提高诊断的效率和准确率。目前智能辅助诊断领域没有完整的细胞病理图像质量评价的方法,因此提出一种细胞病理图像质... 智能病理辅助诊断系统可以辅助医生诊断宫颈癌,筛除低质量的样本图像能够有效减少智能病理辅助诊断系统的漏诊和误诊,提高诊断的效率和准确率。目前智能辅助诊断领域没有完整的细胞病理图像质量评价的方法,因此提出一种细胞病理图像质量评价方法。利用病理诊断知识和医生经验,归纳总结出图像质量评价指标,包括图像有效视野、栅格样成像、清晰度、染色标准、鳞状上皮细胞数量、细胞团面积和脏污面积占比等。首先针对图像有效视野和栅格样成像利用图像分割和图像纹理特征提取的方法进行评价;再采用引入通道注意力的ResNet-34模型对清晰度进行评价;然后对图像进行颜色反卷积处理,获得染色剂通道灰度值,用于判断细胞的染色是否标准;再通过目标检测模型Yolov5s,对鳞状上皮细胞、细胞团和脏污进行检测;最后利用回归模型为细胞图像质量评分,并将结果应用到智能辅助诊断项目中。实验表明,方法规范了细胞病理图像质量评价的流程,避免由于主观评价带来的差异,提高了病理诊断效率和准确率。 展开更多
关键词 智能病理辅助诊断系统 图像质量评价 金字塔图像 图像特征
下载PDF
基于组播通信的PBFT算法改进 被引量:1
9
作者 杨孝天 马冉 +1 位作者 李江 高飞 《电子技术应用》 2023年第2期67-71,共5页
PBFT算法存在通信复杂度高、性能受节点增加而下降等问题,引入组播通信应用于RPBFT(基于角色的拜占庭共识机制),提出了一种通信复杂度低、可以动态分配共识节点、不因节点数增加而性能下降的WRPBFT共识算法。WRPBFT将节点划分为共识节... PBFT算法存在通信复杂度高、性能受节点增加而下降等问题,引入组播通信应用于RPBFT(基于角色的拜占庭共识机制),提出了一种通信复杂度低、可以动态分配共识节点、不因节点数增加而性能下降的WRPBFT共识算法。WRPBFT将节点划分为共识节点和候选节点两类节点,动态地选取参与共识的共识节点进行组播通信。实验与分析表明,WRPBFT共识算法可以动态地实现节点的划分与选取,并且相较传统PBFT算法,WRPBFT算法具备更高吞吐量、更低的时延和更低的通信复杂度。 展开更多
关键词 PBFT 组播 P2P 区块链
下载PDF
基于增量宽度学习的投资组合风险控制模型
10
作者 陈良霞 李博 +3 位作者 王琪 余远 冯泽涛 贾颖 《统计理论与实践》 2023年第1期50-57,共8页
在线投资组合研究成为近年的热点,引起很多来自不同领域研究人员的关注。然而,金融市场的现有模型并未考虑增量学习、资产波动风险以及在特征值水平上消除系统噪声等问题。在宽度学习的基础上提出了一种在线增量学习模型,可以采用增量... 在线投资组合研究成为近年的热点,引起很多来自不同领域研究人员的关注。然而,金融市场的现有模型并未考虑增量学习、资产波动风险以及在特征值水平上消除系统噪声等问题。在宽度学习的基础上提出了一种在线增量学习模型,可以采用增量的方式进行在线学习。并提出了一种基于随机矩阵理论的去噪方法,从特征值维度上去消除系统噪声。实验结果表明,所提出的模型不仅能够在累积财富指标方面取得较好的效果,同时在其他指标如夏普比率、信息比率和卡尔马比率上均优于现有的常用模型。因此,该模型可以在有效控制风险的同时产生良好的累积收益。 展开更多
关键词 在线投资组合选择 宽度学习系统 累积回报 风险控制
下载PDF
基于地质大数据的泥石流灾害易发性评价 被引量:16
11
作者 张永宏 葛涛涛 +2 位作者 田伟 夏广浩 何静 《计算机应用》 CSCD 北大核心 2018年第11期3319-3325,共7页
在地质大数据背景下,为了更加精准、客观地评估泥石流易发程度,提出一种基于神经网络的区域泥石流易发性评价模型,并结合使用平均影响值算法(MIV)、遗传算法(GA)、Borderline-SMOTE算法提升模型精度。在预处理阶段使用Borderline-SMOTE... 在地质大数据背景下,为了更加精准、客观地评估泥石流易发程度,提出一种基于神经网络的区域泥石流易发性评价模型,并结合使用平均影响值算法(MIV)、遗传算法(GA)、Borderline-SMOTE算法提升模型精度。在预处理阶段使用Borderline-SMOTE算法处理非平衡数据集的分类问题,之后采用神经网络拟合主要指标与易发程度的非线性关系并结合遗传算法提升拟合速度,最后结合MIV算法定量分析指标与易发程度相关性。选取雅鲁藏布江中上游流域作为研究区域,实验结果显示,模型能够有效降低非平衡数据集的过拟合,优化原始输入维度,同时在拟合速度上有了很大提升。采用AUC指标检验评价结果,测试集的分类精度达到97.95%,说明模型能够在非平衡数据集下为评价研究区域泥石流易发程度提供参考。 展开更多
关键词 地质大数据 泥石流 易发性 平均影响值算法 遗传算法 Borderline-SMOTE算法
下载PDF
基于力学模型的曲面展开通用算法 被引量:6
12
作者 梁堰波 徐伟辰 +1 位作者 李吉刚 杨钦 《计算机工程与设计》 CSCD 北大核心 2012年第9期3539-3543,共5页
为了解决曲面展开算法实现复杂、累积误差和通用性不佳的缺点,提出一种在三维空间内基于能量模型的曲面展开算法,待展开的曲面以三角网格形式表示,将曲面简化为三角网格的顶点组成的质点系统,通过在每个质点上加上适当的力使得三角网格... 为了解决曲面展开算法实现复杂、累积误差和通用性不佳的缺点,提出一种在三维空间内基于能量模型的曲面展开算法,待展开的曲面以三角网格形式表示,将曲面简化为三角网格的顶点组成的质点系统,通过在每个质点上加上适当的力使得三角网格产生相应的变形,达到将曲面展开的效果。与现有算法相比,该曲面展开算法适用于任意形状曲面,不需要使用投影平面,整个变形完全由网格顶点受力来驱动,便于实现、适用面广、对于不可展曲面也能得到较好的展开效果,而不会出现裂纹现象。 展开更多
关键词 曲面展开 三角网格 力学模型 等距变换 EULER法
下载PDF
一种改进的A-KAZE算法在图像配准中的应用 被引量:10
13
作者 吴含前 李程超 谢珏 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第4期667-672,共6页
针对现有图像配准过程中难以保持图像的局部精度和边缘细节的问题,在A-KAZE算法的基础上提出了一种改进的图像特征提取算法AKAZE-ILDB.该算法首先利用非线性扩散滤波方程构造图像金字塔,采用快速显示扩散(FED)求得数值解,得到具有亚像... 针对现有图像配准过程中难以保持图像的局部精度和边缘细节的问题,在A-KAZE算法的基础上提出了一种改进的图像特征提取算法AKAZE-ILDB.该算法首先利用非线性扩散滤波方程构造图像金字塔,采用快速显示扩散(FED)求得数值解,得到具有亚像素精度的图像特征点坐标;然后利用改进的LDB(ILDB)描述子构造具有尺度和旋转不变性的图像特征向量,对特征向量采用汉明距离进行KNN匹配;最后基于仿射变换模型计算空间映射参数矩阵来实现图像配准.实验结果表明:在保持相同图像特征匹配正确率的情况下,AKAZE-ILDB算法比A-KAZE算法平均配准时间缩短了300 ms;在配准精度方面,比A-KAZE算法提高了3.7%,比传统特征提取算法SURF匹配正确率提高了29%. 展开更多
关键词 A-KAZE 非线性扩散滤波 FED KNN匹配 仿射变换
下载PDF
基于HBase和GeoTools的矢量空间数据存储模型研究 被引量:15
14
作者 郑坤 付艳丽 《计算机应用与软件》 CSCD 2015年第3期23-26,共4页
针对非结构化数据库HBase存储技术的研究,提出一种矢量空间数据存储模型,对现有的矢量空间数据格式进行转换存储,以解决云存储技术缺乏空间数据拓扑关系描述及不能直接存储矢量空间数据的问题。该模型利用了列模式和key/value映射的稀... 针对非结构化数据库HBase存储技术的研究,提出一种矢量空间数据存储模型,对现有的矢量空间数据格式进行转换存储,以解决云存储技术缺乏空间数据拓扑关系描述及不能直接存储矢量空间数据的问题。该模型利用了列模式和key/value映射的稀疏存储机制,并采用基于GeoTools中间件的思想对矢量空间数据展示其空间拓扑关系。在HBase集群上的实验表明,该模型克服了HBase存储技术在矢量空间数据存储方面的瓶颈,在其体现空间拓扑关系的前提下,对矢量空间数据可以直接存取和展示,提高了空间数据存储效率。 展开更多
关键词 矢量数据存储模型 HBASE GeoTools
下载PDF
二次剪枝算法在评论特征提取中的应用 被引量:2
15
作者 吴含前 周立凤 谢珏 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第3期513-517,共5页
针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东... 针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东网站上抓取摄像头产品的中文评论,选取其中1 000条作为试验数据,采用分词工具ICTCLAS对评论进行分词和数据预处理,并将所提算法与GSP算法、交叉语言模型(CLM)和似然比检验(LRT)进行对比试验.结果表明,利用所提算法获得的中文产品评论特征提取准确率达到76.37%,较GSP算法、CLM和LRT的准确率分别提高2.94%,5.77%和7.57%. 展开更多
关键词 特征提取 二次剪枝 词对共现度 似然比检验 交叉语言模型
下载PDF
遗传算法在试卷生成中的应用 被引量:2
16
作者 周莉 王珏 周勇 《江西师范大学学报(自然科学版)》 CAS 北大核心 2013年第6期579-583,共5页
试卷自动生成是一个多目标的问题,遗传算法可以搜索全局最优解,将遗传算法用于自动组卷算法中,并引入平衡算子和权重算子计算算法的概念,有效地解决难以寻求最优解的问题.实验结果表明:该算法有效地避免了通过一些常规的方法所造成的弊... 试卷自动生成是一个多目标的问题,遗传算法可以搜索全局最优解,将遗传算法用于自动组卷算法中,并引入平衡算子和权重算子计算算法的概念,有效地解决难以寻求最优解的问题.实验结果表明:该算法有效地避免了通过一些常规的方法所造成的弊端,并且提高了搜索全局最优解的能力,加快了收敛速度.该方法不仅在教育领域有一定的实用性,也具有潜在的应用价值. 展开更多
关键词 遗传算法 组卷 平衡算子 权重算子
下载PDF
基于快速多示例多标记学习的G蛋白偶联受体生物学功能预测 被引量:3
17
作者 吴建盛 冯巧遇 +3 位作者 袁京洲 胡海峰 周家特 高昊 《计算机研究与发展》 EI CSCD 北大核心 2018年第8期1674-1682,共9页
G蛋白偶联受体(G protein-coupled receptors,GPCRs)是人类中最庞大的膜蛋白家族,也是很多药物的重要靶点,准确了解GPCRs生物学功能是理解它们参与的生物学过程及其药物作用机制的关键.以前的研究表明,蛋白质功能预测可抽象为多示例多... G蛋白偶联受体(G protein-coupled receptors,GPCRs)是人类中最庞大的膜蛋白家族,也是很多药物的重要靶点,准确了解GPCRs生物学功能是理解它们参与的生物学过程及其药物作用机制的关键.以前的研究表明,蛋白质功能预测可抽象为多示例多标记学习(multi-instance multi-label learning,MIML)问题.设计了一种基于快速多示例多标记学习方法 MIMLfast的GPCRs生物学功能预测模型.该模型采用了一种新的混合特征,它考虑了GPCRs结构域的三联氨基酸、氨基酸关联、进化、二级结构关联、信号肽及无序残基等多种信息.实验结果证明,该模型获得了很好的性能,优于目前最优的多示例多标记学习、多标记学习的预测方法和CAFA蛋白质功能预测方法. 展开更多
关键词 G蛋白偶联受体 生物学功能预测 快速多示例多标记学习 结构域 混合特征
下载PDF
基于MapReduce和IFOA的并行密度聚类算法 被引量:3
18
作者 胡健 徐锴滨 毛伊敏 《计算机应用研究》 CSCD 北大核心 2021年第5期1336-1343,共8页
针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-... 针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-DBIFOA)。首先,该算法基于KD树,提出网格划分策略(divide gird based on KD tree,KDG)来自动划分数据网格;其次在局部聚类中,提出基于自适应搜索策略(step strategy based on knowledge learn,KLSS)和聚类判定函数(clustering criterion function,CCF)的果蝇群优化算法(improve fruit fly optimization algorithm,IFOA);然后根据IFOA进行局部聚类中最优参数的动态寻优,从而使局部聚类的聚类效果得到提升;同时结合MapReduce模型提出局部聚类算法DBIFOA(density-based clustering algorithm using IFOA);最后提出了基于QR-tree的并行合并局部簇算法(cluster merging algorithm by using MapReduce,MR-QRMEC),实现局部簇的并行合并,使算法整体的并行性能得到加强。实验表明,MR-DBIFOA在大数据下的并行效率更高,且聚类效果更好。 展开更多
关键词 大数据 密度聚类算法 KD树 果蝇优化
下载PDF
混合架构下多请求模式的缓存替换模型研究 被引量:2
19
作者 曹旻 刘文中 《计算机科学》 CSCD 北大核心 2015年第6期175-180,共6页
针对多类型多访问模式应用的需求,在GDSF算法的基础上,引入平均访问间隔和最近访问间隔两个特性以增强算法的适应性;建立缓存结构模型,通过双关键字索引机制,快速索引缓存对象,降低系统开销;对超过一定大小的文件采取后缀预取策略以增... 针对多类型多访问模式应用的需求,在GDSF算法的基础上,引入平均访问间隔和最近访问间隔两个特性以增强算法的适应性;建立缓存结构模型,通过双关键字索引机制,快速索引缓存对象,降低系统开销;对超过一定大小的文件采取后缀预取策略以增加缓存中数据对象的个数。在课题应用背景下,与传统算法的对比实验表明,该方法能够减少缓存的平均请求等待时间,提高对象命中率和字节命中率,增强了缓存替换算法对多类型多请求模式应用的适应性。 展开更多
关键词 访问模式 缓存策略 缓存模型 索引 平均请求等待时间 预取
下载PDF
面向不完备数据的民航旅客流失预测模型 被引量:2
20
作者 李国 袁闻 王怀超 《计算机工程与设计》 北大核心 2020年第10期2884-2891,共8页
为解决新一代民航旅客服务信息系统中数据缺失不能准确进行旅客流失预测的问题,考虑旅客流失预测任务与旅客缺失数据填补任务具有相关性,提出基于部分距离的SMOTE算法和基于降噪自编码器的多任务深度学习网络模型。基于部分距离的SMOTE... 为解决新一代民航旅客服务信息系统中数据缺失不能准确进行旅客流失预测的问题,考虑旅客流失预测任务与旅客缺失数据填补任务具有相关性,提出基于部分距离的SMOTE算法和基于降噪自编码器的多任务深度学习网络模型。基于部分距离的SMOTE算法在数据不完备场景下,对少数类别已流失旅客和准流失旅客进行过采样;设计的多任务深度学习网络模型利用逐层无监督训练和有监督微调,同时进行对缺失数据填补与民航旅客流失预测。实验结果表明,相比传统处理方法,该方法能有效提高数据质量和旅客流失预测的准确性。 展开更多
关键词 民航旅客服务信息系统 缺失值 旅客流失预测 多任务学习 降噪自编码器 SMOTE算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部