期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于多演化特征的社交网络链路预测算法
1
作者 何玉林 赖俊龙 +2 位作者 崔来中 黄哲学 尹剑飞 《模式识别与人工智能》 EI CSCD 北大核心 2024年第7期597-612,共16页
社交网络链路预测旨在根据已知的网络信息预测未来的链接关系,在推荐系统和合著网络中具有重要作用.然而,现有链路预测算法往往忽视社交网络的多元演化特点,训练时间复杂度较高,限制其执行效率.针对上述问题,文中提出基于多演化特征的... 社交网络链路预测旨在根据已知的网络信息预测未来的链接关系,在推荐系统和合著网络中具有重要作用.然而,现有链路预测算法往往忽视社交网络的多元演化特点,训练时间复杂度较高,限制其执行效率.针对上述问题,文中提出基于多演化特征的社交网络链路预测算法(Multi-evolutionary Features Based Link Prediction Algorithm for Social Network,MEF-LP).首先,设计一种简单高效的时间极限学习机模型,利用门控网络和极限学习机自编码器传递与聚合社交网络快照序列的时间信息.然后,构建多个深度极限学习机,对时间特征进行多角度映射,挖掘社交网络不同的演化特征,并最终融合成综合演化特征.最后,使用基于极限学习机的分类器完成链路预测.在6个真实社交网络上的实验表明,MEF-LP能合理学习社交网络的多演化特征,并获得较优的预测性能. 展开更多
关键词 社交网络分析 链路预测 多元演化 网络快照 极限学习机
下载PDF
基于大数据随机样本划分的分布式观测点分类器
2
作者 李旭 何玉林 +2 位作者 崔来中 黄哲学 PHILIPPE Fournier-Viger 《计算机应用》 CSCD 北大核心 2024年第6期1727-1733,共7页
观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数... 观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数据的随机样本划分(RSP)的分布式OPC(DOPC)。首先,在分布式计算环境下生成大数据的RSP数据块,并将它转换为弹性分布式数据集(RDD);其次,在RSP数据块上协同式地训练一组OPC,由于每个RSP数据块上的OPC独立训练,因此有高效的Spark可实现性;最后,在Spark框架下将在RSP数据块上协同训练的OPC集成为DOPC,对新样本进行类标签预测。在8个大数据集上,对Spark集群环境下实现的DOPC的可行性、合理性和有效性进行实验验证,实验结果显示,DOPC能够以更低的计算消耗获得比单机OPC更高的测试精度,同时相较于Spark框架下实现的基于RSP模型的神经网络(NN)、决策树(DT)、朴素贝叶斯(NB)和K最近邻(KNN),DOPC分类器具有更强的泛化性能。测试结果表明,DOPC是一种高效低耗的处理大数据分类问题的有监督学习算法。 展开更多
关键词 大数据分类 分布式文件系统 随机样本划分 观测点分类器 Spark计算框架
下载PDF
基于分类风险的半监督集成学习算法
3
作者 何玉林 朱鹏辉 +1 位作者 黄哲学 PHILIPPE Fournier-Viger 《模式识别与人工智能》 EI CSCD 北大核心 2024年第4期339-351,共13页
针对当前半监督集成学习算法对无标记样本预测时容易出现的标注混沌问题,文中提出基于分类风险的半监督集成学习算法(Classification Risk-Based Semi-supervised Ensemble Learning Algorithm,CR-SSEL).采用分类风险作为无标记样本置... 针对当前半监督集成学习算法对无标记样本预测时容易出现的标注混沌问题,文中提出基于分类风险的半监督集成学习算法(Classification Risk-Based Semi-supervised Ensemble Learning Algorithm,CR-SSEL).采用分类风险作为无标记样本置信度的评判标准,可有效衡量样本标注的不确定性程度.迭代地训练分类器,对高置信度样本进行再强化,使样本标注的不确定性逐渐降低,增强半监督集成学习算法的分类性能.在多个标准数据集上验证CR-SSEL的学习参数影响、训练过程收敛和泛化性能提升,实验表明随着基分类器个数的增加,CR-SSEL的训练过程呈收敛趋势,获得较优的分类精度. 展开更多
关键词 半监督集成学习 集成学习 半监督学习 分类风险 不确定性 置信度
下载PDF
针对大规模动态图流三角形计数的边哈希分布式抽样算法
4
作者 何玉林 吴波 +2 位作者 吴定明 黄哲学 菲律普弗尼尔-维格 《计算机研究与发展》 EI CSCD 北大核心 2024年第8期1882-1903,共22页
三角形计数是大图分析的一个经典问题,近年的研究工作主要集中在针对静态流式图的三角形数量估计上,相关流式图抽样算法只能处理边的插入操作,无法处理边的删除操作;而现有的动态流式图抽样算法估计准确性又偏低.针对上述问题,提出了基... 三角形计数是大图分析的一个经典问题,近年的研究工作主要集中在针对静态流式图的三角形数量估计上,相关流式图抽样算法只能处理边的插入操作,无法处理边的删除操作;而现有的动态流式图抽样算法估计准确性又偏低.针对上述问题,提出了基于边哈希分配的分布式抽样(edge hashing assignmentbased distributed sampling,EHADS)算法,它是一个用于估计动态流式图中三角形数量的分布式流算法,可以快速准确地估计动态流式图中的全局三角形数量以及每个顶点的局部三角形数量.EHADS算法只对输入的图流进行1次处理,并在多台机器上对边进行抽样.与先进的单机流算法相比,EHADS算法具有2点优势:1)在相同样本容量的情况下,EHADS算法以更短的运行时间获得了更小的估计误差,估计全局三角形数量的误差平均降低了31.79%,估计局部三角形数量的误差平均降低了23.35%;2)EHADS算法能够提供流式图中三角形数量的无偏估计,并且严格的数学证明显示该无偏估计具有更小的方差. 展开更多
关键词 三角形计数 动态图流 边抽样 分布式流算法 边哈希分配
下载PDF
基于分类不确定性最小化的半监督集成学习算法 被引量:1
5
作者 何玉林 朱鹏辉 +1 位作者 黄哲学 Fournier-Viger PHILIPPE 《计算机科学》 CSCD 北大核心 2023年第10期88-95,共8页
半监督集成是将半监督学习与集成学习相结合的一种学习范式,它一方面通过无标记样本来提高集成学习的多样性,同时解决集成学习样本量不足的问题,另一方面集成多个分类器能够进一步提升半监督学习模型的性能。现有的研究从理论和实践两... 半监督集成是将半监督学习与集成学习相结合的一种学习范式,它一方面通过无标记样本来提高集成学习的多样性,同时解决集成学习样本量不足的问题,另一方面集成多个分类器能够进一步提升半监督学习模型的性能。现有的研究从理论和实践两个角度证明了半监督学习与集成学习之间的互益性。针对当前半监督集成学习算法对无标记样本信息利用不完全的缺陷,文中提出了一种新的基于分类不确定性最小化的半监督集成学习(Classification Uncertainty Minimization-Based Semi-Supervised Ensemble Learning,CUM-SSEL)算法,它引入信息熵作为对无标记样本进行打标的置信度评判标准,通过最小化无标记样本打标过程中的不确定性迭代地训练分类器,实现对无标记样本的高效利用,以增强分类器的泛化性能。在标准的实验数据集上对CUM-SSEL算法的可行性、合理性和有效性进行了验证,实验表明:随着基分类器的增加,CUM-SSEL算法的训练呈现收敛的趋势,同时它能够获得优于Self-Training,Co-Training,Tri-Training,Semi-Boost,Vote-Training,Semi-Bagging以及CST-Voting算法的分类精度。 展开更多
关键词 半监督集成学习 集成学习 半监督学习 分类不确定性 置信度 信息熵
下载PDF
基于统计感知策略的高斯混合模型求解方法 被引量:1
6
作者 陈佳琪 何玉林 +1 位作者 黄哲学 FOURNIER-VIGER Philippe 《数据采集与处理》 CSCD 北大核心 2023年第3期525-538,共14页
高斯混合模型(Gaussian mixture model,GMM)是一种经典的概率模型,常被用于无监督学习领域来确定无类别标记样本点的类别分布。作为求解GMM参数的重要技术,期望最大化(Expectation maximization,EM)算法通过计算GMM对应似然函数的最优... 高斯混合模型(Gaussian mixture model,GMM)是一种经典的概率模型,常被用于无监督学习领域来确定无类别标记样本点的类别分布。作为求解GMM参数的重要技术,期望最大化(Expectation maximization,EM)算法通过计算GMM对应似然函数的最优解确定基模型自身参数以及基模型的混合系数。利用EM算法求解GMM存在如下两个缺陷:EM算法易于陷入局部最优解以及EM算法确定GMM基模型相关参数的不稳定,尤其是针对多维随机变量。本文提出了一种基于统计感知(Statistical⁃aware,SA)策略的GMM求解方法——SA⁃GMM方法。该方法从估计给定数据集的未知概率密度函数入手,建立了核密度估计(Kernel density estimation,KDE)与GMM之间的关联。为避免KDE对“过平滑”窗口的选取,设计了同时最小化KDE与GMM之间的经验风险和KDE窗口结构风险的目标函数,进而确定了GMM的最优参数。在11个标准概率分布上的实验证明了SA⁃GMM方法的可行性、合理性和有效性,同时结果也表明SA⁃GMM能够获得显著优于基于EM算法的GMM及其变体的概率密度函数估计表现。 展开更多
关键词 高斯混合模型 概率密度函数估计 统计感知 经验风险 结构风险 粒子群优化
下载PDF
基于数据生成模型的仿真样本点插补方法
7
作者 何玉林 陈佳琪 +2 位作者 徐贺鹏 黄哲学 尹剑飞 《系统仿真学报》 CAS CSCD 北大核心 2023年第9期1948-1964,共17页
为解决插补的仿真样本点与真实样本点概率分布不一致的问题,提出了基于数据生成模型的仿真样本点插补方法。基于高斯混合模型构建真实样本点的数据生成模型,其对应的高斯混合模型构件数通过多模型融合的策略确定;利用在真实样本点上获... 为解决插补的仿真样本点与真实样本点概率分布不一致的问题,提出了基于数据生成模型的仿真样本点插补方法。基于高斯混合模型构建真实样本点的数据生成模型,其对应的高斯混合模型构件数通过多模型融合的策略确定;利用在真实样本点上获得的数据生成模型插补所需的仿真样本点,其中数据生成模型的构件以及构件权重用于控制仿真样本点的生成方式。在20个多模多维混合分布上对新方法的可行性和有效性进行了验证,实验结果表明,与随机样本点插补、合成少类过采样技术及其两种最新的变体等4种方法相比,本文方法能够获得更具概率分布一致性的仿真样本点,证实该方法是一种合理的仿真样本点插补方法。 展开更多
关键词 仿真样本点插补 数据生成模型 高斯混合模型 合成少类过采样技术 概率分布一致
下载PDF
不同后固定时间对脑组织免疫荧光染色效果的影响
8
作者 牟秋月 陈森耀 +4 位作者 黄浙学 潘永良 沈俊媛 石依蕾 叶梦凡 《江西师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期242-245,共4页
为探讨延长后固定时间是否能改善在体快速灌注固定后脑组织的免疫荧光染色效果,该文用雄性长爪沙鼠(Meriones unguiculatus)经心脏升主动脉插入灌注针,依次快速灌注4℃生理盐水和质量分数为4%的多聚甲醛溶液,断头取脑,分别浸泡于质量分... 为探讨延长后固定时间是否能改善在体快速灌注固定后脑组织的免疫荧光染色效果,该文用雄性长爪沙鼠(Meriones unguiculatus)经心脏升主动脉插入灌注针,依次快速灌注4℃生理盐水和质量分数为4%的多聚甲醛溶液,断头取脑,分别浸泡于质量分数为4%的多聚甲醛溶液中固定24 h和72 h后进行30μm厚冰冻切片和免疫荧光染色,观察并比较后固定24 h和72 h下丘脑室旁核(PVN)OT免疫阳性神经元胞体数量、下丘脑前部(AH)免疫阳性神经纤维密度及其形态学结构.研究结果表明:后固定72 h组的PVN OT免疫阳性神经元胞体数量以及AH免疫阳性纤维密度均高于后固定24 h组的.与后固定24 h组相比,后固定72 h组的OT免疫阳性神经元胞体形态更加完整,境界更加清晰,神经元核周和突起免疫荧光标记强度更强.且后固定72 h组OT免疫阳性神经纤维形态比后固定24 h组的更清晰、更连续,呈串珠状.在快速灌注固定后延长后固定时间有助于改善免疫荧光染色效果. 展开更多
关键词 快速灌注 后固定 催产素 免疫荧光 染色效果
下载PDF
大数据随机样本划分模型及相关分析计算技术 被引量:16
9
作者 黄哲学 何玉林 +1 位作者 魏丞昊 张晓亮 《数据采集与处理》 CSCD 北大核心 2019年第3期373-385,共13页
设计了一种新的适用于大数据的管理和分析模型大数据随机样本划分(Random samplepartition,RSP)模型,它是将大数据文件表达成一系列RSP数据块文件的集合,分布存储在集群节点上。RSP的生成操作使每个RSP数据块的分布与大数据的分布保持... 设计了一种新的适用于大数据的管理和分析模型大数据随机样本划分(Random samplepartition,RSP)模型,它是将大数据文件表达成一系列RSP数据块文件的集合,分布存储在集群节点上。RSP的生成操作使每个RSP数据块的分布与大数据的分布保持统计意义上的一致,因此,每个RSP数据块是大数据的一个随机样本数据,可以用来估计大数据的统计特征,或建立大数据的分类和回归模型。基于RSP模型,大数据的分析任务可以通过对RSP数据块的分析来完成,不需要对整个大数据进行计算,极大地减少了计算量,降低了对计算资源的要求,提高了集群系统的计算能力和扩展能力。本文首先给出RSP模型的定义、理论基础和生成方法;然后介绍基于RSP数据块的渐近式集成学习Alpha计算框架;之后讨论基于RSP模型和Alpha框架的大数据分析相关计算技术,包括:数据探索与清洗、概率密度函数估计、有监督子空间学习、半监督集成学习、聚类集成和异常点检测;最后讨论RSP模型在分而治之大数据分析和抽样方法上的创新,以及RSP模型和Alpha计算框架实现大规模数据分析的优势。 展开更多
关键词 大数据 随机样本划分 渐近式集成学习 人工智能
下载PDF
广泛性焦虑障碍心理治疗研究进展 被引量:8
10
作者 刘冰 王红梅 +2 位作者 余雨滋 黄浙学 潘永良 《全科护理》 2021年第19期2612-2615,共4页
总结广泛性焦虑症(generalized anxiety disorder,GAD)心理治疗方法,分析不同心理治疗的疗效及研究进展,为今后多角度、整合式运用各种心理疗法治疗GAD提供新思路。
关键词 广泛性焦虑障碍 心理治疗 综述
下载PDF
基于候选中心融合的多观测点I-nice聚类算法
11
作者 陈鸿杰 何玉林 +1 位作者 黄哲学 尹剑飞 《模式识别与人工智能》 EI CSCD 北大核心 2022年第4期348-362,共15页
伴随着问题场景数据在规模上的快速增长和构成上的复杂化,精确估计簇的个数和簇的中心点是当下聚类算法处理和分析复杂大规模数据的重要挑战.簇数及簇心的精确估计对于部分有参聚类算法、数据集整体复杂性度量和数据简化表示等都十分关... 伴随着问题场景数据在规模上的快速增长和构成上的复杂化,精确估计簇的个数和簇的中心点是当下聚类算法处理和分析复杂大规模数据的重要挑战.簇数及簇心的精确估计对于部分有参聚类算法、数据集整体复杂性度量和数据简化表示等都十分关键.文中在深入分析I-nice的基础上,提出基于候选中心融合的多观测点I-nice聚类算法.在原多观测点投影分治框架上采用混合高斯模型(Gaussian Mixture Model,GMM),结合粗细粒度最佳GMM搜索策略,实现数据子集的精确划分.此外,基于候选中心点分别到各观测点的距离值及最佳GMM,构造候选中心点的GMM构件向量,并设计一组闵可夫斯基距离对进行候选中心点间的相异度度量,实现基于GMM构件向量相异度的多观测点I-nice候选中心融合.不同于现有聚类算法,文中算法联合优化分治环节数据子集划分和候选中心集成这两个关键过程,实现成百上千个簇的精确高效估计.在真实数据集和仿真数据集上的一系列实验表明,文中算法能精确估计簇数和簇中心,具备较高的聚类精度.实验同时验证算法的有效性及在各类数据场景下的稳定性. 展开更多
关键词 无监督学习 观测点 I-nice 无参聚类 高斯混合模型
下载PDF
基于统计感知的大数据系统计算框架 被引量:5
12
作者 魏丞昊 黄哲学 何玉林 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2018年第5期441-443,共3页
为在一定计算资源条件下实现大数据可计算化,本研究提出一种基于统计感知思想的Tbyte级大数据系统计算框架Bigdata-α,该框架的核心为大数据随机样本划分模型和逼近式集成学习模型.前者保证了划分后每个子数据块所包含的样本与大数据总... 为在一定计算资源条件下实现大数据可计算化,本研究提出一种基于统计感知思想的Tbyte级大数据系统计算框架Bigdata-α,该框架的核心为大数据随机样本划分模型和逼近式集成学习模型.前者保证了划分后每个子数据块所包含的样本与大数据总体概率分布的一致性.后者通过分析若干个随机样本数据块替代了Tbyte级全量数据分析.使用1 Tbyte模拟数据集验证随机样本划分模型的有效性,通过逐渐增加随机样本块的个数,提升了Higgs数据集基分类器的分类准确度,证明该方法能克服大数据分析中计算资源的限制瓶颈. 展开更多
关键词 计算机系统结构 大数据 随机样本划分 逼近式集成学习 并行分布式计算 分布式处理系统
下载PDF
大小鼠多种连续微量采血法的比较 被引量:2
13
作者 黄浙学 朱青青 +3 位作者 余雨滋 潘永良 周梓欣 伍爽 《江西师范大学学报(自然科学版)》 CAS 北大核心 2022年第2期164-170,共7页
连续微量采血可在无须处死动物的情况下追踪血样生化指标的动态变化,相比于一次性大采血可有效减少实验动物的使用量.该文查阅近年来相关资料,对大小鼠各种微量采血方式、优缺点以及注意事项进行了总结,旨在优化采血步骤、提高血样标本... 连续微量采血可在无须处死动物的情况下追踪血样生化指标的动态变化,相比于一次性大采血可有效减少实验动物的使用量.该文查阅近年来相关资料,对大小鼠各种微量采血方式、优缺点以及注意事项进行了总结,旨在优化采血步骤、提高血样标本采集质量,从而保证实验数据的科学性和准确性,同时给予实验动物良好的福利条件. 展开更多
关键词 微量采血法 研究进展 大小鼠
下载PDF
Method for improving MapReduce performance by prefetching before scheduling
14
作者 张霄宏 Feng Shengzhong +1 位作者 Fan Jianping huang zhexue 《High Technology Letters》 EI CAS 2012年第4期343-349,共7页
In this paper, a prefetching technique is proposed to solve the performance problem caused by remote data access delay. In the technique, the map tasks which will cause the delay are predicted first and then the input... In this paper, a prefetching technique is proposed to solve the performance problem caused by remote data access delay. In the technique, the map tasks which will cause the delay are predicted first and then the input data of these tasks will be preloaded before the tasks are scheduled. During the execution, the input data can be read from local nodes. Therefore, the delay can be hidden. The technique has been implemented in Hadoop-0. 20.1. The experiment results have shown that the technique reduces map tasks causing delay, and improves the performance of Hadoop MapRe- duce by 20%. 展开更多
关键词 cloud computing distributed computing PREFETCHING MAPREDUCE SCHEDULING
下载PDF
大跨四车道隧道围岩稳定性分析及控制指标研究
15
作者 黄哲学 刘伟 刘敏 《广东公路交通》 2024年第5期53-59,共7页
四车道隧道具有扁平、开挖面积大、薄拱等特点,开挖后围岩松动圈较大,围岩自稳能力较差,变形规律较复杂。目前针对大跨四车道隧道的监控量测控制指标暂未有统一标准,因此制定一套符合四车道隧道实际的控制指标值,有利于项目施工质量、... 四车道隧道具有扁平、开挖面积大、薄拱等特点,开挖后围岩松动圈较大,围岩自稳能力较差,变形规律较复杂。目前针对大跨四车道隧道的监控量测控制指标暂未有统一标准,因此制定一套符合四车道隧道实际的控制指标值,有利于项目施工质量、进度及安全。本文依托某高速公路改扩建项目开展研究工作,该项目新建四车道隧道6座,隧道最大开挖宽度22.6m,最大开挖面积254.54m^(2),全工序机械化高度配套,施工技术难度高。本文通过研究相关规范及标准,掌握监控量测控制指标的一般规定,采用新设备、新方法对四车道隧道进行变形及应力监测,在现场实测数据统计分析成果的基础上,结合数值模拟计算分析,建立自动化监测系统及信息化反馈平台,针对不同围岩级别、不同开挖工法,提出某项目大跨四车道隧道监控量测控制指标和四级预警体系,实时对围岩稳定性进行分析和判定,实际应用效果较好,可有效指导现场施工,同时也为后续其他类似改扩建工程大跨四车道隧道的建设提供借鉴。 展开更多
关键词 大跨四车道 围岩稳定性 控制指标 分级预警
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部