提出了一种基于双层双向长短时记忆网络(bi-directional long short term memory,BiLSTM)和自注意力(self-attention)机制的药物-药物相互作用(drug-drug interactions,DDIs)预测方法SA-BiLSTM。首先,利用FP3指纹、MACCS指纹、Pubchem...提出了一种基于双层双向长短时记忆网络(bi-directional long short term memory,BiLSTM)和自注意力(self-attention)机制的药物-药物相互作用(drug-drug interactions,DDIs)预测方法SA-BiLSTM。首先,利用FP3指纹、MACCS指纹、Pubchem指纹和PaDEL分子描述符对药物特征信息进行提取。其次,使用套索回归(least absolute shrinkage and selection operator,Lasso)方法消除对分类无关的特征,并利用重复编辑最近邻(repeated edited nearest neighbors,RENN)方法对数据进行平衡处理,得到最优特征向量。最后,将最优特征向量输入结合自注意力机制和双向长短时记忆网络的分类器预测DDIs。基于五折交叉验证,同时与其它预测方法进行比较,本工作所提出的方法在两个数据集上获得较高的预测准确率。为了综合评价SA-BiLSTM的性能,对药物-药物相互作用网络进行验证。实验结果表明,SA-BiLSTM表现出优秀的预测能力,可以为DDIs的预测提供一种新的思路。展开更多
针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(sin...针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(singular spectrum analysis,SSA)双重分解的双向长短时记忆网络(bidirectional long and short time memory,BiLSTM)预测模型。首先,采用CEEMDAN对历史负荷进行分解,以得到若干个周期规律更为清晰的子序列;再利用多尺度熵(multiscale entropy,MSE)计算所有子序列的复杂程度,根据不同时间尺度上的样本熵值将相似的子序列重构聚合;然后,利用SSA去噪的功能,对高度复杂的新序列进行二次分解,去除序列中的噪声并提取更为主要的规律,从而进一步提高中长序列预测精度;再将得到的最终一组子序列输入BiLSTM进行预测;最后,考虑到天气、节假日等外部因素对电力负荷的影响,提出了一种误差修正技术。选取了巴拿马某地区的用电负荷进行实验,实验结果表明,经过双重分解可以将均方根误差降低87.4%;预测未来一年的负荷序列时,采用的BiLSTM模型将拟合系数最高提高2.5%;所提出的误差修正技术可将均方根误差降低9.7%。展开更多
文摘提出了一种基于双层双向长短时记忆网络(bi-directional long short term memory,BiLSTM)和自注意力(self-attention)机制的药物-药物相互作用(drug-drug interactions,DDIs)预测方法SA-BiLSTM。首先,利用FP3指纹、MACCS指纹、Pubchem指纹和PaDEL分子描述符对药物特征信息进行提取。其次,使用套索回归(least absolute shrinkage and selection operator,Lasso)方法消除对分类无关的特征,并利用重复编辑最近邻(repeated edited nearest neighbors,RENN)方法对数据进行平衡处理,得到最优特征向量。最后,将最优特征向量输入结合自注意力机制和双向长短时记忆网络的分类器预测DDIs。基于五折交叉验证,同时与其它预测方法进行比较,本工作所提出的方法在两个数据集上获得较高的预测准确率。为了综合评价SA-BiLSTM的性能,对药物-药物相互作用网络进行验证。实验结果表明,SA-BiLSTM表现出优秀的预测能力,可以为DDIs的预测提供一种新的思路。
文摘针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(singular spectrum analysis,SSA)双重分解的双向长短时记忆网络(bidirectional long and short time memory,BiLSTM)预测模型。首先,采用CEEMDAN对历史负荷进行分解,以得到若干个周期规律更为清晰的子序列;再利用多尺度熵(multiscale entropy,MSE)计算所有子序列的复杂程度,根据不同时间尺度上的样本熵值将相似的子序列重构聚合;然后,利用SSA去噪的功能,对高度复杂的新序列进行二次分解,去除序列中的噪声并提取更为主要的规律,从而进一步提高中长序列预测精度;再将得到的最终一组子序列输入BiLSTM进行预测;最后,考虑到天气、节假日等外部因素对电力负荷的影响,提出了一种误差修正技术。选取了巴拿马某地区的用电负荷进行实验,实验结果表明,经过双重分解可以将均方根误差降低87.4%;预测未来一年的负荷序列时,采用的BiLSTM模型将拟合系数最高提高2.5%;所提出的误差修正技术可将均方根误差降低9.7%。