科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预...科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预测性能的提升是现阶段亟待解决的主要问题。针对上述问题,提出了针对多元时序数据的特征再抽象(Feature Re-Abstraction,FRA)算法,首先通过RobustSTL分解算法提取趋势性和季节性特征(Trend and Seasonality Features,TSFs),实现多元数据的特征二阶抽象,以“抽象即特征”替代传统“标签即特征”的提取策略,再通过Pearson相关系数的运算结果评估再抽象技术捕捉的TSFs与目标参数间的相关强度,证实TSF的数据价值。在FRA算法的基础上结合深度学习模型构建基于数据驱动的多元时序预测算法,通过预测效果验证FRA算法的有效性。实验结果表明,引入TSFs作为数据驱动模型的训练向量能够兼具数据降维、降噪及强相关特性地维持,从而避免模型过拟合并缓解模型欠拟合,提高时序预测算法的准确性和鲁棒性。展开更多
目的检测细胞外调节蛋白激酶(extracellular signal regulated protein kinase,ERK)、(Fos related antigen-1,Fra-1)基因在喉鳞状细胞癌(laryngeal squamous carcinoma cell,LSCC)中表达情况,观察喉癌Hep-2细胞中应用ERK抑制后Fra-1表...目的检测细胞外调节蛋白激酶(extracellular signal regulated protein kinase,ERK)、(Fos related antigen-1,Fra-1)基因在喉鳞状细胞癌(laryngeal squamous carcinoma cell,LSCC)中表达情况,观察喉癌Hep-2细胞中应用ERK抑制后Fra-1表达变化,分析LSCC中Fra-1表达在多个参数组别中的影响。方法采用免疫组化SP法检测47例LSCC和21例癌旁组织中ERK和Fra-1表达情况,逆转录-多聚酶链反应(reverse transcription-polymerase chain reaction,RT-PCR)检测加入ERK抑制剂(SCH772984)实验组与对照组的人喉癌Hep-2细胞中Fra-1 mRNA表达量,分析LSCC中Fra-1基因蛋白表达与各参数的关系。结果 LSCC中ERK、Fra-1蛋白表达均高于癌旁组织ERK(P<0.01),Fra-1(P<0.05),实验组中Fra-1mRNA表达量明显低于对照组(P<0.01)。LSCC中Fra-1蛋白水平表达与临床分期、淋巴结转移、吸烟相关,与病理分级、年龄、解剖分区无关。结论 LSCC中ERK、Fra-1蛋白水平表达均增高,Hep-2细胞中ERK基因受抑制后明显降低Fra-1基因的表达活性。ERK和Fra-1基因之间可能关联表达促进喉癌的发生与发展。展开更多
文摘科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预测性能的提升是现阶段亟待解决的主要问题。针对上述问题,提出了针对多元时序数据的特征再抽象(Feature Re-Abstraction,FRA)算法,首先通过RobustSTL分解算法提取趋势性和季节性特征(Trend and Seasonality Features,TSFs),实现多元数据的特征二阶抽象,以“抽象即特征”替代传统“标签即特征”的提取策略,再通过Pearson相关系数的运算结果评估再抽象技术捕捉的TSFs与目标参数间的相关强度,证实TSF的数据价值。在FRA算法的基础上结合深度学习模型构建基于数据驱动的多元时序预测算法,通过预测效果验证FRA算法的有效性。实验结果表明,引入TSFs作为数据驱动模型的训练向量能够兼具数据降维、降噪及强相关特性地维持,从而避免模型过拟合并缓解模型欠拟合,提高时序预测算法的准确性和鲁棒性。