样条变换偏最小二乘在肝癌数据分类中的应用被引量：1

The classification of hepatocellular carcinoma data set with partial least squares base on spline transformation

下载PDF

导出

摘要肝癌是中国最常见的恶性肿瘤之一。基于肿瘤基因表达谱数据的分析与研究是当今研究的热点,对于癌症的早期诊断、治疗具有十分重要的意义。针对高维小样本基因表达谱数据所显现的变量间严重共线性、类别变量与预测变量的非线性关系,采用了基于样条变换的偏最小二乘回归新技术。首先通过筛选法去除基因表达谱数据中的冗余信息,然后以3次B基样条变换实现非线性基因表达谱数据的线性化重构,随后将重构的矩阵交由偏最小二乘法构建类别变量与预测变量间的关系模型。最后,通过对肝癌肿瘤基因表达谱数据的分析,结果显示此分类模型对数据重构稳健,有效的解决了高维小样本基因表达谱数据间的过拟合和变量间的共线性,具有较高的拟合和分类正确率。 Hepatocellular Carcinoma （HCC）is one of the most popular malignant tumors in the world. Recently, the research base on gene expression profile is a hot topic and has strong impact on HCC treatment and diagnosis. Owing to the severe collinearity among variables and the nonlinear relationship between predictor variables and response variables, a novel technology of Partial Least Squares （PLS）base on Spline Transformation （SPLINE-PLS）was adopted. The redundancy in gene expression profile should be eliminated through filter method. Then B-spline function of original non-linear space was transformed into new linear space by using non-linear transformation and the related model between new response variables and predictor variables built with PLS. By analysis of HCC data set, the result showed that this method could yield high accuracy in reconstructing gene data set and overcome the drawback of overfitting and collinearity between variables.

作者李建更李辉

机构地区北京工业大学电子信息与控制工程学院人工智能研究所

出处《生物学杂志》 CAS CSCD 2011年第6期58-61,共4页 Journal of Biology

基金北京市自然科学基金(Grant o.4092021) 北京市教育委员会科技计划项目(JC002011200903)

关键词基因表达谱样条变换偏最小二乘筛选法过拟合 gene expression profile spline transformation PLS filtering method overfitting

分类号 Q811.4 [生物学—生物工程]

引文网络
相关文献

参考文献13

1Parkin D M,Bray F,Ferlay J,et al.Global cacer statistics[J].CA Cancer J Clin,2002,55:74-108.
2El-Serag H B.Hepatocellular carcinoma:recent trends in the United States[J].Gastroenterology,2004,127[5 Suppl l]:27-34.
3Yoon S K.Recent advances in tumor marker of human hepatocel-lular carcinoma[J].Intervirology,2008,51 (Suppl 1); 34-41.
4Debruyne E N,Delanghe J R.Diagnosing and monitoring hepatocellular carcinoma with alpha-fetoprotein:new aspects and applications[J].Clin Chim Acta,2008,395(l-2):19-26.
5Sherman M.Hepatocellula cacinoma:epidemiology,risk factors and screening[J].Semin Liver Dis,2005,25:143-154.
6Nguyen D V,Rocke D.Tumor classification by partial least squares using microarray gene expression data[J].Bioinformatics,2002,18:39-50.
7Nguyen D V,Rocke D.Multi -class cancer classification via partial least squares with gene exprssion profiles[J].Bioinformatics,2002,18:1216-1226.
8Boulesteix A L,Strimmer K.Partial least squares:a versatile tool for the analysis of high-dimensional genomic data[J].Brifin gs in Bionfonnatics,2007,8(l):32-44.
9Wang H Q,Wong H S,Zhu H L,et al.A neural network-based biomarker association information extraction approach for cancer classification[J].Journal of Biomedical Informatics,2009,42:654-666.
10Tenenhaus A,Giron A,Viennet E,et al.Kernel logistic PLS:a tool for supervised nonlinear dimensionality reduction and binary classification[J].Computational Statistics & data Analysis,2007,51:4083-4100.

同被引文献22

1樊菊平,费良军.波涌灌间歇入渗减渗效果及影响因素研究[J].水土保持学报,2003,17(6):62-65. 被引量：1
2高昌珍,左月明,任开兴.小定额波涌沟灌技术要素的多目标模糊优化模型[J].农业工程学报,2006,22(10):16-20. 被引量：4
3尹娟,费良军,程东娟.循环率对波涌灌间歇入渗特性和地下水水质影响的研究[J].干旱地区农业研究,2007,25(4):146-150. 被引量：2
4雪静,王全九,毕远杰.微咸水间歇供水土壤入渗特征[J].农业工程学报,2009,25(5):14-19. 被引量：19
5任玉忠,董新光,吴彬,许璇.干旱区枣园土壤水分运动及深层渗漏数值模拟[J].节水灌溉,2010(9):24-26. 被引量：10
6徐培平,张奉学,符林春,李向阳,赵昉,赖小平.基于均匀设计-偏最小二乘回归建模的中药复方配伍规律研究方法[J].中草药,2011,42(4):819-824. 被引量：17
7王文焰,汪志荣,费良军,王全九,张建丰.波涌灌溉的灌水质量评价及计算[J].水利学报,2000,31(3):53-58. 被引量：18
8龙天渝,王延青,安强,程超,杜坤.积水条件下连续和间歇供水对土壤入渗特性的影响[J].水土保持通报,2012,32(3):7-10. 被引量：7
9费良军,谭金兰,韩鑫,吴军虎.尿素肥液间歇入渗土壤水氮运移特性试验研究[J].干旱地区农业研究,2013,31(5):245-250. 被引量：2
10慕运动.响应面方法及其在食品工业中的应用[J].郑州工程学院学报,2001,22(3):91-94. 被引量：368

引证文献1

1薛桦,张晓斌,傅渝亮,何振嘉.灌水技术参数对波涌灌间歇入渗特性优化研究[J].中国农机化学报,2023,44(11):184-191.

1姜厚理,宋占军,刘炳玉,刘昌玲,孙曼霁.偏最小二乘红外光谱法及其对三种过氧化氢酶二级结构的测定[J].光谱学与光谱分析,1996,16(2):29-33. 被引量：6
2周波,陈平.关于肝癌肿瘤标志物的最新研究进展[J].现代生物医学进展,2011,11(S2):5175-5177. 被引量：4
3赵晨露,马荣华,郝景燕,段洪涛.太湖水体吸收分解(Ⅱ):浮游植物色素吸收分解[J].湖泊科学,2012,24(6):905-913. 被引量：1
4Dong Hyuk Lee,Dongho Lee,Jae Won Lee.Statistical Methods for Classification of Medicinal Plants[J].Journal of Chemistry and Chemical Engineering,2014,8(7):698-706.
5李建更,耿涛,阮晓钢.基于逐步提取偏最小二乘主成分的特征选择方法[J].生物学杂志,2010,27(4):85-87. 被引量：2
6李君兰,余群力,张丽,刘亮亮,郭兆斌.双激活剂牛胰酶壳聚糖絮凝法制备工艺优化[J].食品科学,2011,32(14):90-95.
7牛智有,韩鲁佳.鱼粉中氨基酸近红外光谱定量分析[J].农业机械学报,2007,38(5):114-117. 被引量：29
8侯美亭,胡伟,乔海龙,李伟光,延晓冬.偏最小二乘(PLS)回归方法在中国东部植被变化归因研究中的应用[J].自然资源学报,2015,30(3):409-422. 被引量：25
9宋功武,周建刚.偏最小二乘法用于荧光法同时测定锌、铝研究[J].光谱学与光谱分析,1995,15(5):79-84. 被引量：3
10邵建林,史定华,王翼飞.贝叶斯神经网络在生物序列分析中的应用[J].自然杂志,2004,26(2):108-111.

生物学杂志

2011年第6期

浏览历史

内容加载中请稍等...

样条变换偏最小二乘在肝癌数据分类中的应用被引量：1

参考文献13

同被引文献22

引证文献1

相关作者

相关机构

相关主题

浏览历史

样条变换偏最小二乘在肝癌数据分类中的应用 被引量：1

参考文献13

同被引文献22

引证文献1

相关作者

相关机构

相关主题

浏览历史

样条变换偏最小二乘在肝癌数据分类中的应用被引量：1