网络链接预测能够获取网络中丢失链接的重要信息或进行网络的动态演变分析.现有的基于节点相似性的网络链接预测方法往往针对简单的一(多)阶邻居信息或特定类型的小型网络,设计较为复杂的计算方法,其扩展性和大规模网络中的可计算性都...网络链接预测能够获取网络中丢失链接的重要信息或进行网络的动态演变分析.现有的基于节点相似性的网络链接预测方法往往针对简单的一(多)阶邻居信息或特定类型的小型网络,设计较为复杂的计算方法,其扩展性和大规模网络中的可计算性都受到了严峻的挑战.文中基于深度学习在神经网络语言模型中应用的启发,提出了一个LsNet2Vec(Large-scale Network to Vector)模型.通过结合随机游走的网络数据集序列化方法,进行大规模的无监督机器学习,从而将网络中节点的结构特征信息映射到一个连续的、固定维度的实数向量.然后,使用学习到的节点结构特征向量,就可以迅速计算大规模网络中任意节点之间的相似度,以此来进行网络中的链接预测.通过在16个大规模真实数据集上和目前的多个基准的最优预测算法对比发现,LsNet2Vec模型所得到的预测总体效果是最优的:在保证了大规模网络中链接预测计算可行性的同时,于多个数据集上相对已有方法呈现出较大的AUC值提升,最高达8.9%.展开更多
基因表达的连续分析技术(serial analysis of gene expression,SAGE)是应用于基因研究的有利工具,具有高通量、高保真度、既定性又定量等诸多优点。自从发明以来,SAGE已经广泛应用于分析许多生物学和医学研究的基因表达情况。作者们经...基因表达的连续分析技术(serial analysis of gene expression,SAGE)是应用于基因研究的有利工具,具有高通量、高保真度、既定性又定量等诸多优点。自从发明以来,SAGE已经广泛应用于分析许多生物学和医学研究的基因表达情况。作者们经过广泛查阅近年来相关国内外文献,尤其密切关注肝脏研究领域,并结合自身研究成果,对近十年来SAGE技术发展情况进行了总结。SAGE技术较前有了很大进步,这主要体现在三个方面:SAGE技术本身更趋优化;数个SAGE文库联合分析;结合其它基因研究手段进行研究。作者仅对SAGE技术的原理、方法进展进行简单介绍,重点以应用于肝脏中的研究为媒介,探讨其在应用方面突破。尽管超过一千个SAGE相关的研究已经发表,但同时SAGE技术本身也存在缺陷,比如测序误差、连接效率难以保证等问题,说明SAGE技术仍需不断地改进。展开更多
文摘网络链接预测能够获取网络中丢失链接的重要信息或进行网络的动态演变分析.现有的基于节点相似性的网络链接预测方法往往针对简单的一(多)阶邻居信息或特定类型的小型网络,设计较为复杂的计算方法,其扩展性和大规模网络中的可计算性都受到了严峻的挑战.文中基于深度学习在神经网络语言模型中应用的启发,提出了一个LsNet2Vec(Large-scale Network to Vector)模型.通过结合随机游走的网络数据集序列化方法,进行大规模的无监督机器学习,从而将网络中节点的结构特征信息映射到一个连续的、固定维度的实数向量.然后,使用学习到的节点结构特征向量,就可以迅速计算大规模网络中任意节点之间的相似度,以此来进行网络中的链接预测.通过在16个大规模真实数据集上和目前的多个基准的最优预测算法对比发现,LsNet2Vec模型所得到的预测总体效果是最优的:在保证了大规模网络中链接预测计算可行性的同时,于多个数据集上相对已有方法呈现出较大的AUC值提升,最高达8.9%.
文摘基因表达的连续分析技术(serial analysis of gene expression,SAGE)是应用于基因研究的有利工具,具有高通量、高保真度、既定性又定量等诸多优点。自从发明以来,SAGE已经广泛应用于分析许多生物学和医学研究的基因表达情况。作者们经过广泛查阅近年来相关国内外文献,尤其密切关注肝脏研究领域,并结合自身研究成果,对近十年来SAGE技术发展情况进行了总结。SAGE技术较前有了很大进步,这主要体现在三个方面:SAGE技术本身更趋优化;数个SAGE文库联合分析;结合其它基因研究手段进行研究。作者仅对SAGE技术的原理、方法进展进行简单介绍,重点以应用于肝脏中的研究为媒介,探讨其在应用方面突破。尽管超过一千个SAGE相关的研究已经发表,但同时SAGE技术本身也存在缺陷,比如测序误差、连接效率难以保证等问题,说明SAGE技术仍需不断地改进。