连续时间序列表达谱(Time serial expression)分析


基因芯片经常用来研究生物医学样品在一系列连续时间点下的表达差异。但是由于样品不同时间取样及芯片成本的多方面因素使得连续时间点多数只有3到8个。从连续时间内一系列基因表达实验的数据分析带来了新的挑战。数以千计的基因在这些实验中,同时正在配置的时间点的数目相对很少。在这种情况下,许多基因具有相同的表达类型,其实是偶然的表现(假阴性差异)。此外,许多时间系列实验中,通常很少获得统计时间序列重复数据。

我们针对基因数目大,而时间点却很少的数据特征,来找到统计学显著的所有基因表达谱。同时还可以结合基因功能Gene Ontology富集的手段提供一个有效率和显着的基因连续时间点表达模式。


应用示例


下图1是对5个时间点共计2989个基因的连续时间表达谱做到连续时间序列表达谱分析。每个子图表示一种显著的表达模式,而数字表示这种表达模式的基因数量。



图1 连续时间序列表达谱分析