所有的就在这一步,把输入的表达矩阵的几千个基因组归类成了几十个模块。大体思路:计算基因间的邻接性,根据邻接性计算基因间的相似性,然后推出基因间的相异性系数,并据此得到基因间的系统聚类树。然后按照混合动态剪切树的标准,设置每个基因模块少的基因数目为30。根据动态剪切法确定基因模块后,再次分析,依次计算每个模块的特征向量值,然后对模块进行聚类分析,将距离较近的模块合并为新的模块。这里用不同的颜色来那些所有的模块,其中灰色默认是无法归类于任何模块的那些基因,如果灰色模块里面的基因太多,那么前期对表达矩阵挑选基因的步骤可能就不太合适。WGCNA共表达网络分析-让你的文章闪耀起来。广东临床WGCNA分析
在WGCNA中有很多的术语,对于刚接触WGCNA的学员来说,看到这些术语就是一脸懵逼,其实WGCNA的就是一个加权的相关性,那么各个术语绕不开的就是某个变量和另一个变量的相关性,我们根据个人实战和理解整理WGCNA用到的所有术语,供大家学习参考。Co-expressionnetwork:无向加权基因网络。以基因表达谱举例,基因之间的连接由基因间的表达相关性决定,WGCNA则使用β(软阈值)加权提高相关性的值,加强高相关的基因并减弱低相关的基因。具体来说,aij=|cor(xi,xj)|β表示unsigned的共表达网络,aij=|(1+cor(xi,xj))/2|β表示signed的共表达网络。Module:表达高度相关的基因集。在unsigned的共表达网络中,module对应具有高度相关性的基因集。在signed的网络中,module对应正相关的基因基因集。广东临床WGCNA分析WGCNA的出发点是基于系统的基因表达水平来构建一个网络。
WGCNA中对基因表达值之间的相关系数取n次幂,这是和普通聚类的比较大不同,其直接结果是把基因间相关性的强弱的差异放大。假如某两对基因之间未取幂之前的相关系数差异为4倍,假如对各自相关系数取4次幂,则这种差异就变为256倍,强弱关系分明。对每两对基因(i,j)之间的相关系数的幂取某特定的值β,以此来计算所有基因之间的相关性,也就是adjacency矩阵:ai,j=|cor(i,j)|β由这些相关性系数,可以构建网络,其中基因作为网络中的节点(nodes),而ai,j作为边的权重,高相关性强连接,反之亦然。每个基因的连接性(度)的大小反应了和这个基因相连的基因的多少。WGCNA提供几种相关性的算法,其中包括Pearsoncorrelation(cor()函数)、Biweightmid-correlation(bicor()函数)、Spearmancorrelation(cor(x,method=“spearman”)函数)本研究中采用WGCNA默认的Pearson相关,Pearsoncorrelation计算快速,但对离群值敏感。
加权基因共表达网络分析(WGCNA,Weightedcorrelationnetworkanalysis)是一种系统生物学方法,用来描述基因间的相关模式,早年使用microarray基因表达数据,近些年越来越多的使用RNA-seq的基因表达数据。WGCNA可用于寻找高度相关的基因集(module),使用module特征(ME,moduleeigengene)或module内枢纽(hub)基因该module(ME较常见),计算(1)不同module的相关性,(2)module与样本性状的相关性,(3)基因隶属模块的权重。WGCNA促进了基于网络的基因筛选方法,可用于识别候选生物标志物或靶点。这些方法已成功应用于各种生物学研究,如、小鼠遗传学、酵母遗传学和脑成像数据分析。WGCNA算法首先假定基因网络服从无尺度分布是带有一类特性的复杂网络。
WGCNA(Weighted Gene Co-Expression Network Analysis)称为加权基因共表达网络分析是一种适合进行多样本复杂数据分析的工具,通过计算基因间表达关系,鉴定表达模式相似的基因(module),解析基因与样品表型之间的联系,绘制基因中基因之间的调控网络并鉴定关键调控基因。其适合应用于复杂的多样本转录组数据,是发表转录组高分文章的必备技能。 纵观近年发表的转录组相关文献,文章的数目增长速度非常之快,但是低水平的文章比例增家直观的感觉就是:转录组文章越来越不好发表了。WGCNA分析大家都不陌生了。广东临床WGCNA分析
Module eigengene:给定模型的主成分,整个模型的基因表达谱。广东临床WGCNA分析
其实随着WGCNA的使用,其用处不仅局限于对性状的分析,还可以结合模块与样本的相关性来分析。比如当研究不同处理组织或者不同发育时期的植物时,如果想了解处理或者不同时期中那些模块对其有影响,那么我们可以自行构建类似于性状的Traits矩阵。比如简单的一种方法就是默认为各个样本间是无关联的,那么Traits矩阵则为标量矩阵,当然还有其他方式(比如考虑样品有生物学重复的情况)。WGCNA的出发点是基于系统的基因表达水平来构建一个网络,目的是显示出基因间的共表达关系,那么相似表达模式的基因可能存在共调控、功能相关或处于同一通路;即如果某些基因的表达趋势随着不同处理之间的变化而有相同的变化趋势(表达模式),那么我们认为这些基因很可能在一个通路上,或者在相互调控的通路上富集。广东临床WGCNA分析
广州市智汇基因科技有限公司属于商务服务的高新企业,技术力量雄厚。智汇基因是一家其他企业,一直“以人为本,服务于社会”的经营理念;“诚守信誉,持续发展”的质量方针。以满足顾客要求为己任;以顾客永远满意为标准;以保持行业优先为目标,提供***的生信分析,SCI,TCGA,GEO,,单细胞测序,网络药理学,WGCNA,KEGG。智汇基因自成立以来,一直坚持走正规化、专业化路线,得到了广大客户及社会各界的普遍认可与大力支持。