简介:通过检查基因集合中的基因是否富集在G0的不同层级上,从而了解这些基因在细胞组成、生物过程和分子功能方面的功能
应用场景:基因功能注释、疾病机制研究、基因筛选后验证
案例:某研究小组为了研究一个细胞信号通路的作用机制,对敲除该通路关键基因的小鼠进行了全基因组范围的转录组测序
R语言代码:library(Bioconductor)
key基因sEntrez <- 基因SYMBOL2ENTREZ(key基因s, annotation ="org.Mm.eg.db")
富集分析方法主要用于理解基因集合或其他生物学实体在给定实验条件下的功能、通路或特定生物学过程的富集程度,但是不同的方法所适用的场景又各不相同!
一、GO富集分析(基因 Ontology)
简介:通过检查基因集合中的基因是否富集在G0的不同层级上,从而了解这些基因在细胞组成、生物过程和分子功能方面的功能
应用场景:基因功能注释、疾病机制研究、基因筛选后验证
案例:某研究小组为了研究一个细胞信号通路的作用机制,对敲除该通路关键基因的小鼠进行了全基因组范围的转录组测序
R语言代码:library(Bioconductor)
key基因sEntrez <- 基因SYMBOL2ENTREZ(key基因s, annotation ="org.Mm.eg.db")
二、KEGG富集分析(Kyoto Encyclopediaof 基因s andGenomes)
简介:用于确定在给定基因组数据中哪些KEGG代谢途径或功能模块受到显著富集
应用场景:代谢和信号通路研究、复杂疾病研究、药wu靶点研究
案例:研究人员在研究抑郁症时,通过高通量测序技术检测了大量患者的基因表达数据,然后使用KEGG富集分析来识别与抑郁症相关的通路
R语言代码:library(clusterProfiler)
enrichResult <- enrichKEGG(KEGG, organism = "human")
三、GSEA富集分析(基因 Set Enrichment Analysis)
简介:用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献
应用场景:复杂性状分析、数据降噪、生物标志物发现
案例:研究人员在一项ai症研究中,通过GSEA分析ai细胞的基因表达谱,可以发现其中与细胞周期调控相关的基因集显著富集
R语言代码:library(GSEA)
expression_data <-read.csv("path_to_your_csv_file.csv", row.names = 1)
四、ssGSEA(Single Sample 基因Set EnrichmentAnalysis)
简介:能够评估特定基因集在单个样本中的富集程度,适用于处理只获取单个样本数据的情况
应用场景:个体样本分析、个体化医学
案例:研究人员通过SSGSEA分析肿liu细胞中的免yi相关基因集,可以发现高表达SSGSEA分数的肿liu细胞对免疫治liao的反应更好,从而提高治liao的选择性和效果
R语言代码:library(ggplot2)
ssGSEA result <-ssGSEA(data,set =immuneset)
五、GSVA(基因 Set Variation Analysis)
简介:通过计算每个样本中基因集的富集水平,将基因表达数据从个体基因的水平转换为基因集(例如代表生物学过程、通路或功能的基因集合)的富集程度
应用场景:样本间比较、数据降噪
案例:可以使用GSVA富集分析来识别与ai症发生和发展相关的生物途径或基因集
R语言代码:library(GSVA)
gsva <-GSVA::gsva(features.trn, gset ="c2.cancer", method ="gsva"
六、AUCell(Area Under theCurve Cell)
简介:通过计算每个细胞中给定zene集的表达值的AUC,来评估该基因集的活性
应用场景:高变异数据分析、细胞类型分析
案例:在一项研究中,研究人员通过AUCell分析发现在乳腺ai细胞中过度表达的基因,从而进一步揭示这些基因与激su受体信号通路的关系
R语言代码:library(Biockoopr)au<-auCell(data.cell counts)
七、AddModuleScore
简介:通过计算特定基因集在单细胞中的表达得分,从而量化基因集的活跃性
应用场景:单细胞分析、细胞亚群分析
案例:通过AddModuleScore富集分析工具来分析与ai症相关基因的模块得分,并鉴定出在这些基因中能够显著提高模块得分的生物通路
R语言代码:library(WGCNA)
module_scores <-WGCNA::moduleScore(基因_expression_data, softPower = 9, power overload =FALSE,maxModuleSize=500,verbose=3)
八、7种富集分析方法的异同点