资讯动态

生信分析中的PCA图怎么看?快速为你解答!

2024-06-07 11:40:53
|
访问量:114952

作为成熟的生物医学科研人,必然是做实验、写论文、做生信分析……样样手到擒来!今天,我们再来接着解读PCA图~

图片1.png

一、定义和用途

定义:PCA(主成分分析图)是以“降维"为核心,把多指标的数据用少数几个综合指标(主成分)替代,还原数据最本质特征的数据处理方式,用于展示多元数据的主要模式和结构。

用途:

常用于疾病危险因素分析、肠道菌群聚类分析、肿瘤亚群之间的进化关系分析等。

l 确定主成分的数量:通常来说,保留前几个主成分就足够解释原始数据的大部分变异。

l 异常值检测:通过观察PCA图中样本的分布情况,可以发现是否存在异常值。如果某个样本在各个主成分上的得分都明显偏离其他样本,则表示该样本为异常值。聚类分析:通过观察PCA图中样本的分布情况,将相似的样本归为同一类,不相似的样本归为不同类。

l 预测分析:如果已知某些样本属于某一类或具有某一标签,就可以在PCA图中找到这些样本的位置,并预测新样本的分类或标签。

二、PCA图怎么看(案例解读)

图片2.png

为了测试肿瘤体积大的患者是否系统性地表现出其微生物群的变化,研究者使用Bray-Curtis指数测量了整个队列的β多样性。主成分分析(PCA)显示这些患者的β多样性无显著差异。

三、相关疑问和解答

1.什么是主成分?

主成分就是原始变量的线性组合。

第一主成分对应第一坐标轴,表示了原始数据中多个变量通过某种变换得到的新变量的变化范围,能够最大程度解释数据中方差的线性组合。

第二主成分则对应第二坐标轴,代表了第二个新变量的变化范围,能够最大程度解释数据中的方差。

2.PCA分析有哪些注意事项?

l 当我们遇到非线性的或高阶相关的变量关系时,就无法通过PCA分析发挥数据降维的作用。

l 当我们遇到两个变量的数值尺度相差较大时,必须先进行标准化处理,确保变量之间的数值尺度相同,才能进行PCA分析。

l 当我们进行PCA分析时,需要假设变量服从高斯分布,如果变量不服从高斯分布(例如均匀分布时),则会发生尺度缩放与旋转。

3.PCA图有哪些衍生类型?

(1)PCA散点图

图片3.png

(2)PCA双标图

图片4.png

(3)PCA三维图

图片5.png

(4)PCA山脊图

图片6.png

文章推荐
细胞凋亡的生理意义包括什么,细胞凋亡的重要性
2023-12-06
细胞凋亡,又称程序性细胞死亡,是一种广泛存在于多细胞生物体内的重···
细胞株凋亡时的4个阶段
2022-09-25
细胞株是通过选择法或克隆形成法从原代培养物或细胞系中获得具有特殊···
怎么看待细胞实验(怎么看待细胞实验现象)
2023-05-28
细胞实验是生物学领域中非常重要的一种研究方法。通过对细胞的操作,···
细胞株的传代事项有哪些(细胞株的传代分析)
2023-01-15
细胞株即为从组织中分离的原代培养物经*传代培养成功后即成细胞系;通···
“疼痛”有了创新思路也能上Nature子刊!西安交大团队揭示慢性神经病理性疼痛中的ACC-VTA-ACC正反馈环路!
2024-12-20
“腰疼、腿疼、颈椎疼……”,长期伏案学习的生物医学科研人应该知道···
差异性分析方法都有哪些?这21种快速了解下
2024-12-18
在单样本均数比较、两样本均数比较、多样本均数比较、定类数据比较4种···
中科院1区TOP/IF17分!华中科技大学王世宣团队解锁卵巢衰老时空密码:FOXP1的关键性转录调控
2024-12-16
卵巢衰老的秘密,你知道么?女性在40岁以前出现卵巢功能减退的现象,···
中科院1区TOP/14.7分拿下!不愧是“铁死亡”+“慢阻肺”双强组合,直接一把命中Nature子刊!
2024-12-13
慢阻肺(COPD)是慢性阻塞性肺疾病的简称,一种以持续呼吸道症状和气···
  • 业务咨询

    业务咨询专线:133 7682 0615

    Email:lxyjy@wie-biotech.com

在线留言(即刻联系为您提供专业的解决方案) ×
留言咨询

感谢您的关注,如有需要请留言,我们会尽快和您联系!