一、定义及用途
【定义】
小提琴图(Violin Plot)是一种结合了箱线图和核密度图特点的数据可视化图表,用于展示数据的分布情况。
【用途】
1. 数据分布比较/多变量分析:通过观察小提琴图的形状、宽度和长度,比较不同组别或类别的数据分布,直观了解数据密度和范围,发现其中的差异性和相似性。
2. 异常值检测:快速识别数据集中的异常值或离群点,为后续分析处理提供指导。
3. 探索因素影响:研究一个因素对另一个因素的影响。按一个因素分组,观察另一个因素的小提琴图,了解两者之间的关系和影响。
4. 时间序列分析:适用于观察随时间变化的数据分布。通过比较不同时间点的数据分布,识别趋势和模式。
二、案例解读
研究者使用TIDE数据库评估不同RGN表达组免疫治疗的潜在临床效果,结果表明RGN高表达组的功能障碍评分较高,说明患者接受免疫治疗后的疗效往往低于RGN低表达的患者。
三、相关疑问
1. 小提琴图、箱线图、直方图有什么区别?
三者都属于数据可视化图表工具,均用于展示数据分布情况,它们主要的区别在于适用范围的不同。
①小提琴图:适用于展示多变量之间的关系,并突出显示每个变量对结果的影响程度。
②箱线图:适用于展示一组数据的中位数、四分位数、异常值等信息。
③直方图:适用于展示连续变量的分布情况。
2. 小提琴图和箱线图如何选择?
基于上个问题的适用范围区别,图表类型的选择取决于我们的需求。
①如果需要比较多个变量之间的关系,或者需要同时展示数据的分布和密度,那么小提琴图是一个不错的选择。
②如果需要比较一个或多个数据集的分布情况,或者需要快速识别异常值,那么选择箱线图较为合适。
3. 小提琴图有哪些衍生类型?
主要有以下三种类型。