400 050 6600
数据分析师

手机号

验证码

30天自动登录

为什么推理结果与直觉大相径庭?

来源: / 作者: / 时间:2022-11-02

假如有一天,你认识的一位朋友进行了一项癌症筛查,这项检查有阳性和阴性两种结果:如果一个人确实得了这种癌症,那么有95%的概率会被检查出阳性。你的这位朋友不久后收到了阳性报告,于是陷入深度焦虑状态。

请问各位数据分析师:这位朋友患这种癌症的概率是多少?大多数人可能首先想到的是95%,而同类问题曾经也难倒过大部分哈佛大学的学生。难道不是95%吗?对,不是。不仅不是,实际概率往往比这个值低的多得多。这又是怎么发生的呢?让我们接着往下看。

分析:欢迎使用贝叶斯推算。假设这种癌症的患病率为千分之一(0.1%,1000人中只有1人患病,实际患病率可能更低)。如果某人患病,试剂盒能在95%的概率上将之报告为阳性;但是如果此人没有患病,试剂盒也能有2%的可能性将其误报为阳性,后者我们常称之为“假阳性”。


以参加此次体检的100000人的一个群体为例:这里真正患这种癌症的有100(100000*0.1%)人,被报出阳性的人数为100*0.95=95人没有患癌的有99900人,这些人中被报出阳性的有99900*0.02=1998人那一共被爆出阳性的有95+1998=2093人。注意,这里大多数都是假阳性。所以,在这100000人中,如果凭借一个人的报告为阳性来判断他患癌的概率仅为95/(95+1998)=4.54%推理结果是不是跟我们预期的完全不同呢?在这个意义上讲,这位朋友完全不需要如此悲观。


建议:一些医疗检查结果即便出现了阳性也不用过于焦虑,实际情况远没有想象的那么糟糕。因为一些罕见病中健康人群被误诊为阳性的可能性非常大。但是,还有一点需要重视:比如这个案例人群患癌的比例为千分之一,但是经过检查这位朋友本人的患病概率上升到了4.54%,概率一下子提升了四五十倍,也是不容小觑的事情,还需要进一步检查予以排除。

最后:贝叶斯推算并不复杂,无论水平高低大部分人都可以算对,但是首先需要我们做到的是改变固化思维。
Prev article

误用数据可视化图表的后果

Next article

PowerBi服务器搭建

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务