为什么推理结果与直觉大相径庭?
来源: / 作者: / 时间:2022-11-02
假如有一天,你认识的一位朋友进行了一项癌症筛查,这项检查有阳性和阴性两种结果:如果一个人确实得了这种癌症,那么有95%的概率会被检查出阳性。你的这位朋友不久后收到了阳性报告,于是陷入深度焦虑状态。
请问各位数据分析师:这位朋友患这种癌症的概率是多少?大多数人可能首先想到的是95%,而同类问题曾经也难倒过大部分哈佛大学的学生。难道不是95%吗?对,不是。不仅不是,实际概率往往比这个值低的多得多。这又是怎么发生的呢?让我们接着往下看。
分析:欢迎使用贝叶斯推算。假设这种癌症的患病率为千分之一(0.1%,1000人中只有1人患病,实际患病率可能更低)。如果某人患病,试剂盒能在95%的概率上将之报告为阳性;但是如果此人没有患病,试剂盒也能有2%的可能性将其误报为阳性,后者我们常称之为“假阳性”。
最后:贝叶斯推算并不复杂,无论水平高低大部分人都可以算对,但是首先需要我们做到的是改变固化思维。
请问各位数据分析师:这位朋友患这种癌症的概率是多少?大多数人可能首先想到的是95%,而同类问题曾经也难倒过大部分哈佛大学的学生。难道不是95%吗?对,不是。不仅不是,实际概率往往比这个值低的多得多。这又是怎么发生的呢?让我们接着往下看。
分析:欢迎使用贝叶斯推算。假设这种癌症的患病率为千分之一(0.1%,1000人中只有1人患病,实际患病率可能更低)。如果某人患病,试剂盒能在95%的概率上将之报告为阳性;但是如果此人没有患病,试剂盒也能有2%的可能性将其误报为阳性,后者我们常称之为“假阳性”。
以参加此次体检的100000人的一个群体为例:这里真正患这种癌症的有100(100000*0.1%)人,被报出阳性的人数为100*0.95=95人没有患癌的有99900人,这些人中被报出阳性的有99900*0.02=1998人那一共被爆出阳性的有95+1998=2093人。注意,这里大多数都是假阳性。所以,在这100000人中,如果凭借一个人的报告为阳性来判断他患癌的概率仅为95/(95+1998)=4.54%推理结果是不是跟我们预期的完全不同呢?在这个意义上讲,这位朋友完全不需要如此悲观。
最后:贝叶斯推算并不复杂,无论水平高低大部分人都可以算对,但是首先需要我们做到的是改变固化思维。