我对 《TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比》 跟帖中谈了数据解释问题。
为了让更多人看到我的分析,这里另开一贴,加了几行字。
=============================================
TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比
https://bbs.wenxuecity.com/health/985536.html
数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/
数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。
这两点不清楚很容易误导观众。我举一个与新冠无关的极端例子:
比如说交通事故,把某国某年车祸事件都拿来(事件 C),看看驾驶者是A: 10岁以下与B: 10岁以上各占车祸的比例。你一定会看到Share of Overall Cases by A Among C = # in A and C / # in C 是非常低的。但你总不能说10岁以下小孩开车更安全吧?
要直接比较Share of Overall Cases by A Among C vs. Share of Overall Cases by B Among C,A 与 B 最好占总体比例差不多。比如 A: Male,B: Female
打过疫苗的(A)与没打过疫苗的(B)目前比例比较接近,但 A 总的来说经历的时间短些,B 总的来说经历的时间长些。直接比较的话,有点类似比较 A: 2021年时 25-35岁 (i.e. born in 1996-2006) 驾驶者,B: 2021年时 35-45 (i.e. born in 1986-1996) 驾驶者,多年所有车祸记录 C。B组驾驶年份长,车祸总量也许更多。但你不能据此而说B组开车更不安全吧?
保险公司最应该比较的是:
(# in A & C) / (# in A) vs. (# in B & C) / (# in B)
用原来英文讲就是:Share of Overall Cases by C Among A vs. Share of Overall Cases by C Among B
用条件概率的符号就是:
KFF 报道的是:P(A|C) vs. P(B|C) [这两个数加起来是100%]
我们更感兴趣的是: P(C|A) vs. P(C|B) [注意这两个数加起来不是100%]
二者之间的关系可以用Bayes公式表达:
P(C|A) = P(A|C)*P(C)/P(A) vs. P(C|B) = P(B|C)*P(C)/P(B)
可惜KFF的数据没有P(C)/P(A), P(C)/P(B)
如果A是打(完)疫苗的,B是未打(完)疫苗的(简化一下,把打了一半与没打到放一起),那么保护率(或有效率)计算就是:[P(C|B)-P(C|A)]/P(C|B)
=====================================
TBz: 你都把数据来源贴出来了,就愣是不往下看一眼?
数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/
数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。
==============================================
数据来源里面的 Table 1: COVID-19 Breakthrough Event Data, Source, and Notes by State
表格列得清清楚楚,第一列就是每个州的取样时间段。
可以看出,大部分的州是从今年年初开始累计数字的,按每周观察数字。
我就不再截屏了
===================================
我的回答:对不起,我眼花看成2020年起了,不过...
即使从2021年初起,那还是有不少是比较后期才打疫苗的。
我不是否认疫苗的作用。我只是说,KFF表达的数字,容易引起误导,我看是夸大了疫苗的保护作用。
反过来的是媒体关于CDC Providencetown breakthrou的表达方式,"74% of people in a Covid-19 outbreak were vaccinated"。方舟子的视频 《不要把德尔塔变异说得太可怕》 https://www.youtube.com/watch?v=hW-vd2nQxqA 说明了怎么计算更客观些。
我们既不要夸大也不要贬低疫苗的保护作用。