slow_quick2021-08-10 19:21:40

我对 《TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比》 跟帖中谈了数据解释问题。

为了让更多人看到我的分析,这里另开一贴,加了几行字。

=============================================

TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比

https://bbs.wenxuecity.com/health/985536.html

数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/

数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。

这两点不清楚很容易误导观众。我举一个与新冠无关的极端例子:

比如说交通事故,把某国某年车祸事件都拿来(事件 C),看看驾驶者是A: 10岁以下与B: 10岁以上各占车祸的比例。你一定会看到Share of Overall Cases by A Among C = # in A and C / # in C 是非常低的。但你总不能说10岁以下小孩开车更安全吧?

要直接比较Share of Overall Cases by A Among C vs. Share of Overall Cases by B Among C,A 与 B 最好占总体比例差不多。比如 A: Male,B: Female

打过疫苗的(A)与没打过疫苗的(B)目前比例比较接近,但 A 总的来说经历的时间短些,B 总的来说经历的时间长些。直接比较的话,有点类似比较 A: 2021年时 25-35岁 (i.e. born in 1996-2006) 驾驶者,B: 2021年时 35-45 (i.e. born in 1986-1996) 驾驶者,多年所有车祸记录 C。B组驾驶年份长,车祸总量也许更多。但你不能据此而说B组开车更不安全吧?

保险公司最应该比较的是:
(# in A & C) / (# in A) vs. (# in B & C) / (# in B)

用原来英文讲就是:Share of Overall Cases by C Among A vs. Share of Overall Cases by C Among B

用条件概率的符号就是:

KFF 报道的是:P(A|C) vs. P(B|C) [这两个数加起来是100%]

我们更感兴趣的是: P(C|A) vs. P(C|B) [注意这两个数加起来不是100%]

二者之间的关系可以用Bayes公式表达:

   P(C|A) = P(A|C)*P(C)/P(A) vs. P(C|B) = P(B|C)*P(C)/P(B)

可惜KFF的数据没有P(C)/P(A), P(C)/P(B)

如果A是打(完)疫苗的,B是未打(完)疫苗的(简化一下,把打了一半与没打到放一起),那么保护率(或有效率)计算就是:[P(C|B)-P(C|A)]/P(C|B)

 

=====================================

TBz: 你都把数据来源贴出来了,就愣是不往下看一眼

数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/

数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。
==============================================

数据来源里面的 Table 1: COVID-19 Breakthrough Event Data, Source, and Notes by State

表格列得清清楚楚,第一列就是每个州的取样时间段。

可以看出,大部分的州是从今年年初开始累计数字的,按每周观察数字

我就不再截屏了

===================================

我的回答:对不起,我眼花看成2020年起了,不过...

即使从2021年初起,那还是有不少是比较后期才打疫苗的。

我不是否认疫苗的作用。我只是说,KFF表达的数字,容易引起误导,我看是夸大了疫苗的保护作用。

反过来的是媒体关于CDC Providencetown breakthrou的表达方式,"74% of people in a Covid-19 outbreak were vaccinated"。方舟子的视频 《不要把德尔塔变异说得太可怕》 https://www.youtube.com/watch?v=hW-vd2nQxqA 说明了怎么计算更客观些。

我们既不要夸大也不要贬低疫苗的保护作用。

TBz2021-08-10 20:41:59
你都把数据来源贴出来了,就愣是不往下看一眼?
三丝2021-08-10 20:45:31
一个重要点是从5月开始delta的流行很有可能改变了发病、住院、死亡病例占比数据,因此,累计数据对当下疫苗的讨论意义就有限了
三丝2021-08-10 20:53:59
99% ICU的病人都是没打的和将来99% ICU的病人都是打过的同样是不能说明疫苗的有效性
阿明.2021-08-10 21:11:17
标题中“打过疫苗的和没打过疫苗”应改成“完全接种疫苗和未完全接种疫苗”
pickshell2021-08-10 21:34:53
这个统计是从1月份或2月份起~7月底,不同州上报的COVID-19 Cases实际数据来的。
slow_quick2021-08-10 21:46:59
对不起,我眼花看成2020年起了。不过。。。
TBz2021-08-10 21:56:30
:-)
slow_quick2021-08-10 21:59:27
同意,应该是”打完疫苗的“、”未打(完)疫苗的“
julie1162021-08-10 23:39:59
检测门槛和以前不一样了。一般发烧咳嗽根本不再测新冠了