- +1
大数据专家涂子沛:光诚实不够,抗疫一线亟需强化数据思维
几天前,我看到新闻报道,钟南山院士的团队先后在粪便和尿液标本中分离出新型冠状病毒。这证实了病毒可以在人体的排泄物中存活,即病毒可能通过人体排泄物传播。
病毒究竟是如何传播的,这个问题几乎伴随着近两个月的抗疫全程。我注意到,一开始专家判断是呼吸,后来,有专家说通过眼睛也可以传染,接下来,又说通过接触、粪便,甚至气溶胶传播,中间有一段时间大家的注意力转向了公共设施,例如电梯按纽、扶手、火车上的洗手间等等,人们从出门戴口罩、护目镜,发展到戴手套,甚至一度在按电梯里按按纽也担心害怕。
钻石公主号邮轮就更说不清楚了,全员在船上隔离,最后全船却有621人感染,病毒究竟是怎样传播的,是通风、排污、食品还是其他什么东西,或者是气溶胶传播,目前没有定论。这么多种可能到底哪个概率最大,传染力最强?一直没说清楚。从疫情防控上来说,这是非常让人不安的。
2月24日,广州公布的一宗病例也让人迷惑。一家人一行六人1月22日乘高铁由武汉到达广州,在经过居家隔离14天的措施之后,2月21日有4人确诊。究竟是潜伏期长,还是在隔离之后又被感染,无从回答。
2月20日,在浙江省杭州市富阳区上官乡芳村检查点,工作人员展示手机上的“疫情防控云图”的实时数据。 新华社记者 徐昱 摄
从一个普通人的角度出发,我认为,传播途径一直不完整、不清晰是大众对新病毒感到恐惧最重要原因。我理解,对新生事物的认识需要时间,可是疫情的全面爆发已经有近两个月了,武汉封城也已经一个多月了,作为疫情防控最重要的一点认识,还有这么多疑问,说重一点,是后知后觉,显然这无法适应疫情防控争分夺秒的需要。我认为,这本质上是一个数据分析问题,这个问题的存在,证明我们一线的专家对病例的数据收集不详尽、不彻底,分析不到位,一线的专家很辛苦,付出很多、甚至牺牲也很惨烈,但方法对不对,需要反思、修正调整,尽快契合现实。
当下的重中之重,我认为是清晰地还原、确定病毒的传播渠道。
这几天,我常常想到2006年我在美国经历的一次疫情。
那年8月我去美国,飞机落地没多久就听闻美国爆发了大肠杆菌疫情,听说涉及20多个州,先后有200多人入院,出现3例死亡。因为刚到美国就遭遇一次疫情,所以印象特别深刻。
但在疫情早期,美国就成功地确定了传染源,有效地切断了传播链,避免了一场全国性的大流行和大恐慌,这一点同样令我印象深刻。
美国的流行病专家靠的就是详尽的数据分析。大肠杆菌寄居在人类的消化系统,它是通过食物传染的,这一点判断并不难。但一个人一天吃的食物那是五花八门,一个三明治、一份沙拉里面可能就有十多种配料,要确定是那一种引起疫情,那是相当不容易的。流行病专家设计了一份干预性很强的数据问卷,他们紧急会见患者,对患者一共问了450个问题,内容包括任何可能的进食、接触以及行程,最后拿回去分析,最终发现是一种“袋装菠菜”是传染源。
但不是全国所有的袋装菠菜带有病毒,而仅仅是一种“Dole”牌的袋装小菠菜带有病毒,也不是所有的“Dole”牌带有病毒,而只是在加州一个山谷中一块大小约1万平方米的种植基地出了问题,被动物粪便当中的大肠杆菌污染了。
在疫情发生的一周内,美国的流行病专家就锁定了袋装菠菜,不到一个月,就追踪到了出问题批次菠菜的准确种植基地,快速剪除了传染源。
在这个过程当中,还涉及到菠菜的召回,如果迟迟不能确定准确的传染源头,整个市场上的菠菜都不能售卖,已经流通的也要全部召回,这对菠菜行业无疑是一个巨大的打击。
举这个例子我想说明,在疫情溯源问题上,数据的收集和分析是非常重要的。这关系到能不能在最短的时间里找到传染源,切断传播路径,也关系到如何制定防控手段。传播手段都不知道,你如何设计隔离方案?万一留下漏洞怎么办?如果口粪传播成立,那么楼上楼下的光隔离房间是不够的,还要在马桶上面想办法。
其实,数据分析在流行病防控当中有非常久远的应用,历史上还有一些相当成功的案例。19世纪50年代,伦敦爆发霍乱,当时主流的观点认为是这种烈性传染病是通过空气传播的,有一名医生斯诺,他分解了一个区域房屋的水源,发现死亡的数据和供水路线有高度的相关性。饮用A公司自来水的家庭有1263人死于霍乱,而饮用B公司水的家庭只有98人死于霍乱,按照每万户的死亡率作对比,相差8.5倍。两个公司为什么有区别?斯诺追踪了两个公司的水源,最后发现,A公司是在泰晤士河下游取水,而B公司是在上游取水,当时的泰晤士河已经被霍乱患者的排泄物污染了。由于快速认清了霍乱的传播渠道,伦敦这一次霍乱得到较快平息,避免了更大的损失。
1904年广州霍乱流行,当时的女医生张竹君用了同样的思路应对,她认为患者呕吐秽物污染了江河水源,扩大了疫情传播,建议当局用船从广州郊区运水。两广总督采纳了她的建议,派出军舰拖水供市民饮用。几周之内,疫情就被控制下来,成为中国流行疫情防控历史上的经典案例。
回到我们当前面对的疫情,SARS-CoV-2的传播已经到了第三代、第四代,传播力在减弱吗?致病性有没有变化?我们需要清清楚楚的数据,才能得出结论,从目前情况看,存在轻症感染,还存在无症感染,这都增加了分析的难度。
办法也有。据多个新闻报道,已经有抗原抗体检测试剂在量产,通过一滴血,几分钟就可以查出患者的抗原抗体。有IgG抗体的可能是过去受过感染,有抗原的或者有IgM抗体的则是正被感染,以及多少人无症或轻症带病毒都可以检测出来。这种检测方式,收集的数据不仅快、准,而且分析价值也高,但面广难度大,我建议,我们要尽快着手,不怕麻烦,可以从几宗病例或者几个具有代表性的居民小区入手,尽早收集多一个传播全链条的数据以供分析。
理论上说,只要方法得当,我们可以从数据中得到足够多的知识,疫情防治是一门科学,需要严格按照科学规律办事,不放过任何一个疑问,不放过任何一个未解之谜,只有掌握详尽的数据,才能得出准确度高的结论。这是与死神在赛跑,马虎不得,犹豫不得。
加缪在总结人类应对鼠疫的经验时,指出“与鼠疫斗争的唯一方式只能是诚实”。 我认为,诚实就是说真话,即实事,经过疫情初期的应对,我们都认识到了说真话的价值,但说真话显然还不够,还要再加上数据的思维,就是“求是”,即通过全面细致的数据寻找规律。说真话加上数据思维,就是“实事求是”,大数据时代的实事求是,也可以说是“实数求是”。真理要从数中求,没找对方法,即使“毫不放松抓紧抓实抓细”“坚决打好”“绝不允许”,也会事倍功半。我相信全面贯彻数据思维,再加上诚实,一定可以快速切断病毒的传播,事半功倍,在最短的时间内战胜疫情。
(本文原题为《涂子沛:光诚实不够,抗疫一线亟需强化数据思维》,作者涂子沛为大数据专家,著有《大数据》、《数据之巅》、《数文明》,首发于微信公众号“涂子沛频道”,澎湃新闻获授权转发。)
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司