2015年9月,大众汽车爆出丑闻,该公司在车中安装了作弊软件,可以自动判定汽车是否处于尾气检测状态,并控制尾气的排放,以便通过车检。美国环保局完全被蒙在鼓里。
最终“出卖”大众公司的不是别人,而是它自己生产的汽车——整齐划一的好数据让人在直觉上就感到不对劲。环保局的工作人员就是从这个现象入手,顺藤摸瓜找到了问题。
在日常工作中,如果一件事发展得太过顺利,我们也总会隐隐觉得有地方不对,这样的直觉是有道理的。澳大利亚和法国的研究者们最近在期刊《英国皇家学会学报A》上发表了一篇名为《好得难以置信:压倒性的证据也会失效》的文章,说明了为什么当所有的证据都指向同一个结果时,它反而可能有问题。他们称之为“一致性悖论”。
这听起来违背常理。我们一般认为当所有人的看法一致时,真相应该就是如此,毕竟不可能所有人同时出错。论文并没有反对这个观点,而是给它加了一个前提:系统零偏差或是接近零偏差。简单说来,就是每个个体出错的概率很小,例如在一堆香蕉中挑出一个苹果,几乎不会有人犯错。
但在指认嫌疑人的过程中,系统偏差无法避免。如果目击者只是在嫌犯逃跑时匆匆瞥了一眼,他们认错人的概率将高达48%。
实际上,哪怕只是很小的偏差,也都会对最终的结果产生极大的影响。即使辨认过程中只有1%的情况出现偏见,当超过3人的意见完全一致时,他们正确的概率也会显著下降;若6个或更多证人的意见相同,他们指认出真凶的概率甚至低于60%——这接近随机指认的结果。而这个偏见产生的原因,可能仅仅是警方无意的行为被证人误读。有趣的是,如果此时出现一名证人与其他人意见相左,那么其他人意见正确的概率反而会大大提高。
这就像我们在抛硬币时,如果得到硬币正、反面的次数相差过大的结果,我们会认为这枚硬币有问题,而不是概率定律出了差错。同样地,所有证人意见一致的概率其实很小,在这种情况下,更有可能是系统出现差错。
DNA检测在刑侦领域一直被认为是铁证,每个人的DNA序列都是独特的。谁也没有想到,有一天DNA证据反而成为困扰。从20世纪90年代到21世纪初,欧洲警方在法国、德国、奥地利等地的15个犯罪现场都发现了同一个女性的DNA。起初侦探们非常激动,以为终于抓到了这条“大鱼”。这个轰动一时的神秘连环杀手被称为“海尔布隆魅影”,笼罩在欧洲上空长达15年之久,最后令警方啼笑皆非的是,警方用于收集DNA的工具被污染了,这个被追踪已久的“凶手”,其实只是棉签制造厂的一名女工。
正是因为人们太过相信科技,才会造成“一致性悖论”。
走弯路的还有计算机科学家们。在加密技术中,一般认为错误率低于2-128才是可以接受的。我们借助各种技术和算法来努力提高加密的等级,却忽略了实际操作中的问题:计算机元器件本身有一定的出错概率,甚至一束来自遥远太空的宇宙射线都会影响计算,这种情况每个月出现的概率是10-13,远远大于要求的错误率。这就导致了一个尴尬的事实,加密协议宣称的安全程度越高,反而越容易受到各类故障的影响。下一次遇到宣称他们的算法保密程度高的广告,不妨反问他有没有解决宇宙射线的问题。
“一致性悖论”不仅可以帮助我们走出难以解释的困境,在鉴别真伪上也卓有成效。在实验科学的研究中,背景噪音几乎是不可避免的,种种系统误差会让结果产生一定的异常。但在科学史上,不少实验结果看起来都有点好得过头了,例如密立根油滴实验和孟德尔的豌豆遗传实验。由于实验数据都在意料中,没有任何异常值,许多学者都怀疑结果是编造的,或是经过人工精心挑选的。了解了“一致性悖论”,我们就再也不会被社会调研、数据普查,甚至是会计报账中的猫腻和手段欺骗了。
读完论文,我不禁佩服古罗马人的智慧。在古罗马法中,如果所有的法官都认为嫌疑人有罪,他反而会被赦免。那个年代的人们也许不懂高深的数理逻辑,但立法者已经意识到,全体一致的判决往往意味着司法过程,甚至司法系统出现了问题。看来,人多不一定可靠。