马克·吐温这样吐槽过统计数字,“谎言有三种:谎言,该死的谎言和统计数字”。
马克·吐温
数据总是能给人以客观真实和事实确凿的感觉。但数据本身只有工具意义,也就是必须在相应的情境中使用,了解其相关背景。欧美媒体在新冠肺炎疫情爆发后,已经向包括中国在内的大量新兴市场国家示范了如何通过正确数据的错误解读,从而得出谬论。
美国经济学家、斯坦福大学胡佛研究所高级研究员、芝加哥经济学派的代表人物托马斯·索威尔在其所著的《歧视与不平等》一书中毫不隐晦地抨击了美国公共政策改进过程中,相当数量的媒体、经济学家、专栏作家为了追求“美好”的目标,而错误甚至恶意使用数据的具体做法。
服务“政治正确”,用正确数据佐证失实/夸大观点
比如,21世纪初,有人声称,在美国,黑人申请住房抵押贷款面临明显歧视。美国民权委员会的数据显示,44.6%的黑人申请者被拒,而白人申请者被拒的比例只有22.3%。但美国民权委员会悄然隐匿了一个参照数据,亚裔美国人和夏威夷原住民申请被拒率只有12.4%。
美国民权委员会以及为之站台的美国主流媒体,仅仅通过对照黑人和白人申请者申请住房贷款的被拒率,就得出银行机构歧视黑人的结论。但美国的《亚特兰大宪法报》注意到,造成黑人、白人、亚裔等居民申请被拒呈现较大差别的关键因素,在于信用分的不足。而且,亚裔申请者被拒率最低的事实,也无从得出在美国亚裔居民获得了比白人居民更多的特权待遇的结论。
美国官方统计部门会发布家庭收入数据的对比。媒体经常采用诸如收入最高的20%的家庭的收入是收入最低的20%家庭的X倍这样的简化结论,来渲染贫富差距。《歧视与不平等》这本书认为,尽管20%的家庭数量相等,但前20%的家庭有6900万人口,而底层20%的家庭则有4000万人口,仅以户数收入来对照收入差距,至少很不严谨。
某种意义上可以认为,用人均收入来取代家庭平均收入进行对比,不仅更能说明准确的收入差距,而且也清楚地证明了一个事实,那就是社会底层人员更难以组建家庭,生育的下一代的数量更少。
托马斯·索威尔还指出,包括一些诺奖得主在内的经济学家、政治学家,以及知名媒体经常信口开河,动辄就是美国的社会流动停滞。书中援引了密歇根大学的一项研究,1975-1991年的美国工薪阶层人士中,最底层的20%的人中的95%在1991年后就已经不在最底层了,其中有29%的人上升到了最底层的20%,只有5%的人仍然处于最底层29%的位置。托马斯·索维尔认为,20%的5%就是1%(在美国约为三百万人),这些人的生活境遇仍然值得同情、关注,但不能仅仅以1%的人为依据来设计公共政策。书中还援引统计数据指出,1996年收入最高1%的美国人中,到了2005年只有原本不到一半的人仍然停留在那个最高序列。
在美国,在考察黑人、白人、亚裔等不同族裔居民的社会和经济发展空间时,社会学家以及其他一些观察人士常常将黑人等族裔的问题归咎于政策,比如在学业竞争中不敌白人,更是无法与亚裔学生相比,也认为是黑人社区教育配套不足所导致的结果。托马斯·索威尔对此嗤之以鼻,他列举了美国一些地区家境和教育资源相同的黑人、白人、亚裔家庭之中孩子对待学业的态度,黑人学生花费在功课上的时间最少,花在游戏和电视上的时间最多;而亚裔学生最为勤奋。这种情况下,美国许多高校仍然沿袭着对于黑人申请者最为有利、相对而言对待亚裔学生最不友好的申请政策,不能不说是屈从于“政治正确”原则的软弱和谬误。
《歧视与不平等》这本书的一个基本观点是,哪怕是那些权威媒体和知名专家,很多时候为了得出所谓的正确结论,会悄然剪裁、隐匿、拼接有关数据。比如,为了证明黑人在高校中受到了职场歧视,有关媒体和专家往往会直接列举诸如黑人教员收入低于白人教员的数据——托马斯·索威尔认真翻阅了美国许多高校的数据,将相同高校、相同学科领域、职衔和发表论文数量相似的教员进行对比,得出的结论却是黑人教员的收入高于白人教员;男性教员收入总体上高于女性教员;但未婚女性教员在收入上高于未婚男性教员。
文字游戏的种种玩法
美国学界和媒体当然不仅仅善于使用数据来“推导”错误结论。再来看文字游戏。
无论个人、群体,还是组织、国家追求实现某项目标,最终达成与否,都取决于很多因素——这些因素之间的微小差异很可能带来结果的巨大差别。有时候,我们能够清楚地推导出实现某方面目标,通常需要多项先决条件,如果某个人、某个组织实现了该目标,事前却并不完全具备所有先决条件,则意味着运气的存在,其成功本身是一定概率的结果。
比如,英国率先实现工业革命,再与其他大国实现这项目标的进程进行对比,可以找出共性因素,却并不包括一些历史学家、经济学家、政治学家赞美的英国政治方面的体制特征,否则就无从解释德国和俄国的快速工业化,以及美国19世纪后期迎来科技革命时,政治腐败最严重,也谈不上广泛的大众民主。又如,民主政治与科技创新活力呈一定程度的相关关系,却并不紧密,更不具有某些学者言之凿凿的因果关系。美国二战期间采取了接近于德国和苏联的集中模式,才成功研发出了核武器,战后的计算机和互联网革命的科技架构也均建基于该模式。
因此,读者尤其需要警惕历史学、经济学、政治学、社会学、人类学等许多学科的通俗读物中,掺杂那种将个别先决条件说成是唯一条件,甚至将根本不足以构成先决条件的“弱关联”因素说成是决定性因素的文字游戏。
《歧视与不平等》这本书将歧视分为I型歧视和II型歧视。I型歧视针对的是个人,无论这个人来自于什么群体。而II型歧视则与群体具有更强的联系。托马斯·索威尔认为,美国媒体在解读一些数据的统计差异时,会自动将差异等同于II型歧视,就像是前面所提到的那样,只要黑人申请者申请住房贷款被拒的比率高于白人申请者,则无论什么原因,也要断定这一定源自种族歧视。类似的现象是,只要出现某类性别的申请率或者被拒率,不同于另一性别,也很容易被解读为性别歧视。
文字游戏很多时候掩盖了事实本身的复杂性或者说丰富性。一个鲜为人知的事实是,在20世纪40-50年代,美国很多城市的贫民区的黑人可以毫无顾忌地睡在公园、消防通道、屋顶,而白人则经常光顾市中心的酒馆和夜总会——前者并不担心会被抢劫,或者遭遇白人警察的骚扰;后者对于进入黑人聚集区的担忧也不是那么明显。
这个事实意味着,民权运动之后的美国,对于黑人和白人来说都变得反而相对更不安全。某种意义上,这与我们老生常谈的一个问题,也就是美国20世纪60年代开始将一些所谓的低端产业转移出了美国,使得中下阶层的黑人和底层白人失去了工作,并且失去了组建家庭的能力。正如书作者指出的那样,个人生活方式的选择,对于黑人和白人都有重大影响,如果没有稳定工作,进而失去了维系稳定家庭生活的能力,这将直接恶化相关街区的治安,从而导致街区呈现出所谓的“巴尔干化”。但这样的事实,很难通过美国主流媒体以及畅销书得以反映,人们反而获知的是,民权运动解放了黑人,带来了社会进步,也改变了他们(她们)的境遇,但还有社会阻碍导致平权尚未完全实现。
托马斯·索威尔认为,为了追求所谓的政治正确,美国政界、学界、媒体已经将华人、日本移民、爱尔兰人、犹太人在美国早年的发展历史一笔抹杀,将这些群体基于几代人的努力所累积的成果统统描述为“特权”,要求通过美国政府进行调控才保证黑人获得平等待遇。而且,“更糟糕的是,那些在价值观、纪律和工作习惯中长大的孩子也被认为‘享有特权’”。


