- +1
明哲保身的决策:这个决定做得对,下次别这么做了
原创 李纾 复旦商业知识
杰夫·贝索斯(Jeff Bezos)说:吾乃吾选(We are what we choose)。
那么,人又是如何做出选择(决策)的呢?
人类对风险决策理论的系统探究始于数学家布莱士·帕斯卡(Blaise Pascal)和皮耶·德·费马(Pierre de Fermat)对“是否信上帝”的“帕斯卡赌注”问题的研究。两人首次将“不确定性决策”系统、公式化地上升为理论——期望价值(Expected Value,EV)理论。自此,大部分研究者均认同人的决策应是基于“最大化”或“最优化”原则做出的。
目前决策理论的发展脉络大约是:即便被选中的选项被证明不是客观上最好的(如期望值﹝expected value﹞最大的),也一定是主观上最好的(如预期值﹝prospect value﹞最大的),即无论如何都无法脱离“最优化”。
然而,在现实生活中,有一种决策是国内外教科书鲜有提及,但现实中却处处有迹可循的决策:明哲保身决策(defensive decision),也称作防御性决策。这种决策与“效用最大化”决策毫不相干,决策者并不在意被选中选项的总体收益大小如何,而只关心做出的选择是否能使自己免除被问责的风险。
被文献报道的明哲保身决策多见于医疗行业中,根据一份意大利保险公司协会的年报,1994-2008年,每年针对医院和医疗从业者提出的索赔数量增长了近800%,从3,150起升至近30,000起。面对激增的医疗诉讼和索赔案例,医生为了防止自己陷入无穷无尽的麻烦与纠缠,在诊断时,即便明明可以通过自己的常识与经验做出准确诊断,却依旧建议患者额外进行多项且多余的医学检查,以致宝贵的医疗资源被浪费,同时又加重了患者负担。
值得注意的是,明哲保身决策并不等于决策会更加保守,它的目的仅仅是保证决策者本人得以免责。如果一个决策是冒险的,但可以使得决策者逃脱责任,决策者也会义无反顾地做出选择。例如,在2008年国际金融危机前,一些投资经理在觉察市场泡沫的情况下,仍冒险投资,最终导致投资亏损。如果投资经理出于风险规避的原则进行决策,在明知面临资产贬值的情况下应该选择更加保守的选项——撤回资产或停止投资,但投资经理却选择了更加冒险的投资方案,因为行业中其他人也是这样做的,这个方案符合大家认知的趋势和常规流程,如果出现问题他们不需要承担责任。
我最早感知到这类决策的存在,缘于与全国风险管理标准化技术委员会(SAC-TC310)一位刘姓委员的一次交谈,他当时担任中国国际项目管理创新战略联盟(SACIPMI)副秘书长等职务,曾为诸多中央和地方大型企业提供项目风险管理等服务,因此他十分关注行为决策的风险问题。他在心理所的一场交流中表示:因为中国国有企业在海外存在大量风险投资(如投资开采油田、矿山等),所以非常渴望了解和接触国内有关风险决策的最新研究进展。
在交谈中,我发现国内学术界无论是在行为还是脑、基因领域开展的研究,都不能给出让他满意的答案。因为,他想要的已经不是如何在多个风险投资项目中计算、选择最高的投资回报率的问题。他更关心的是决策者万一投资失败,众人是否可以拿学术认可的“权威规则”来自保(免责)。
举一个每个人都能明白的生活例子来帮助我们体会刘姓委员的担忧。
饭店服务员:“请问您吃什么?”
顾客:“我不熟悉,你推荐个菜吧。”
饭店服务员1:“我们店里顾客得的最多的是xxxx。”
饭店服务员2:“我推荐您可以尝尝xxxx。”
服务员1的推荐即是可以免责自保的答案;服务员2的推荐则是尝试基于顾客“效用最大化”原则做出的回答。
由此我想到,现在的企业似乎存在一种“奖惩”不对称的状态:决策者选择正确,会被视作职责所在、本应如此;决策者选择错误,就需要承担责任、付出代价。如美国前总统克林顿曾抱怨:“不要用我所犯的一个错误来评判我,而要用我所做的九十九件好事来评判我。”(Don’t judge me for the one mistake I have made, but on the ninety-nine good things I have done.)这种不对称导致决策者不是尽力寻找、选择“最大化”或“最优化”的选项,而是尽力寻找、选择不会给其带来惩罚的选项。由此,常言道的“不作为”领导人便产生了。
试想,不作为的干部,可不就是做出了“明哲保身”的决策?从公共利益出发,或是从“最优化决策”的本意出发,使决策的结果能够达成效用最大化应当是决策者的终极目标。然而,防御性决策却偏离了决策者的初心,硬生生地使决策脱离了“效用最大化”的正轨。
那么,究竟应该如何去避免防御性决策带来的危害,将决策拉回正轨呢?
我们课题组今年翻译了一本由行为经济学开山鼻祖、诺贝尔经济学奖得主丹尼尔·卡尼曼所著的新书《噪声》(Noise: A Flaw in Human Judgment),书中花了很大篇幅介绍了这类问题。
《噪声》一书中提及众多行业,如医疗、保险、法律、教育、商业等领域都存在这么一种决策噪声,这种噪声与决策偏差不同,它主要来自决策者之间由于各种原因导致的决策不一致性,如良医与庸医由于知识经验不同针对同一个患者可能会给出完全不同的诊断,同理心强与规则性强的法官针对同一类案件可能又会执行不同的判罚。
书中认为,为了防止这种噪声影响人们的决策,应当遵从那些已经符合事先标准化的《手术分级管理规范》《量刑指南》(Sentencing Guidelines)或常规流程等等的选项。换句话说,要用一套“标准化流程”或曰“算法”对决策进行降噪,以保证决策的“正确”。
作者推荐对决策流程进行“降噪”处理。书中提及的“降噪”方案看起来很优美,但细细读来,读者们当会发现:尽管《噪声》通篇没有用过“防御性决策”一词,但书中列举的法官、医生等案例,希望通过决策标准化流程来对抗噪声的思路却正迎合了上文提及的那位刘姓委员的需求。降噪的策略何尝不是助长“防御性决策”的土壤?
也就是说,降噪做得越好,越发为“防御性决策”提供可能。
如选择了有“算法”答案的选项,一旦出了问题,决策者只要保证决策程序的“规范性”,便可免责。这些“算法”就等于决策者的“免死金牌”。若决策者遵从了“算法”,并且笃信其正确性以及不用为决策承担个人责任带来的安全感,他们还会从患者、投保人、诉讼人、考生、客户利益最大化的角度出发去选择吗?
由此联想到,值此世界百年未有之大变局,当人类遇到人工智能决策,定会为决策降噪策略提供种种便利和可能。例如,当违章司机遇到人工智能交警执法、当犯罪嫌疑人面对人工智能法官的审判、当患者接受人工智能医生的诊断或治疗,原先我们所理解的或正尝试理解的人类行为模式(噪声)或将统统消失或失效。然而,当机器和算法帮助人类“降噪”时,并不能保证守住“效用最大化”决策的初心。
让我们回溯一下美国著名的司法案例—辛普森杀妻案。简要案情如下:
当年,在此案调查过程中,有多方证据指向辛普森为犯案者。但由于警察取证、搜查等过程中出现程序违规,导致向法庭提交的证据不符合法律要求,依据法律,辛普森最后被无罪释放。
时隔多年后,辛普森著书《如果我做了》,公然袒露了自己的杀人行径,但在此时,即便检方有了新证据想要再次起诉他,却也因为同一刑事案件不可被重复起诉的法律规定,无法让他承担刑事责任。
此案中,法官严格按照司法程序办案,不采信违规的证据,最终释放了辛普森,但却在随后的民事法庭的审判中对辛普森进行了重罚,或许这是一种因刑事法庭无法实现实体正义而对受害人的“利益/效用”做出的补偿。
我们所担忧的问题即是:如果辛普森案交给刑事法庭的人工智能法官审理,人工智能法官一定会比严格依循“规则”的人类法官审判得更没有“噪声”,更不会觉得在刑事法庭上依据法律释放辛普森有任何不妥。因为法律“规则”和“程序”在未来会是人工智能法官的预设程序。其结果便是机器也无法达成我们所期望的“不忘初心”,为受害人做出“利益/效用最大化”的判决。
更有甚者,如果辛普森案交给民事法庭的人工智能法官,人工智能法官对辛普森的惩罚一定不会比人类法官判得更重,更不会出于“仁慈、同情心”为受害人的“利益/效用”做出有“噪声”的补偿。因为对于人工智能法官来说,刑事和民事法庭所审判的,已经是两个完全独立的案件了。
如此可见,当人类遇到有“算法”可循(噪声很小)的人工智能,收获的可能是与效用最大化原则更背道而驰的决策结果。
因此,如何遵循效用最大化原则而做出决策仍是吾将上下而求索的漫漫之路。
□ 作者/李纾(《心理学报》主编、中国心理学会决策心理学专业委员会创会主任)
□ 图/视觉中国
□ 本文刊发于《管理视野》2021年12月,版权归《管理视野》所有。
IFBK 0228 The End
原标题:《明哲保身的决策:这个决定做得对,下次别这么做了》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司