2022年3月30日 星期三

人類判斷的雜訊






很多朋友可能都有這樣的經驗,同樣症狀的小病找不同診所或不同醫師,拿到的處方箋常是不同的藥品組合;同樣的案件,同一批檢方、辯方人馬,從初級法院一路上訴到高等法院,判決翻轉再翻轉,也不算罕見;奧運等運動賽事的一些項目需要評審評分,偶爾分數差距甚大而引起爭議,也常成為大家茶餘飯後的話題。

當然,這可以歸咎於只要有人,就有江湖⋯⋯哦不⋯⋯判斷的雜訊。有些朋友可能會樂觀地認定,未來我們可以利用人工智慧(AI)來取代人類作判斷,就能消弭這些雜訊,達成一個更公正公平的世界願景。然而,真是如此?AI不可能天生就懂得做判斷,在過程中,還是需要人類來訓練,如果我們都搞不清楚判斷的雜訊從何而來,我們該如何讓AI懂得哪些判斷更可靠呢?

還好,有三位大師級人物──丹尼爾.康納曼(Daniel Kahneman)、奧利維.席波尼(Olivier Sibony)、凱斯.桑思汀(Cass R. Sunstein)合著的《雜訊:人類判斷的缺陷》(Noise: A Flaw in Human Judgment)會是我們認識人類判斷雜訊最重要的一本好書!他們剖析了經營管理、醫學、法律、經濟預測、法醫鑑識、保釋、兒童保護、策略、入學申請、招聘、升職、績效評估、個人選擇等等領域會遭遇到的種種雜訊,讓我們看到雜訊的各種代價,並且提供實用的建議來預防雜訊。

康納曼是2002年諾貝爾經濟學獎得主,他的《快思慢想》(Thinking, Fast and Slow)是行為經濟學的經典之作;奧利維.席波尼(Olivier Sibony)是法國巴黎高等商學院策略與商業政策教授,著有《不當決策》(You’re About to Make a Terrible Mistake!);桑思汀是美國哈佛大學法學院教授,曾與2017年諾貝爾經濟學獎得主理查.塞勒(Richard H. Thaler)合著《推出你的影響力》(Nudge)。三位都是決策科學領域最頂尖的高手,這肯定是本不可多得的好書,定義了雜訊,指出它為什麼會出現,為什麼應該減少雜訊,以及如何減少雜訊。他們從管理學到司法系統再到醫學科學等各個領域找到案例來作理論的支持,結合了學術研究、案例故事和統計資料來讓我們好好認識一下雜訊。








從個人到組織及國家,都要時時面對各種決策判斷。判斷的失誤,小則蒙受一丁點經濟上的損失,大則禍國殃民。雜訊造成的錯誤不會相互抵消,《雜訊》舉例指出,一個該被判關五年的罪犯,如果被判成三年或七年有期徒刑,正義其實都未獲得伸張。簡單地說,對於雜訊,負負不會得正,只會沒有最負,只有更負。

在這個疫情年代,許多國家誤判這個冠狀病毒的傳播力,以及染疫的嚴重性,導致醫療崩潰而造成大量人民死亡。面對同樣的病毒,世界各國五花八門的政策多樣,簡直就是一個雜訊的超大型社會實驗,讓我們見識到不同政策如何影響傳染病的傳播和應對。即使像台灣初期防疫有成,但後來也因判斷失誤而近乎封城了幾個月,之前疫苗採購上也力有未逮。即使是在西方先進國家不缺疫苗,但仍有不少阿宅拒絕接種而染疫,和病死相比,還能活著悔不當初就算小事了。

康納曼在《快思慢想》主要要談的是人類判斷的偏差,而《雜訊》要談的則是雜訊⋯⋯呃,廢話!那偏差和雜訊的差別是?我們可能想像有四個阿宅在靶場中打靶,各打了一打子彈。阿宅甲的十二發幾乎都打在靶心上,請他回家洗洗睡!阿宅乙的十二發全落在靶心外,但集中在一個邊緣角落中,這是種偏誤(biase);阿宅丙的十二發散佈在靶紙各處,其中有一發正中靶心,這就算是雜訊(noise);而阿宅丁的彈著點相當分散,但偏向靶紙一側,那是同時有偏誤又有雜訊。如果把他們的靶紙反過來看沒有畫靶心的背面,我們會搞不清楚阿宅甲或乙誰的比較準,但是可以很清楚阿宅丙和丁肯定有雜訊。沒錯,我們不需要知道那些阿宅究竟有沒有好好瞄準靶心,就能衡量雜訊的有無和大小。

這樣的判斷需要客觀,和個人喜好無關。例如有些強檔電影,有人認為是神作,就一定會有人想吐槽,我們看靶紙背面也可能發現彈著點頗分散。但個人喜好的多樣性並不是雜訊。然而,專業影評人對票房的預測,就有可能出現雜訊,因為票房會有客觀數據。過去行為經濟學和決策科學主要研究的是偏誤,市面上大量有關科普書籍主要就是在討論人類判斷的偏誤,而雜訊則常被冷落。

《雜訊》先用刑事判決和保險理賠來探討雜訊和偏誤的差異,並且提出雜訊審查(noise audit)來衡量雜訊的大小。接著《雜訊》探討場合雜訊(ocassion noise),這是指同一個人或一群人,僅因為場合不同,居然會對同一案例作出不同判斷,例如發言先後順序都有影響。這類場合雜訊比過去所知還多!包括法官在午餐前後的判斷會有明顯差異、醫師在同一天上下午的診斷也會有所不同、連氣溫高低和天氣陰晴都會影響人們的判斷、文字資訊印在左右側也會讓消費者做出不同抉擇(從右向左讀的希伯來文會有相反效果)。這幾天就有幾位學術界的朋友不約而同地分享了一個新研究,就是連投稿學術期刊是在星期幾,都會影響被接受的機率。

《雜訊》要繼續談預測性判斷(predictive judgement)。演算法受歡迎就是因為雜訊較少。在許多情況下,演算法可以用於決策。然而,他們的目標是為改善人類判斷提供建議,而不是主張使用AI取代人類。演算法並不完美,至少到目前為止,對人類判斷的領先優勢還很不大。此外,演算法在許多領域可能永遠都不會完美,因此人類的判斷不會被取代,這就就是偏誤和雜訊必須改進的原因。

那麼,究竟我們為何會出現雜訊?這和人類心理學有關。前述解釋了偏誤和雜訊的不同,如果眾人都有相似的心理偏誤,那集合起來就會出現統計偏誤。可是在許多狀況下,大家的心理偏誤都有所不同,那就造就了系統雜訊;也有雜訊是因為對量表的理解不同,也有對證據不同取捨的型態雜訊。

既然找出和降低雜訊很重要,但我們大多只是忽略了它。造成這種情況的原因有很多,其中之一是人類更擅長因果思考而不是統計分析。這意味著我們更容易關注偏誤,因為我們可以針對偏見說出有趣的因果故事,但是雜訊卻要用統計學的思維來認識。

即使消除雜訊很重要,他們提出決策保健(decision hygiene),介紹減少雜訊的方法。《雜訊》有三個用心製作的附錄,來讓我們進行雜訊審查,製定審核表和修正預測。《雜訊》指出,有些人決策的雜訊就是比較低,這些人比較擅長使用《快思慢想》中提到的「系統二」進行緩慢但謹慎的思考,而且心胸開放,願意接受新的資訊而修正原有的想法。

他們也建議,為了減少決策過程中的雜訊,最好先請多個人做出獨立判斷,然後將他們聚集在一起解決分歧。他們也指出,限制了直覺和特殊偏好,不僅可以減少偏見,也可以減少雜訊。例如,很多人資或主管在面試時喜歡隨興地詢問應徵者各種問題,可是有許多研究發現,讓面試官固定使用相同順序問出相同問題,反而比較能夠更正確地判斷出最適合的人選;《雜訊》還提出,組織可以透過任命一名決策觀察者來負責解決雜訊和偏見。《雜訊》提供了一個檢核表,以幫助這些決策觀察者診斷組織正在避免還是增加決策上的錯誤。

三位大師一起來寫這本《雜訊》,讓這本好書有了紮實的基礎,但也因為他們很有野心地顧及的面向頗多,加上不像偏誤那樣早就廣為大家所知,而且有很多科普好書,加上雜訊的理解要用上統計思維,《雜訊》的比起他們的《快思慢想》、《不當決策》和《推出你的影響力》來說,都較有閱讀上的門檻。然而,《雜訊》還是非常適合對公共政策、企業經營、個人決策等感興趣的朋友投入心力來好好拜讀,在大家都對雜訊較陌生時,這是投資的好時機!




本文原刊登於閱讀最前線【GENE思書軒】

沒有留言:

Related Posts Plugin for WordPress, Blogger...