圖/yapei
文/檸檬
每在學期一開始,通常第一件事情,是選出班上的各類幹部,如果這個班級的同學們是熟識的,通常心裡會有特定的人選,例如去年小華當班長,大家覺得他擔任班長一職,相當盡責也認真,今年小華繼續被選上班長的機率就很大,而這樣的機率加入了「人為」的因素,因此無法客觀的判斷每個候選人的機率為何。如果,在一個大家彼此不熟的班級呢?每個候選人被選上的機率將會是比較接近的。
重複實驗 機率平穩
再舉個大家一看就懂的例子,當我們投擲一顆公正骰子(沒有被動過手腳的骰子),我們可以知道,每個點數被投擲出來的機率應該都是1/6。但是,如果真的拿一顆公正的骰子投擲10次,每個點數出現的機率都會是1/6嗎?我們知道可能性不高,但是如果投擲100次、1000次⋯⋯甚至一萬次呢?愈高的投擲次數將使得每個點數被投擲出來的機率愈接近1/6,而這樣的方法被稱為「大數法則」(Law of large numbers)又稱大數定律、大數律,是指次數愈多的重複實驗,其「算術平均數」就有愈高的機率接近期望值。
問題來了,算數平均值和期望值又是什麼呢?期望值可以參閱本報(2021年5月18日的《發財金的期望值》一文),而算術平均數則是所有資料的總和除以所有資料的個數,例如,班上有30位小朋友,這30位小朋友身高的算術平均數,需要將每位小朋友的身高相加後再除以30,即可得到30位小朋友身高的算術平均數。
然而,當我們在計算或是判斷某些資料時,單以算術平均數來判斷可能會遺漏某些極端值,例如在2022年,台北市的平均月薪是4萬元,但是這是將所有人的薪資加總起來除以人數所得,但這個數字能代表我走在路上時,碰到的多數人平均月收入都是4萬元嗎?答案一定是否定的,在台北市,年收破百萬、千萬,乃至億的人不在少數,而也有許多低收入戶,甚至無法達到基本薪資,所以此時如果以算術平均數去判斷台北市民的月薪,將是相當不準確的。
法則風險 評估難測
那麼大數法則可不是僅能應用在投骰子唷!大數法則通常被用來測定隨機事件的「長期穩定值」。例如保險業者,通常會僱用的大批精算師,根據大數法則,針對不同的事件、意外評估風險,計算出長期的穩定數值,再根據這樣的風險數值高低而訂定保險費的高低。簡單來說,保險業者的保費訂定是依靠大數法則,精準訂定各項意外或風險的理賠金額及欲跟保人收取的保險費用,這樣才能從中獲得利潤。
但大數法則這樣的算法一定是萬無一失的嗎?當然不是,在這次新冠疫情中,是史上前所未有的事件,精算師根本無從估算起風險值,也導致許多保險業者在這次疫情中紛紛慘遭滑鐵盧,須賠償大量的金額,也造成了極大的損失。因此,不管是怎樣的統計方法,都沒有保證萬無一失的可能,都僅能作為參考罷了!