我們開始幫你算 Brier 分數——一個關於「把握度」的產品決定

大多數人記得自己「決定對不對」，卻不記得當初「有多確定」。我們做了一個功能，逼你把把握度寫下來——然後用 Brier 分數告訴你，你的自信值不值得相信。

我們在 Insights 裡加了一個叫「校準分數」的東西。它不告訴你決策做得好不好，它告訴你一件更難堪的事：你說「我有八成把握」的時候，到底有沒有八成。

這是 Apexhone Phase 8 留存系統的第一個功能，藏在 Insights 洞察看板裡，需要累積 10 筆已回顧的決策才會解鎖。這篇想說明：為什麼我們花力氣做一個「會讓你不太舒服」的數字。

你以為你在追蹤對錯，其實你該追蹤把握度

大多數人回顧決策時，問的是「我這個決定對不對」。這個問題有兩個毛病。第一，很多決策的結果要好幾年才明朗；第二，單一一次「對」可能只是運氣好——一個糟糕的決策過程偶爾也會撞對結果。

真正能在「結果還沒揭曉」之前就改善的，是你的把握度校準（calibration）。校準的意思是：當你說「我有 70% 把握」的那些決策，最後大約真的有七成成真。這跟過度自信偏誤是同一枚硬幣的兩面——校準差，通常就是系統性地高估自己。

Brier 分數由氣象學家 Glenn Brier 在 1950 年提出，原本拿來評估天氣預報——「降雨機率 70%」這種說法準不準。算法很簡單：把你事前的把握度（換算成 0 到 1 的機率）減去實際結果（成真是 1、沒成真是 0），取平方。分數越低越好，0 是完美校準。

一個說「我 90% 確定」結果卻錯了的人，Brier 罰他 0.81；一個老實說「我只有 60% 把握」結果也錯了的人，只被罰 0.36。換句話說，這個分數懲罰的不是「猜錯」，而是「錯得太篤定」。

我們本來可以做一個讓你直接輸入「73%」的欄位。但研究與我們自己的測試都顯示：人對小數點的精度是假的。你說 73% 和 71% 之間並沒有真實的判斷差異，那只是介面給你的錯覺。

所以記錄決策時，把握度是 7 個離散等級——從「幾乎不可能」到「幾乎篤定」。七個剛好夠表達層次，又不會逼你假裝有自己沒有的精度。事後回顧時你只需要回答結果成真了沒，系統把兩邊湊起來算 Brier。

想看看這個流程，可以從新增一筆決策開始——把握度欄位就在你選完框架之後。

校準曲線是統計物件。3 筆資料畫出來的「曲線」沒有意義，只會讓你對著雜訊腦補。10 筆是我們抓的最低門檻——不是因為它統計上足夠（其實還不夠），而是因為低於這個數，這個功能弊大於利。我們寧可晚一點給你一個有意義的數字，也不要早早給你一個會誤導你的數字。

這條原則跟我們做其他產品決定的邏輯一致：不為了「讓你早點看到東西」而給你一個其實在傷害你的功能。

常見的誤解是「校準分數會教我凡事少說一點把握」。不對。如果你把所有決策都報「50% 把握」，你確實很難被 Brier 重罰，但你的預測也變得毫無資訊量——一個永遠說「可能會、也可能不會」的人，根本沒有在做判斷。

好的校準是雙向的：該有把握時敢給高分、該猶豫時誠實給低分。它要訓練的是把你的自信「對準」現實，不是把自信整體調低。這也是為什麼我們建議搭配內外部觀點一起用——先看基率，再決定你的把握度該落在哪裡。為什麼這件事這麼難，可以讀過度自信為什麼是大腦的預設值。

校準分數現在對所有累積滿 10 筆回顧的用戶開放，Pro 升級會在曲線之外加上偏誤分群，看你在哪一類決策上特別過度自信。如果你還沒開始，先記一筆——校準是練出來的，不是想出來的。