國立清華大學醫學科學系在學生、科學服務社前社長。我不是科學家，只是一位自然哲學愛好者。一個記性不太好卻又什麼都想學的大學生，相信著透過不斷地思考、整理、撰文，終能將無涯學海，塞入兩耳間不到二十公分寬的頭顱中。

為什麼樣本標準差要除以 n-1？

2022 年 11 月 28 日

眾所周知，標準差是離均差的方均根，取平均時的分母自然是數據的數量 n，但這個標準差只限於用在計算母體，抽樣後計算樣本標準差時卻要改成除以 n-1，這是為什麼呢？

本文將以兩種方式來說明，第一種方法比較容易理解但也較不嚴謹，第二種則涉及較多數學運算，但可以彌補第一種的缺失，提供更明確的佐證。

附上樣本標準差的公式：

從自由度的角度來看

什麼是「自由度 (degree of freedom)」？

自由度一詞在許多領域都有，這裡是指統計學上數據的自由度，意思是一個樣本中其數值能夠自由變動的數據個數。

我們先看母體標準差的公式：

公式將所有數據和平均的差異加總（平方是為了確保其恆正，最後再開根號修正單位），並平均分配給 n 個數據。換個角度來看，每個數據偏移平均的量有大有小，標準差就是將數據偏離平均 μ 的程度平均分散給所有數據，因此達到呈現出「平均的數據差異程度」、「平均的差距」的效果。

當進行抽樣時，我們會期望樣本的行為和母體一樣，這樣這個樣本才有足夠的代表性，來作為母體的縮影。而在計算標準差前必須知道平均是多少才有辦法計算離均差，我們當然也不知道母體的平均 μ，所以估計樣本平均 x̄ 會和母體平均 μ 相差不多。就像我們做民調時，也是預期隨機抽出的部份人民的結果，會呈現出全體人民的意志（畢竟做普查的成本太高，只好參考抽樣結果）。

所以用 x̄ 來估計 μ，公式中原本 μ 的位置被 x̄ 取代。

可是明明抽樣是隨機的，如果 x̄ 要很神奇地等於 μ，其中必定有數據是不自由的。可以想像當我們抽了第 1, 2, 3, ..., n-1 個數據後，第 n 個數據必須要很神奇地是某個特定值，讓 x̄ 被強制修正成 μ，如此才會滿足我們原先對 x̄ 的期待。

現在要來計算標準差，一樣我們期望可以從樣本的標準差來推估母體，所以計算樣本的每個數據的離均差（這裡的「均」當然是指 x̄），進行平方加總後就可以得到總共的差距，然後要將這個總差距平均分散給所有數據......？

欸？可是並不是每個數據都能夠自由變動，獨立於其他數據，這樣還把誤差分給所有 n 個數據還合理嗎？因為我們是拿樣本來推估母體，可以將每個數據的離均差想成是它和平均 x̄ 之間的誤差，而又因為我們對 x̄ 的期望，其中至少要有 1 個數據為了要使 x̄ 等於 μ，它的值會由其他數據決定，那麼它和平均的差距當然也是，所以它的離均差其實是來自於其他 n-1 個數據，並不是這數據獨立造成。

簡言之，為了滿足原先對 x̄ 的期待，至少其中 1 個數據必須受限，才會做出正確的估計；或者反過來說，因為我們進行了估計，所以會期望至少有 1 個數據是受限的，統計學上用「自由度少了 1 」來描述這個概念。

因此計算樣本標準差 s 時就必須把總共的誤差只分配給 n-1 個數據，不只是不違背我們期望的數據行為，除以一個較小的數讓 s 稍微大一點，這樣估計也更加保守，而且也不用減 2 或減 3 等更大的數，減 1 已足夠。

不知道看到這裡是否有注意到，這樣計算出的結果本質上其實不是「樣本的標準差」，而只是一個我們給出的適合樣本的標準差公式，目的是為了做出適當的估計。這樣的估計方法在統計學上稱為「點估計 (point estimation)」，因為這只用單一數值來估計實際值，有別於像是信賴區間的「區間估計 (interval estimation)」，是用一段區間來進行估計。