12 統計-集中趨勢的量度 (Statistics – Measure of Central Tendency)

12.1         平均數 (Mean)

平均數是所有數據的總和除以數據的總數目所得的商,即

其中  是平地數的符號,xx2x3等是數據的值(共有n)

 

12.2         中位數 (Median)

先把數據按大小順序排列,中位數就是“中間”數據。

l   如數據的數目n是奇數,則第(n+1)/2 個數據是中位數。
例如有7個數據,第4個是中位數。

l   如數據的數目是雙數,則第n/2和第 (n/2 + 1)個這兩個數據的平均數是中位數。
例如有8個數據,第4和第5個數據的平均數是中位數。

 

12.3         眾數 (Mode)

眾數是指一組數據中,出現次數最多的數據。

 

12.4         求大量不分組數據的平均值

l   對於分組數據,一個數據出現的次數就是“頻數”(Frequency)

其中ff2f3等是各數據的頻數,“ff2f3”則是數據的總數量。

 

l   中位數可由頻數分佈表中間位置的的數據求得。

 

l   眾數可由頻數分佈表中頻數最高的數據求得。

 

一般計算時,除非題目指明,否則我們用的也是“”。值得留意的是只要我們進行大量試驗(例如擲一萬次銀仔),“實驗概率”應與“理論概率”相當接近。

 

12.5         求大量分組數據的平均值

所謂分組數據(Grouped Data)就是我們只知每組數據據的數量而不知當中各數據的值。

例如“年齡由1019歲的男生有5個”就是一組分組數據。

 

l   我們可利用每組數據的組中點(Class Mark)來代表整組數據,從而求出全組數據的平均數。

 

l   根據頻數分佈表繪畫累積頻數多邊形,一半的數據便是中位數。

 

l   頻數分佈表中頻數最高的組別稱為眾數組(Modal Class

 

12.6         加權平均數

(或權數)是用來表示一組數據中每一項目的比重。。

 

 

同學最常接觸的加權平均數應該是“成績表的平均分”。在計算平均分時,有些學校會把中文同英文的分數會“乘2”(即中、英文的權是2,其他科的權是1)。

 

假設考試只考3科。一位學生的得分分別是中文80分、英文70分、數學60分;

 

12.7         兩組數據的比較

l   A組數據的平均數、中位數及眾數都較B組數據高時,
我們可以知道A組的數據整體上比B組大。

l   當我們只掌握部分資料,或三個平均值不一致地較高或較低時,
我們只能作出較有可能的判斷。

 

在不同的情況下,使用各平均值作比較有它的優點:

l   當數據中沒有極端值時,平均數可以公平地量度集中趨勢。

l   當數據中有極端值時,我們可以用中位數量度集中趨勢,原因是它不受極端值影響。

l   當要茩咿騔W數最高的數據時,我們會用眾數(眾數亦不受極端值影響)