hlperng 發表於 2013-7-29 12:09:12

參數、動差與統計量:機率統計分析時容易混淆造成困擾的三個數

本帖最後由 hlperng 於 2020-8-18 13:07 編輯

在應用機率與統計等數學理論進行品質、可靠度、安全性、或其他工程分析時,伴隨著每一個機率分佈有三個數量或多或少會造成困擾:參數 (parameters)、動差 (moments) 與統計量 (statistics)。這三者之中,參數是直接顯示在數學函數中、動差與統計量則是必須經過計算才能得到,三者之間彼此存在著某種因果關係,為有效釐清其目的,有必要清楚地予以認知與識別,可方便後續溝通與應用。

參數是機率分佈函數的特性值,為構成機率分佈函數的項目,直接從公式可以找到與確認,參數說明機率分佈的特性,常用的有位置參數 (location parameter)、尺度參數 (scale parameter) 與 形狀參數(shape parameter),利用它們與隨機變數的關係可以識別,例如位置參數與隨機變數為加減關係、通常代表分佈的最可能值、最小值或最大值,尺度參數與隨機變數為乘除關係,形狀參數與隨機變數為冪方或開冪方關係。

動差是特定函數的期望值,必須經過數學(微積分)計算才得到的數,分為原點動差 (moments about origin) 與中心動差 (moments about center),有階層關係,常用的為一階動差與二階動差。

統計量為根據樣本觀測數據經過數學(算術)計算得到的數量,常用的為樣本平均數 (sample mean) 與樣本標準誤差 (sample standard error)。

常態分佈有兩個參數,分別為位置參數 μ 及尺度參數 σ,一般卻稱位置參數為平均數、尺度參數為標準偏差;指數分佈有一個參數,尺度參數 λ;對數常態分佈有兩個參數,尺度參數 μY、形狀參數 σY;常用的韋伯分佈有兩個參數,尺度參數 η、形狀參數 β,偶而會出現第三個參數,位置參數 γ。

已知機率分佈的機率密度函數為 f(x) ,- ∞ < x < + ∞ ,則 k 階原點動差 (μk) 及 k 中心動差 (ηk) 的定義分別為:

\mu_k = \int_{-\infty}^{+\infty} x^k f(x) dx

\eta_k = \int_{-\infty}^{+\infty} (x - \mu_1)^k f(x) dx

當 k = 1 時,為一階原點動差,μ1 ,一般又稱為平均數 (mean):

\mu_1 = E(T) = \int_0^{\infty} t f(t) dt = \mu

而 k = 2 的二階中心動差 ,η2 ,稱為變異數 (variance):

\eta_2 = V(T) = E\left((T-\mu)^2\right) = \int_0^\infty (t-\mu)^2 f(t) dt = \sigma^2

變異數開根數為標準偏差 σ:

\sqrt {\eta_2} = \sigma

常用的統計量有樣本平均數 \bar{x},樣本變異數 s2 ,或樣本標準誤差 (standard error) ,s,分別為:

\bar{x} =\frac{1}{n} \sum_{i=1}^n x_i

s^2 = \frac{1}{n-1} \sum_{i=1}^n \left(x - \bar{x} \right)^2

s = \sqrt {s^2} = \sqrt {\frac{1}{n-1} \sum_{i=1}^n (x - \bar{x})^2}

由上三式可知,統計量與機率分佈無關,純粹可以根據樣本觀測值或量測值計算得到。
常態分佈有兩個參數:μ 為位置參數、σ 為尺度參數:

f(t) = \frac{1}{\sigma\sqrt{2\pi}} exp\left(-\frac{1}{2}\left({\frac{t-\mu}{\sigma}}\right)^2\right)

但是一般在應用時,大多稱 μ 為平均數 (mean)、稱 σ 為標準偏差 (standard deviation)。

事實上,常態分佈的一階原點動差 μ1 等於位置參數 μ,標準偏差等於尺度參數 σ。

描述機率分佈時,要用參數;動差則是隨機變數代表性的數,根據機率分佈的定義,依照期望值的定義計算得到的。


機率分佈機率密度函數位置參數尺度參數形狀參數平均數標準偏差
常態分佈
f(x)=\frac{1}{\sigma\sqrt{2\pi}}exp\left(-\frac{1}{2} \left(\frac{x-\mu}{\sigma}\right)^2\right)μσ-μσ
對數常態分佈f(x)=\frac{1}{\sigma_Y x \sqrt{2\pi}}exp\left(-\frac{1}{2}\left(\frac{ln x -\mu_Y}{\sigma_Y}\right)^2\right) μYσY exp\left(\mu_Y+\frac{\sigma^2}{2}\right) \sqrt{exp(2\mu_Y+\sigma^2)(exp(\mu^2)-1)}
指數分佈 f(t) = \lambda exp( - \lambda t) -λ-\frac{1}{\lambda} \frac{1}{\lambda}
韋伯分佈f(t)= \frac{\beta}{\eta}\left(\frac{t}{\eta}\right)^{\beta-1}exp\left(-\left(\frac{t}{\eta}\right)^\beta\right) ηβ\eta\left(\Gamma\left(1+\frac{1}{\beta}\right)\right)\sqrt{\eta^2\left(\Gamma\left(1+\frac{2}{\beta}\right) - \left(\Gamma\left(1+\frac{1}{\beta}\right)\right)^2\right)}













頁: [1]
查看完整版本: 參數、動差與統計量:機率統計分析時容易混淆造成困擾的三個數