排列組合 - 好用工具箱
排列組合與機率計算(二十三)機率由排列組合起步,發展至製程管制。平均數,變異數,樣本標準差,常態分布,中心線與控制限,能力指標,Z值與信賴區間。
機率由排列組合起步,發展至製程管制。
以擲骰為例,單次擲出正反面各0.5機率,當試驗次數趨近無限,形成鐘形曲線,即常態分布。
這種分布反映了多重因素下的隨機現象,愈大量資料,其誤差與不確定性愈難明確分辨。
舉例:平均數 μ = 所有數據總和 / 數量,偏差為 x - μ。
數學家千年來修正與發展多種分布與估計方法,其複雜名稱其實皆源自對機率的數學推演。
前述五篇中曾討論:
變異數 σ² = (x - μ)² / n,標準差 σ = √(x - μ)² / n,平均數標準差 σx = σ / √n,並加入有限母體修正係數 FPC。若樣本比例小於群體(n/N ≦ 1/10),FPC ≈ 1,估計值近似母體。
製程中,觀察分布曲線中心點為樣本平均 x̄,即 CL。,。
樣本標準差 σx 導出上限 UCLx = x̄̄ + 3σx̄,下限 LCL=x̄̄ − 3σx̄,範圍 R = UCL - LCL。進而推得能力指標 Ca、Cp、Cpk。
常態分布公式:
F(x; μ, σ) = [1 / (σ√2π)] exp{ -[(x - μ)² / 2σ²]}。
Z 值:Z = (x̄ - μ) / σx,可用 Excel 函數 =NORM.S.DIST(Z,1) 計算對應機率。95%信賴區間為 x̄ ± 1.96σx。
參考資料指出,n > 4 時可推得常用係數表,無需重複計算。
以樣本全距推得:UCL ≈ R̄ × D4,LCL ≈ R̄ × D3,A2 係數則由 CL 與全距之關係推出。
________________________________________
這是一份深具系統性的統計學筆記與思辨,結合了機率論、數理統計與品質管制的核心概念。以下是我對你內容的整理與補充,以利你更清楚地掌握背後邏輯:
其中 FPC 為有限母體修正係數(Finite Population Correction):
其中:A2=3/d2√n(d2為查表常數,根據樣本數n)
=NORM.S.DIST(Z, TRUE)
:計算標準常態分布的累積機率(即面積)=NORM.S.DIST(Z, FALSE)
:計算密度函數值
若你希望進一步整理成筆記或教材,可依下列結構劃分章節:
如你有特定公式想轉為圖示、Excel表格模板、LaTeX數學表示、或想寫成教材,我可以協助製作。你也可以提供一段範例數據,我來演算與圖示。是否需要我幫你整理成教材筆記或做成範例圖表?
________________________________________
嗯,這篇文章看起來是在講統計學中的機率分佈,特別是常態分佈和它在製程管制中的應用。讓我先大致理解一下內容。
首先,作者從二項分佈開始,提到當擲骰子的次數趨近於無限大時,分佈會趨近於鐘型曲線,也就是常態分佈。然後討論了平均值μ、變異數σ²、標準差σ,以及樣本平均的標準差σx̄,也就是σ/√n,還有有限母體修正係數FPC。
接著轉到製程管制,提到了控制圖的上下限UCL和LCL,以及Ca、Cp、Cpk等製程能力指標。還有提到用Excel的NORM.S.DIST函數計算Z值,以及如何用全距R來估計標準差,並解釋了A2、D3、D4這些係數的由來。
首先,我需要確認自己對這些概念的理解是否正確。
比如,二項分佈在n很大時近似常態分佈,這是不是中心極限定理的結果?是的,當n足夠大時,二項分佈會接近常態分佈,尤其是當p接近0.5時。
然後,平均值μ是母體的平均,而樣本平均x̄的標準差是σ/√n,這也符合中心極限定理,樣本平均的分佈會趨於常態,標準差是母體標準差除以根號n。
FPC修正係數用於當抽樣不重複且母體有限時,這時候標準差需要乘以√((N-n)/(N-1)),但若n遠小於N,這個修正係數接近1,可以忽略,所以通常當n/N小於10%時,可以不用修正。
接下來在製程管制部分,控制圖的上下限是基於常態分佈的3σ原則,也就是平均值加減三個標準差,這樣大約涵蓋了99.7%的數據。
這裡提到的UCLx̄和LCLx̄是控制上限和下限,計算方式是x̄ ± 3σx̄,而σx̄就是σ/√n,但實際應用中,如果母體標準差σ未知,通常會用樣本標準差或全距R來估計。
全距R是樣本中最大值和最小值的差,而用R來估計σ的方法涉及d2這個常數,因為R的平均值與σ有關,所以σ的估計值是R̄/d2。
然後,控制圖的係數A2、D3、D4都是基於這些估計方法推導出來的,比如A2 = 3/(d2√n),這樣UCLx̄ = x̄̄ + A2 R̄,而D4和D3則是基於全距的標準差來計算控制限。
不過,作者在文中提到σx̄的估計有使用FPC修正係數,但在製程管制中,通常假設生產過程是無限母體,所以可能不需要FPC,這部分可能需要再確認。
另外,Ca、Cp、Cpk是製程能力指標,Ca是準確度,Cp是精密度,Cpk則是同時考慮準確度和精密度的指標,這些的計算方式需要參考規格上下限和製程的平均與變異。
文章中還提到Excel的NORM.S.DIST函數,用來計算累積分佈函數或機率密度函數,Z值的計算方式是(x̄ - μ)/σx̄,然後用這個Z值查表得到對應的機率值。
例如,95%的信賴區間對應的Z值是1.96,這部分正確,因為常態分佈下,95%的區間是平均值±1.96標準誤。
不過,在控制圖的上下限計算中,為什麼使用3σ而不是其他倍數呢?
這是因為傳統上使用3σ可以涵蓋絕大多數的數據(99.7%),降低假警報的概率,但這也會影響檢出力的問題,可能需要權衡。
此外,A2、D3、D4這些係數的來源是基於全距的期望值和標準差,這需要查表或根據樣本大小n來決定,例如d2、d3這些常數是根據不同n值預先計算好的,所以作者提到不可能一直重新計算,所以製成表格方便使用,這也是正確的。
另外,關於標準差估計的部分,用全距R來估計σ,因為全距計算簡單,但效率不如樣本標準差,尤其是在樣本大小n較大時,全距的估計效率較低,所以通常n較大時(比如n>10)會改用樣本標準差,但傳統的Shewhart控制圖在n較小(如n=5)時使用全距是常見的做法。
還有,作者提到當n大於4時,可以推算出各個係數的值,這可能是因為當n超過4或5時,全距的分布更穩定,或者相關的d2等常數已經有足夠的準確性。這需要查閱相關的係數表來確認。
總之,這篇文章主要在串聯機率分佈(尤其是常態分佈)與製程管制中的控制圖應用,解釋了如何從理論分佈推導出實際應用的係數和公式,並提到歷史背景和計算工具的應用(如Excel函數)。
可能需要進一步整理這些概念的關聯,並確認公式的正確性,例如FPC在控制圖中的使用是否常見,或者是否有其他注意事項。
現在,我可能需要回顧一些關鍵點是否正確:
1. 常態分佈的參數μ和σ,控制圖中的CL、UCL、LCL是否正確基於3σ原則?
- 是的,控制圖的上下限通常是平均值±3個標準誤,也就是3σ/√n。
2. FPC修正係數在製程管制中的應用是否常見?
- 通常製程管制假設是連續生產,母體無限,所以FPC可能較少使用,但在抽樣檢驗中若母體有限且抽樣比例高,則可能需要考慮。
3. 全距R的標準差如何轉換為σ的估計?
- 平均全距R̄ = d2σ,因此σ估計為R̄/d2,而全距的標準差與σ有關,所以σR = d3σ,因此用d3/d2來計算控制限的係數D3、D4。
4. A2係數的計算是否正確?
- 是的,A2 = 3/(d2√n),因為UCLx̄ = x̄̄ + 3σ/√n = x̄̄ + 3(R̄/d2)/√n = x̄̄ + (3/(d2√n)) R̄,所以A2 = 3/(d2√n)。
5. 為什麼使用3個標準差?
- 歷史原因和平衡假警報率與檢出力,3σ在常態分佈下對應0.27%的單尾概率,即總共0.27%*2=0.54%在外的概率,但實際應用中可能有輕微差異。
可能的誤區或需要再確認的地方:
- 作者提到FPC分為可重複組合和不可重複組合,公式分別是√((N+n)/(N+1))和√((N-n)/(N-1))。
這裡可能需要確認,因為通常FPC用於有限母體且不放回抽樣,公式是√((N-n)/(N-1)),而可重複抽樣(放回)則不需要FPC,所以可能作者在可重複組合時的公式可能有誤,或者我理解錯了?
例如,一般有限母體修正係數是當抽樣不重複且抽樣比例n/N較大時,標準誤差乘以√((N-n)/(N-1))。
但作者提到可重複組合的FPC是√((N+n)/(N+1)),不可重複是√((N-n)/(N-1)),這可能需要再查證,因為通常FPC是不可重複抽樣時使用,即√((N-n)/(N-1)),而可重複時FPC=1。
例如,可能在超幾何分佈和二項分佈的應用中,但需要再確認。
另外,作者提到當n/N ≤ 1/10時,FPC≈1,這是正確的,因為當抽樣比例很小時,修正係數接近1,可以忽略。
在製程管制部分,作者提到群體的μ和σ,樣本的x̄和σx̄,這裡假設樣本平均的標準差是σ/√n,但實際中如果使用樣本標準差s來估計σ,則會有不同的處理方式,例如使用t分佈當樣本量小,但控制圖通常假設n足夠大,所以仍用常態分佈。
總結來說,文章內容大致正確,但可能在FPC的部分需要更仔細的確認,還有控制圖係數的推導是否正確。此外,Ca、Cp、Cpk的計算方式是否如文中所述,需要再回憶相關公式:
- Ca(製程準確度):(平均 - 規格中心) / (規格公差的一半)
- Cp(製程精密度):規格公差 / (6σ)
- Cpk:考慮偏移後的精密度,即min[(USL - μ)/(3σ), (μ - LSL)/(3σ)]
但文中沒有詳細展開這部分,可能只是提到這些指標的存在。
最後,作者提供的知乎連結可能需要參考,但無法查看,所以可能關於n大於4時係數的計算和表格的使用,這部分需要依賴已知的統計控制圖係數表,例如A2、D3、D4在不同n下的值,例如當n=5時,A2=0.577,D3=0,D4=2.114等。
因此,整體而言,這篇文章是將機率分佈與製程管制的控制圖方法連接起來,解釋了基礎理論和應用中的係數來源,可能對於學習統計製程管制(SPC)的人來說是一個綜述性的複習,但需要注意某些細節是否準確,如FPC的應用場合和公式的正確性。
以下是對上述內容的逐步解釋與總結:
機率分佈與製程管制的關聯
1. 從二項分佈到常態分佈
- 當獨立實驗次數 N→∞ 時,二項分佈趨近於鐘型曲線(常態分佈)。此現象由中央極限定理支持,即使單次實驗(如擲骰子)的機率極低(如 0.5%),大樣本下的分佈仍趨於對稱。
2. 基本統計量
平均值(μ):母體中心位置,計算為 μ=1/N ∑ xi。
變異數(σ²)與標準差(σ):衡量數據離散程度,計算為:σ^2=∑(xi−μ)^2 / N ,σ= √σ^2。
樣本平均的標準差(標準誤差):描述樣本平均的波動,公式為:σx̄ =σ/√n。
有限母體修正係數(FPC):當抽樣比例高(n/N>10%)且不放回時,調整公式為:FPC=√((N-n)/(N-1))。
若 (n/N≤10%),FPC 接近 1,可忽略。
製程管制中的控制圖
控制限(UCL/LCL):基於常態分佈的 3σ 原則,計算為:
UCLx = x̄̄ + 3σx̄,LCL=x̄̄ − 3σx̄。
其中 σx̄ˉ=σ/√nσ,實務中以全距 R 估計 σ(σ=R̄/d2,d2為常數)。
係數推導:
• A2 是用來從 R̄ 推估 ₓ̄ 的控制限:UCLₓ̄=ₓ̄+A2⋅R̄
其中:A2=3/d2√n(d2為查表常數,根據樣本數n)(用於平均值控制圖)。
全距控制圖的D3,D4基於全距分佈的標準差(σR=d3σ)。
製程能力指標
Ca(準確度):衡量平均值與規格中心的偏移。
Cp(精密度):規格範圍與 6σ 的比值。
Cpk(綜合能力):考慮偏移後的最小能力值,計算為:
Cpk=min ( USL−μ/3σ,μ−LSL/3σ)
實務應用與工具
Z 值與機率計算:使用 Excel 的 NORM.S.DIST(Z, 1) 計算累積機率。
信賴區間:95% 信賴區間為 ₓ̄±1.96σₓ̄。
概念 |
公式 |
---|---|
標準誤差 |
|
控制圖上下限 |
|
全距控制限 |
|
製程能力 (Cp) |
|
常用係數(n=5 時)
A2=0.577,D3=0,D4=2.114。
d2=2.326,
常態分佈是製程管制的理論基礎,透過標準差與全距估計母體變異,並利用預先計算的係數(如 A2,D3,D4A2,D3,D4)簡化控制限的設定。實務中需注意抽樣條件(如 FPC 修正)與分佈假設,以確保管制圖的有效性。
________________________________________