排列組合與機率計算(十二) 二項分佈與超幾何分配與Excel函數應用總結 - 銘記星辰之下 - udn部落格
銘記星辰之下
作家:m06f06
文章分類
    Top
    排列組合與機率計算(十二) 二項分佈與超幾何分配與Excel函數應用總結
    2025/05/02 21:37:23
    瀏覽:5
    迴響:0
    推薦:0
    引用0
     

     

    排列組合與機率計算(十二) 二項分佈與超幾何分配與Excel函數應用總結

     

     

    排列組合 - 好用工具箱

     

    Deepseek

     

    首先,用戶解釋了二項概率的基本公式:

    在n次獨立試驗中,事件發生r次的概率是C(n,r) * p^r * (1-p)^(n-r)。

    這裡p是單次試驗成功的概率,C(n,r)是組合數。

     

    用戶用擲5顆骰子,出現6點的概率作為例子,計算了從0到5次出現6點的概率,結果之和為1,這說明計算正確。

     

    然後,用戶提到Excel中的BINOM.DIST.RANGE函數,並舉例說明。

     

    例如,BINOM.DIST.RANGE(10,0.1,2,6)計算的是在10次試驗中,成功次數在2到6次之間的概率,結果為0.263892。

     

    而另一個例子BINOM.DIST.RANGE(10,0.1,3)則等同於BINOM.DIST(3,10,0.1,0),也就是剛好3次成功的概率,結果是約0.057396。

     

    . BINOM.DIST.RANGE 函數解析

    語法與參數

    excel

    =BINOM.DIST.RANGE(trials, probability_s, number_s, [number_s2])

     

    trials:總試驗次數(如 10 次)。

    probability_s:每次試驗成功的機率(如 0.1)。

    number_s:成功次數的「下限」。

    [number_s2](可選):成功次數的「上限」。若省略,則計算 恰好等於下限 的機率。

     

    . 案例計算與手動驗證

    案例一:範圍機率(2 X 6

    公式 =BINOM.DIST.RANGE(10, 0.1, 2, 6) 計算 10 次試驗中成功 2 到 6 次 的機率。

     

    手動計算步驟:

    逐項計算

    P(X=r)=C(10,r)(0.1)^r(0.9)^10r

    其中 r=2,3,4,5,6。

    1.    P(X=2)=450.1^20.9^80.1937

    2.    P(X=3)=1200.1^30.9^70.0574

    3.    P(X=4)=2100.1^40.9^60.0112

    4.    P(X=5)=2520.1^50.9^50.0015

    5.    P(X=6)=2100.1^60.9^40.0001.

     

    總和:

    0.1937+0.0574+0.0112+0.0015+0.00010.2639

    與 Excel 結果一致。

     

    案例二:單次機率(X = 3)

    公式 =BINOM.DIST.RANGE(10, 0.1, 3) 省略上限參數,等同計算 恰好成功 3 次 的機率。

    手動計算:

    P(X=3)=C(10,3)0.1^30.9^7=1200.0010.47829690.0574.

    與  Excel  的 BINOM.DIST(3,10,0.1,FALSE) 結果一致。

     

    3. 函數對比:BINOM.DIST vs BINOM.DIST.RANGE

    BINOM.DIST用途:計算單點或累積機率。參數特點:cumulative 控制是否累加。範例結果:0.0574

    BINOM.DIST.RANGE用途:計算區間或單點機率。參數特點:可指定上下限或僅下限。範例結果:0.2639

     

     

    4. 應用場景與注意事項

    區間機率需求:

    若需計算 範圍內機率(如 2~6 次),使用 BINOM.DIST.RANGE 更高效,避免逐項計算再手動加總。

    範例:品質檢驗中,判斷不良品數落在「可接受範圍」的機率。

     

    單點機率需求:

    若只需計算 恰好某次數 的機率,兩函數等價,但 BINOM.DIST 參數更直觀。

    「恰好成功3次」的意思是:

    在固定次數的獨立試驗中,成功次數「正好等於3次」的機率,且其他次數均為失敗。 

    這在統計學中屬於 單點機率(精確機率)的計算。以下透過生活化案例與公式解析,逐步說明其意義與應用:


    概念解析:什麼是「恰好成功3次」?

    舉例說明:

    假設你拋一枚 不公平硬幣,正面朝上的機率是 0.1(10%),反面是 0.9(90%)。
    問題:若拋硬幣 10,「恰好出現3次正面」的機率是多少?
    答案

    • 這就是計算 10次試驗中,成功(正面)3次 的機率,且其餘7次均為失敗(反面)。
    • 此機率即為 二項分配 的單點機率。


    數學公式與手動計算

    二項分配公式

    P(X=r)=[C(n,r)p^r][(1p)^nr]

     

    • 參數意義

    o    n=10:試驗總次數。

    o    r=3:成功次數。

    o    p=0.1:單次成功的機率。

    o    1p=0.9:單次失敗的機率。

    o    C(n,r):組合數,計算從10次中選出3次成功的方式數。

     

     

    手動計算步驟

    計算組合數C(10,3)=(10!) / [3!(103)!] =120

    計算成功次數的機率0.1^3=0.001

    計算失敗次數的機率0.9^(103)=0.9^70.4782969

    相乘得最終機率P(X=3)=1200.0010.47829690.057396

     


    Excel 函數驗證

    使用 BINOM.DIST 函數

    excel

    =BINOM.DIST(3,10,0.1,FALSE)  // 結果  0.057396

    • 參數解析

      • 3:成功次數(恰好3次)。
      • 10:總試驗次數。
      • 0.1:單次成功機率。
      • FALSE:計算「單點機率」(非累積)。

    使用 BINOM.DIST.RANGE 函數

    excel

    =BINOM.DIST.RANGE(10,0.1,3)    // 結果 0.057396

    省略上限參數時,預設計算 恰好等於下限(3次) 的機率,等同於 BINOM.DIST(3,10,0.1,FALSE)

     


     

    .常見誤區與注意事項

    誤區一:混淆「恰好」與「至少」或「至多」

    • 「恰好3次」:只計算成功 正好3次,排除2次或4次。
    • 「至多3次」:計算成功 0+1+2+3 的累積機率(需設定 cumulative = TRUE)。
    • 「至少3次」:計算成功 3+4+…+10 的機率(需用 1 - 累積至2次的機率)。

    誤區二:忽略試驗的獨立性

    • 二項分配假設 每次試驗獨立(如:拋硬幣結果不影響下一次)。
    • 若試驗間有依賴性(如:從有限群體中無放回抽樣),需改用 超幾何分配


     

    .實際應用場景

    品質管制案例

    某工廠生產燈泡,不良率為 1%(p=0.01)。

    問題:隨機抽檢 100 燈泡,「恰好有3個不良品」的機率是多少?
    計算

    P(X=3)=C(100,3)0.01^30.99^970.0613

    此機率可協助判斷抽檢結果是否符合預期,或是否需調整生產流程。

     


    6. 總結:關鍵概念圖示

    概念

    數學表示

    Excel 函數

    應用場景

    恰好成功

    P(X=r)

     

     

    BINOM.DIST(r,n,p,FALSE)

    精確判斷單一事件發生機率

    範圍機率

    P(aXb)

     

     

    BINOM.DIST.RANGE(n,p,a,b)

    風險評估或品質控管範圍


     

    透過以上分析,「恰好成功3次」即為精確計算某一特定成功次數的機率,是二項分配的核心應用之一。

    掌握此概念後,可進一步延伸至累積機率、區間機率與假設檢定等進階分析。

     

    參數輸入陷阱:

    下限 > 上限:Excel 會返回 #NUM! 錯誤。

    非整數次數:參數必須為整數,否則自動截斷取整。

     

    5. 進階驗證:數值穩定性分析

    極端值測試:

    當成功機率極低(如 p=0.001)時,高成功次數的機率趨近於 0,BINOM.DIST.RANGE 仍能穩定計算。

    例如:=BINOM.DIST.RANGE(1000,0.001,5,10) 可快速計算罕見事件的區間機率。

     

    總結

    BINOM.DIST.RANGE 適用於快速計算二項分佈的 區間機率,簡化手動累加步驟。

    單點機率可選用 BINOM.DIST 或省略上限的 BINOM.DIST.RANGE,兩者結果一致。

    實際應用中,需注意參數合理性(如上下限範圍、整數限制),並透過手動驗證確保計算正確性。

     


     

    接下來,用戶比較了二項分佈和超幾何分佈的區別:

     

    二項分佈是每次試驗後放回(即獨立事件),而超幾何分佈是不放回的。這部分需要確認是否正確。

    是的,超幾何分佈通常用於無放回抽樣,而二項分佈適用於有放回或總體很大近似獨立的情況。

     

    用戶還討論了一個例子,

    當X是三次試驗的總成功次數時,各個成功次數的概率計算方式。

     

    這裡可能需要更清晰的解釋。

    例如,對於0個成功的情況,使用者提到3C0 * p^0 * (1-p)^3,這部分是對的,

     

    然後,用戶給出另一個例子:

    產品不良率為0.1,抽檢10個,剛好3個不良品的概率是BINOM.DIST(3,10,0.1,0)得到的0.057395628。

    並解釋了累積參數為TRUE時,計算的是從0到指定次數的累積概率。

     

    例如,在擲5顆骰子的例子中,出現1次6點的概率計算為5C1*(1/6)^1*(5/6)^4,得到的結果是0.401878,和出現0次的結果相同。

    5C0*(1/6)^0*(5/6)^5 = 1*1*(5/6)^5 (5/6)^5 0.401877572,四捨五入到小數點後六位是0.401878,正確。

    5C1*(1/6)^1*(5/6)^4 = 5*(1/6)*(5/6)^4 5*(1/6)*(625/1296) 5*(625/7776) 3125/7776 0.401877572,同樣得到0.401878。

     

    接下來出現的其他結果,例如出現2次的是0.160751,是否計算正確?計算5C2*(1/6)^2*(5/6)^3:

    5C2 = 10,所以10*(1/6)^2*(5/6)^3 = 10*(1/36)*(125/216) = 10*(125)/(36*216) 1250/(7776) 0.160751028,正確。

     

    BINOM.DIST.RANGE(10,0.1,2,6)中的參數依次是試驗次數n=10,成功概率p=0.1,下限2,上限6,返回的是成功次數在2到6之間的概率總和。

    使用者給出的結果是0.263892。

     

    手動計算的話,這個概率應該是從r=2到r=6的各個概率之和。

    即Σ(C(10,r)*0.1^r*0.9^(10-r))從r=2到6。

    這個計算可能比較繁瑣,但可以用Excel函數來驗證。

     

    另外,當只給出一個參數時,如BINOM.DIST.RANGE(10,0.1,3),是否返回的是恰好3次的概率?

    根據使用者所述,確實如此,結果和BINOM.DIST(3,10,0.1,0)相同,約0.057396。

    這說明BINOM.DIST.RANGE在只有一個參數時,視為下限和上限相同,即恰好該次數的概率。

     

    關於用戶對二項分佈和超幾何分佈的區分是否正確?

    是的,用戶正確指出了兩者的區別在於抽樣是否放回。

    不過可能需要更明確的說明,超幾何分佈適用於有限總體且不放回的情況,而二項分佈適用於無限總體或放回的情況。

     

    在用戶討論的X=X1+X2+X3的例子中,Xi為0或1,總共有三次試驗,每個試驗的成功概率是p。

     

    例如,用戶提到“0個1的機率:3C0=1(證真組合的可能性) X 證真機率^證真幾種 + 3C3=1(證假組合的可能性) X 證假機率^證假幾種”。正確的公式是C(3,0)*p^0*(1-p)^3。

    正確的計算應該是每個成功次數r的組合數為C(n,r),然後乘以p^r*(1-p)^(nr),用戶似乎將成功和失敗的組合拆開解決延伸的問題。

     

    例如,使用者提到的“證真組合的可能性”和“證假組合的可能性”可能是想分開計算,但實際上它們是同一個組合數的兩部分,

    即C(n,r) = C(n, nr),但公式中的指數部分應該分別對應成功次數和失敗次數。

     

    所以使用者在這裡可能需要更準確的表達,例如,C(n,r)是選擇r次成功的位置的方式數,然後乘以p^r(成功的概率)和(1p)^{nr}(失敗的概率)。

     

    最後,用戶給出的例子中,計算BINOM.DIST(3,10,0.1,0)得到0.057395628,而累積到3次的結果是各個概率之和,用戶用BINOM.DIST(3,10,0.1,1)得到0.987204802,

     

    但根據實際計算,BINOM.DIST(3,10,0.1,1)應該是累積到3次的概率,即r=0到3的和。用戶給出的數值是否正確?

     

    計算各次數的概率:

    r=0: C(10,0)*0.1^0*0.9^10 0.3486784401

    r=1: C(10,1)*0.1^1*0.9^9 10*0.1*0.387420489 0.387420489

    r=2: C(10,2)*0.1^2*0.9^8 45*0.01*0.43046721 45*0.0043046721 0.1937102445

    r=3: C(10,3)*0.1^3*0.9^7 120*0.001*0.4782969 120*0.0004782969 0.057395628

     

    將這些相加:0.3486784401 + 0.387420489 0.7360989291 + 0.1937102445 0.9298091736 + 0.057395628 0.9872048016

    所以用戶的結果正確,即BINOM.DIST(3,10,0.1,1)0.987204802

     

    以下是關於二項分配的詳細說明及Excel函數應用總結:

    二項分配基本概念

    在 n次獨立試驗 中,某事件發生 r次 的機率公式為:

    P(X=r)=C(n,r)p^r(1p)^nr

     C(n, r):組合數,表示從n次試驗中選出r次成功的方式數。

    p:單次試驗成功的機率。

    (1-p):單次試驗失敗的機率。

     

    擲骰子範例驗證

    投擲5顆骰子,計算出現k次6點(不良製程)的機率(p=1/6 ):

    .出現0次6點:

    C(5,0)(1/6)^0(5/6)^5=11(5/6)^50.401878

    .出現1次6點:

    C(5,1)(1/6)^1(5/6)^4)=51/6(5/6)^40.401878

    .同理可計算其他次數,總和為1,驗證公式正確性。

     

    .Excel函數應用

    BINOM.DIST函數:

    語法:BINOM.DIST(number_s, trials, probability_s, cumulative)

     

    參數:

    number_s:成功次數。

    trials:總試驗次數。

    probability_s:單次成功機率。

    cumulative:TRUE(累積機率, number_s);FALSE(精確機率,= number_s)。

     

    範例:

    不良率0.1,抽驗10次中恰好3次不良:

    =BINOM.DIST(3, 10, 0.1, FALSE)0.057396

     

    累積至3次不良(3次):

    =BINOM.DIST(3, 10, 0.1, TRUE)0.987205

     

    BINOM.DIST.RANGE函數:

     

    語法:BINOM.DIST.RANGE(trials, probability_s, number_s, [number_s2])

     

    功能:計算範圍內的成功機率(含上下限)。

     

    範例:

    10次試驗中成功2到6次的機率:

    =BINOM.DIST.RANGE(10, 0.1, 2, 6)0.263892

     

    若省略上限,則計算恰好指定次數(等同BINOM.DIST):

    =BINOM.DIST.RANGE(10, 0.1, 3)0.057396

     

    二項分配 vs. 超幾何分配

    二項分配:適用於有放回或無限總體(每次試驗獨立,機率固定)。

     

    超幾何分配:適用於無放回抽樣(機率隨抽樣改變)。

     

    常見誤區釐清

    組合數對稱性:

    C(n,r)=C(n,nr),但需注意機率中的指數次方(如成功r次需搭配失敗nr次)。

     

    P(X=r)=C(n,r)p^r (1p)^nr

     

    累積機率計算:使用cumulative = TRUE時,結果為從0到指定次數的總和。

     

    總結

    二項分配用於獨立試驗的機率計算,Excel函數可快速處理複雜運算。

    確保正確區分精確機率(FALSE)與累積機率(TRUE)的應用場景。

     

    超幾何分配適用於有限總體無放回情境,與二項分配互補。

    透過以上整理,可更清晰掌握二項分配的核心概念與實務操作技巧。

     

    回顧超幾何分佈的定義:

    它適用於不放回的抽樣,每次試驗後樣本總體會減少,因此每次試驗的概率會變化。

    而二項分佈是有放回的抽樣,每次試驗獨立,概率不變。

    這點非常重要,必須明確區分兩者的應用場景。

     

    接下來,需要給出超幾何分佈的公式,並解釋各個參數的含義。

    例如,公式中的N(總體大小)、K(成功元素數量)、n(抽取的樣本數量)、k(樣本中的成功次數)。同時,對比二項分佈的公式,強調超幾何分佈沒有獨立性,因為不放回。

     

    然後,需要提供具體的例子,比如從牌堆中抽牌,品質檢測中的抽樣等,來說明超幾何分佈的應用。

    同時,用Excel函數HYPGEOM.DIST來演示如何計算概率,包括精確概率和累積概率,類似於之前二項分佈的示例。

     

    此外,用戶之前提到了BINOM.DIST.RANGE函數,但超幾何分佈在Excel中是否有類似的函數呢?

    根據我的知識,Excel中的HYPGEOM.DIST函數主要用於計算精確值或累積概率,但沒有直接的RANGE函數。

    可能需要使用累積概率的參數設置來模擬範圍計算,或者通過多次調用HYPGEOM.DIST並相加。

    這點需要明確說明,避免使用者混淆。

     

    還需要注意使用者可能存在的誤區,例如在樣本量較大時,超幾何分佈和二項分佈的結果可能接近,但前提是樣本量相對於總體非常小。

    這時候需要提醒使用者注意兩者的適用條件,避免錯誤應用。

     

    最後,總結超幾何分佈與二項分佈的關鍵區別,幫助用戶在實際問題中選擇正確的模型。

    同時,強調Excel函數的參數設置和實際應用中的注意事項,比如參數輸入順序、累積與精確模式的區別等。

     

    在整理這些內容時,要保持結構清晰,分點說明,便於用戶理解和查閱。

    可能需要使用公式展示、示例計算和Excel函數語法說明,確保使用者能夠逐步跟隨並應用所學知識到實際問題中。

     

    超幾何分配基本概念:

    超幾何分配用於描述在 有限總體不放回抽樣 中,成功事件發生的機率分佈。適用於以下情境:

     

    總體數量固定(如:一箱產品、一副撲克牌)。

    每次抽樣不放回,導致每次抽樣的成功機率改變。

    關注 特定成功次數 在抽樣中的機率。

     

    超幾何分配公式:

    若總體大小為 N,其中有 K 個「成功元素」,從中抽取 n 個樣本,則恰好抽到 k 個成功元素的機率為:

    P(X=k)= C(K,k)C(NK,nk)/C(N,n)

    C(a,b):組合數,表示從 a 個元素中選取 b 個的方式數。

    適用條件:max(0,n+KN)kmin(K,n)

     

    與二項分配的關鍵區別:

    Excel函數應用:HYPGEOM.DIST

    函數語法:

    excel

    =HYPGEOM.DIST(sample_s, number_sample, population_s, population_size, cumulative)

     

    參數說明:

    sample_s:樣本中的成功次數 k。

    number_sample:抽取的樣本數 n。

    population_s:總體中的成功元素數 K。

    population_size:總體大小 N。

    cumulative:TRUE(累積機率, k);FALSE(精確機率,= k)。

     

    範例說明:

    情境:一箱 50 個產品中有 5 個不良品,隨機抽取 10 個,求恰好 2個不良品的機率。

    =HYPGEOM.DIST(2, 10, 5, 50, FALSE)0.2105

     

    累積機率(2個不良品):

    =HYPGEOM.DIST(2, 10, 5, 50, TRUE)0.9522

     

    產品品質檢驗:

    總體 N=100 個產品,已知不良品 K=10 個。

    隨機抽檢

    n=20 個,計算抽到 k=3 個不良品的機率:

    P(X=3)= C(10,3)C(90,17)/C(100,20) 0.198

    Excel公式:=HYPGEOM.DIST(3,20,10,100,FALSE)

     

     

    撲克牌遊戲:

    一副牌 N=52 張,其中紅心 K=13 張。

    抽 n=5 張,求至少 2 張紅心的機率(使用累積機率):

    P(X2)=1P(X1)=1HYPGEOM.DIST(1,5,13,52,TRUE)0.588

     

    超幾何分配的近似與極限

    當 N 極大且 nN,超幾何分配近似二項分配:

    P(X=k)C(n,k)( K/N )^k (1 K/N )^nk

     實務應用:若總體大小為樣本量的 20 倍以上,可簡化使用二項分配計算。

     

    常見誤區與注意事項:

    參數輸入順序:

    Excel 的 HYPGEOM.DIST 參數順序易混淆,需嚴格對照:

    sample_s, number_sample, population_s, population_size

     

    範圍計算限制:

    Excel 無直接計算區間機率的函數(類似 BINOM.DIST.RANGE),需手動加總:

    例:計算 k=2 到 k=4 的機率:

    k from 2 to 4 HYPGEOM.DIST(k, n, K, N, FALSE)

    總體與樣本限制:

    若 n>N或 K>N,公式無意義,Excel 將返回錯誤。

     

    總結

    超幾何分配適用於 小總體不放回抽樣,其機率依賴總體與樣本的組合關係。

    Excel 的 HYPGEOM.DIST 可快速計算精確或累積機率,但需注意參數順序與適用條件。

    實際應用中,當總體遠大於樣本量時,可近似使用二項分配簡化計算。

    透過對比二項與超幾何分配,可更精準選擇模型解決實際問題。

     

    ​​​​​​​===

     

    回應
    發表迴響

    會員登入