排列組合 - 好用工具箱
排列組合與機率計算(二十一) 從1000人中抽樣150人調查,原數據顯示贊成比例為55%,反對為45%。問:在這150人中,有多少機率贊成者少於75人?
這是一個二項分佈問題,可用標準誤差法估算:
範例計算(P = 0.55, μ = 82.5, x̄ = 75):
FPC 類型 |
σₓ̄值 |
Z值 |
機率結果 |
95%信賴區間 |
---|---|---|---|---|
無修正 (1) |
6.093 |
-1.231 |
約10.9% |
約80~85人 |
修正C |
5.620 |
-1.335 |
約9.1% |
約80~86人 |
修正H |
6.530 |
-1.148 |
約12.5% |
約81~85人 |
若1000人中抽150人,標準誤為:
σₓ̄ = 1 / √150 ≈ 0.0817
若要讓80人調查中達到相同誤差:
因此,在FPC修正下,80人中需抽約56人,誤差才能與1000人抽150人相當。
________________________________________
你的問題很明確:我們要估算在樣本中贊成者少於75人的機率。這是一個典型的二項分佈問題,由於樣本數夠大,可使用常態分佈近似法(Central Limit Theorem),並考慮有限母體修正(FPC)。
Var(X)=np(1−p)=150×0.55×0.45=37.125
σ=√37.125≈6.093
Z 值:
Z=75−82.5/6.093≈−1.231
查標準常態分佈表得機率:
P(X<75)≈P(Z<−1.231)≈0.109=10.9%
FPC=√(1000−150)/(1000−1)=√850/999≈0.922
σ=√37.125×0.922≈5.620
Z 值:
Z=75−82.5/5.620≈−1.335
P(Z<−1.335)≈0.091=9.1%
FPC=√(1000+150)/(1000+1)=√1150/1001≈1.074
σ=√37.125×1.074≈6.530
Z 值:
Z=75−82.5/6.530≈−1.148
P(Z<−1.148)≈0.125=12.5%
FPC 類型 |
σₓ̄ |
Z 值 |
機率 P(X < 75) |
---|---|---|---|
無修正 |
6.093 |
-1.231 |
約 10.9% |
修正 C |
5.620 |
-1.335 |
約 9.1% |
修正 H |
6.530 |
-1.148 |
約 12.5% |
在你從 1000 人中抽樣 150 人的情況下,贊成者少於 75 人的機率大約在 9.1% 到 12.5% 之間,取決於你是否採用有限母體修正,及採用哪種修正方法。若不考慮修正,則大約是 10.9%。
如需更嚴謹的精確機率,也可以使用 Python 或統計軟體直接跑 binom.cdf(74, 150, 0.55)
得到非近似解。需要的話我也可以幫你算。
在 Excel 中,你可以用以下方法來計算「從 150 人中,贊成者少於 75 人的機率」,使用 二項累積分佈函數:
BINOM.DIST
(精確計算)excel
=BINOM.DIST(74,150,0.55,TRUE)
這個公式會給你精確的累積機率,大約是 10.4%(略低於常態近似值,因為這是精確計算)。
若你想用 Excel 模擬常態近似 + FPC 修正,步驟如下:
excel
=150 * 0.55
excel
=SQRT(150*0.55*(1-0.55))
excel
=SQRT((1000-150)/(1000-1))
excel
=SQRT(150*0.55*0.45)*SQRT((1000-150)/(999))
excel
=(75-82.5)/[你上一步算的 σ]
NORM.S.DIST
:excel
=NORM.S.DIST([Z 值], TRUE)
方法 |
Excel 函數 |
結果(約) |
---|---|---|
精確計算 |
|
約 10.4% |
常態近似(無修正) |
|
約 10.9% |
常態近似(FPC 修正) |
|
約 9.1% |
________________________________________
這個問題看起來是要計算在1000人中抽取150人的樣本中,贊成人數少於75人的概率。
題目還提到了使用二項分佈和標準誤差法來估算。
首先,我需要理清楚題目的條件和步驟,然後一步步思考怎麼解決這個問題。
首先,題目給出原資料中贊成比例是55%,反對是45%。
所以總體比例P應該是0.55,對嗎?
然後樣本量n是150人,總體N是1000人。我們需要計算的是在這150人中,贊成人數少於75人的概率。
首先,我想到的是二項分佈的問題,因為每個被調查的人的回答可以看作是伯努利試驗,成功概率是P=0.55,失敗概率是1-P=0.45。
樣本中的成功次數X服從二項分佈B(n, P),也就是X ~ B(150, 0.55)。不過當n較大時,二項分佈可以用正態分佈來近似,尤其是在計算概率的時候,可以用中心極限定理來近似。
不過題目裡提到了標準誤差法,並且涉及到有限總體修正因數(FPC)。
這讓我需要考慮抽樣是從有限總體中不放回地抽取的,這時候是否需要使用FPC來調整方差?
首先,標準的二項分佈的方差是Var(X) = nP(1-P),也就是當抽樣是有放回的情況下,或者總體非常大的時候。
但是如果總體是有限的,而且抽樣是不放回的,這時候方差需要乘以一個有限總體修正因數FPC。
一般來說,當抽樣比例n/N較大時(通常認為超過5%的話),就需要考慮FPC,這時候方差變為Var(X) = nP(1-P) * (N - n)/(N - 1)。
不過這裡題目裡給出了三種FPC的情況,可能是不同的修正方式?
根據題目中的三種FPC情況:
1. FPC = 1,也就是不進行修正,適用于n相對於N非常小的情況。
2. FPC = √[(N - n)/(N - 1)],這是常見的有限總體修正因數,用於調整方差。
3. FPC = √[(N + n)/(N + 1)],這個好像不太常見,可能是個錯誤或者某種特定情況下的修正?
不過通常情況下,有限總體修正因數應該是sqrt((N - n)/(N - 1)),或者更常見的表達方式是sqrt((N - n)/(N)),不過在計算方差的時候,正確的有限總體修正因數應該是sqrt((N - n)/(N - 1)),當計算均值時的標準誤差。可能這裡的FPC有不同的版本,需要確認。
接下來,題目中的示例計算部分給出了不同的σₓ̄值、Z值、概率結果以及95%的置信區間。
例如,
當FPC類型為無修正時,σₓ̄是6.093,對應的Z值是-1.231,得到的概率約為10.9%。
然後修正C的情況下,σₓ̄是5.620,Z值-1.335,概率9.1%;
修正H的情況下,σₓ̄是6.530,Z值-1.148,概率12.5%。
然後還給出了95%置信區間,例如無修正的情況下大約80到85人,修正C的話是80到86人,修正H是81到85人。看起來這裡的置信區間可能對應的是均值的置信區間?
不過我需要先理清問題的解決步驟。題目問的是在150人中,有多少概率贊成者少於75人。
也就是求P(X < 75),其中X服從二項分佈B(150, 0.55)。不過使用正態近似的話,我們可以計算這個概率。
首先,計算期望值μ = nP = 150 * 0.55 = 82.5。
然後方差Var(X) = nP(1 - P) = 150 * 0.55 * 0.45 = 150 * 0.2475 = 37.125,
所以標準差σ = sqrt(37.125) ≈ 6.093。這時候如果使用正態近似的話,X ~ N(μ=82.5, σ≈6.093)。
但是需要考慮有限總體修正,這時候方差應該是Var(X) = nP(1 - P) * (N - n)/(N - 1),對嗎?
這裡總體N=1000,樣本n=150,所以抽樣比例是150/1000=15%,超過5%,可能需要使用FPC修正。
有限總體修正因數FPC = sqrt((N - n)/(N - 1)) = sqrt((1000 - 150)/(999)) = sqrt(850/999) ≈ sqrt(0.85085) ≈ 0.9224。
因此,修正後的標準差σ_c = sqrt(nP(1 - P)) * FPC ≈ sqrt(37.125) * 0.9224 ≈ 6.093 * 0.9224 ≈ 5.620。
而如果使用第三種FPC,即sqrt((N + n)/(N + 1)),那就是sqrt((1000 + 150)/(1000 + 1)) = sqrt(1150/1001) ≈ sqrt(1.149) ≈ 1.072,這樣修正後的標準差σ_h = 6.093 * 1.072 ≈ 6.530,不過這樣會增加標準差,這似乎不太合理,因為通常有限總體修正應該是減少方差,而不是增加。
所以這裡可能存在對FPC類型的誤解,或者第三種FPC是某種不同的情況?
不過根據題目中的例子,修正H的情況下,σₓ̄是6.530,而原來的σ是6.093,所以確實是增大的,這可能對應於另一種情況。
不過現實中,有限總體修正因數應該是當抽樣比例較大時,減少方差,而不是增加,所以這種情況下,第三種FPC可能並不正確,或者是題目中的特殊情況?
暫且不管這些,繼續按題目中的例子來計算。接下來,要計算X < 75的概率。使用正態近似的話,計算Z值:
Z = (x - μ) / σₓ̄
當x=75時,無修正的情況下,Z=(75 - 82.5)/6.093 ≈ -7.5 / 6.093 ≈ -1.231,對應的概率是標準正態分佈中Z < -1.231的概率,查表的話大概是0.1093,即約10.9%。
同樣,修正C的情況下,σₓ̄=5.620,所以Z=(75 - 82.5)/5.620 ≈ -7.5 / 5.620 ≈ -1.335,對應的概率約為9.1%;修正H的情況下,σₓ̄=6.530,Z=(75 - 82.5)/6.530 ≈ -1.148,對應的概率約為12.5%。
不過這裡可能需要確認,這裡的σₓ̄是標準差還是標準誤。
如果是二項分佈的正態近似,標準差是sqrt(nP(1-P)),即原來的σ=6.093,而如果應用FPC的話,標準差應該是sqrt(nP(1-P) * (N - n)/(N - 1)),即原來的σ乘以FPC,對嗎?所以這裡的σₓ̄應該就是標準差,而不是均值標準誤。
或者可能題目中的σₓ̄指的是均值的標準誤,即原來的標準差除以sqrt(n)?
不過這裡可能有些混亂。
一般來說,標準誤(Standard Error, SE)是指樣本均值的標準差,即σ/sqrt(n),但當處理計數X時,原方差是nP(1-P),所以標準差是sqrt(nP(1-P))。
這時候如果考慮有限總體修正的話,方差應該是nP(1-P) * (N - n)/(N - 1),所以標準差是sqrt(nP(1-P) * (N - n)/(N - 1)) ),即原來的標準差乘以 sqrt((N - n)/(N - 1)),即FPC。
因此,這裡的σₓ̄應該是修正後的標準差,即sqrt(Var(X)),也就是sqrt(nP(1-P) * FPC²)。不過題目中的FPC可能被應用在方差或者標準差上。
不過根據題目中的示例計算,當FPC=1時,σₓ̄=6.093,這應該就是原來的標準差sqrt(150*0.55*0.45)=sqrt(37.125)=約6.093,所以這裡的σₓ̄指的是X的標準差,而不是均值的標準誤。
因此,當應用不同的FPC時,標準差會被調整。
接下來,計算Z值,即(75 - 82.5)/σₓ̄,然後查標準正態分佈表得到概率。比如無修正時,Z=-1.231,對應的概率是P(Z < -1.231),查表或用計算器計算,大約是0.1093,即10.9%左右。
而修正C時,標準差更小,所以Z值的絕對值更大,導致概率更小,約9.1%。修正H時,標準差更大,Z值絕對值更小,概率更大,約12.5%。
不過這裡需要注意的是,當使用正態近似時,應該用連續性修正,即考慮X是一個整數,所以如果要求X < 75,實際上是X ≤ 74,這時候應該用74.5來計算Z值,這樣會更準確。
但題目中的例子可能沒有使用連續性修正,直接用了75作為分界點,這樣可能會有一定的誤差。
不過可能題目中的計算忽略了這一點,直接使用75來計算Z值,所以結果可能會有輕微的偏差,但大致接近。
接下來,問題是要回答在150人中,有多少概率贊成者少於75人,也就是P(X < 75)。根據題目的示例,使用不同的FPC得到的概率不同,分別是約10.9%、9.1%、12.5%。
不過題目可能希望使用其中一種FPC來進行計算,或者比較不同的結果。不過用戶的問題可能只是要回答這個概率,而示例中給出了三種可能的結果,需要明確應該選擇哪一種。
首先,我們需要確定是否需要應用有限總體修正。
因為總體N=1000,樣本n=150,抽樣比例是15%,超過5%,所以通常這時候會建議使用FPC。正確的有限總體修正因數應該是sqrt((N - n)/(N - 1)),即這裡的修正C。
這種情況下,標準差是5.620,Z值-1.335,對應的概率約9.1%。
因此,可能正確答案是約9.1%。不過題目中示例的三種結果可能對應不同的FPC應用情況,需要確認題目是否希望使用哪一種。
此外,問題後面還討論了比較樣本數量,保持誤差一致的情況下,如果使用FPC修正,可能需要的樣本量更少。這可能是一個不同的部分,但使用者的問題主要是第一個部分,即計算概率。
總結一下,解決問題的步驟應該是:
1. 確定是否應用FPC,由於n/N=15%>5%,可能需要應用FPC。
2. 計算均值μ = nP = 82.5。
3. 計算方差Var(X) = nP(1-P) * FPC²,其中FPC根據類型不同而不同。
4. 計算標準差σₓ̄ = sqrt(Var(X))。
5. 計算Z值=(x - μ)/σₓ̄,這裡x=75。
6. 查標準正態分佈表得到P(Z < 計算出的Z值)。
根據不同的FPC,得到不同的結果。題目中的示例已經給出了三種情況的結果,所以需要確認應該選擇哪一種。
通常情況下,正確的FPC是sqrt((N - n)/(N - 1)),也就是修正C,對應概率約9.1%。
不過也有可能題目中的FPC應用方式不同,或者是否存在誤解。例如,是否應該將FPC應用到均值標準誤上,而不是總次數X的標準差上?
這裡可能存在混淆,因為當處理樣本比例時,標準誤是sqrt(P(1-P)/n) * FPC,但當處理樣本數X時,方差應該是nP(1-P) * (N - n)/(N - 1),對嗎?
是的,對於樣本數X,其方差在有限總體中的情況應該是Var(X) = nP(1-P) * (N - n)/(N - 1),因此標準差是sqrt(nP(1-P) * (N - n)/(N - 1)),即原二項分佈的標準差乘以sqrt((N - n)/(N - 1)),也就是應用FPC後的標準差。
所以這裡的修正C是正確的,對應的標準差是5.620,概率約9.1%。
而修正H對應的FPC可能是錯誤的,或者題目中存在排版錯誤,比如應該是不同的運算式。
因此,正確的答案應該是約9.1%的概率,當使用有限總體修正時。不過題目中的示例也展示了如果不使用修正的話,概率是10.9%,而修正H的情況下得到12.5%。
可能需要根據題目要求選擇對應的結果,或者說明三種情況下的不同結果。
不過用戶的問題可能希望回答的是這個概率,而示例中已經給出不同情況下的結果,可能需要指出正確的FPC應用情況下的答案,即修正C的情況下的約9.1%。
然後問題的第二部分討論了比較樣本數量,保持誤差一致的情況下,如果使用FPC修正,可能需要更小的樣本量。
例如,當在1000人中抽150人時,標準誤為σₓ̄ = 1 / sqrt(150) ≈ 0.0817,如果要讓80人的調查達到相同的標準誤,需要考慮不同的FPC。
不過這部分可能需要進一步解釋,但使用者的問題可能主要集中在第一部分,即概率計算。
不過我需要再仔細檢查一下步驟,確保正確性。
首先,計算X < 75的概率,使用正態近似:
1. 均值μ = 150 * 0.55 = 82.5
2. 方差Var(X) = 150 * 0.55 * 0.45 = 37.125
3. 標準差σ = sqrt(37.125) ≈ 6.093(無修正的情況)
應用有限總體修正後的方差為Var(X) = 37.125 * (N - n)/(N - 1) = 37.125 * (850/999) ≈ 37.125 * 0.85085 ≈ 31.586,因此修正後的標準差σ_c = sqrt(31.586) ≈ 5.620。
然後計算Z值:
Z = (75 - 82.5) / 5.620 ≈ -7.5 / 5.620 ≈ -1.335
查標準正態分佈表,Z = -1.335對應的概率是累積分佈函數Φ(-1.335) ≈ 0.091,即9.1%。
同樣,如果使用修正H的FPC,即sqrt((N + n)/(N + 1)),計算的話:
FPC_H = sqrt((1000 + 150)/(1000 + 1)) = sqrt(1150/1001) ≈ sqrt(1.149) ≈ 1.072
所以修正後的標準差σ_h = 6.093 * 1.072 ≈ 6.530
Z = (75 - 82.5)/6.530 ≈ -7.5/6.530 ≈ -1.148,對應的概率Φ(-1.148) ≈ 0.125,即12.5%。
而如果不使用修正,Z=-1.231對應概率≈10.9%。
因此,這三個結果都是正確的,取決於是否應用FPC以及應用哪種FPC。
不過通常來說,正確的有限總體修正因數應該是sqrt((N - n)/(N - 1)),也就是修正C的情況,對應概率9.1%。
不過可能還存在另一個問題:當計算樣本比例的方差時,標準誤是sqrt(P(1-P)/n) * FPC,
而當計算樣本數的方差時,是nP(1-P) * FPC²。所以可能這裡應該考慮的是樣本數的情況,即X的方差是nP(1-P) * FPC²,其中FPC是sqrt((N - n)/(N - 1))。
因此,正確的概率應該是使用修正C的情況下的9.1%。
不過使用者的問題可能需要明確回答,根據示例中的三種情況,應該選擇哪一種作為答案。可能需要根據統計學的標準做法來判斷,即當抽樣比例n/N超過5%時,應該使用有限總體修正因數sqrt((N - n)/(N - 1)),所以正確答案是約9.1%。
但是,也有可能題目中的示例只是展示不同的情況,實際需要根據題目要求選擇。例如,題目是否明確要求使用某種FPC?
不過根據題目中的問題描述,它只是說“用標準誤差法估算”,可能需要根據常規方法,也就是當抽樣比例較大時應用有限總體修正,所以答案應該是9.1%。
接下來問題的第二部分是關於比較樣本量,保持誤差一致的情況下,當使用不同的FPC時需要多少樣本量。
例如,原題中在1000人中抽150人,計算標準誤為σₓ̄ = 1 / sqrt(150) ≈ 0.0817。這裡可能需要確認這個標準誤是指比例的標準誤還是均值的標準誤。
例如,如果是比例的標準誤,則σ_p = sqrt(P(1-P)/n) * FPC,而如果是均值的標準誤,則可能是σ / sqrt(n) * FPC。不過這部分可能需要更仔細的分析。
比如,原問題中的第二部分提到:
“若1000人中抽150人,標準誤為:
σₓ̄ = 1 / √150 ≈ 0.0817”
這可能指的是比例的標準誤,假設P=0.5時的最大標準誤為1/(2√n),當P=0.5時,sqrt(P(1-P)/n) = sqrt(0.25/n) = 0.5/√n,
所以如果σₓ̄ = 1/√150 ≈ 0.0817,可能他們假設的是P=0.5,因此將標準誤近似為1/(2√n)?但這裡可能有些混淆,需要明確。
不過這部分可能屬於題目的第二部分,使用者的問題可能主要集中在第一部分的概率計算,即贊成人數少於75人的概率。
綜上所述,根據標準統計方法,當從有限總體中抽樣時,如果抽樣比例較大(如超過5%),應該使用有限總體修正因數sqrt((N - n)/(N - 1)),因此正確的概率應該是約9.1%。
不過用戶提供的示例中,三種FPC的應用可能對應不同的結果,可能需要根據題目要求選擇正確的修正方式。但根據統計學理論,正確的FPC應該是sqrt((N - n)/(N - 1)),因此答案應該是約9.1%。
不過為了確認,我需要再次檢查計算過程:
1. 計算有限總體修正因數FPC:
FPC = sqrt((N - n)/(N - 1)) = sqrt((1000 - 150)/(999)) = sqrt(850/999) ≈ sqrt(0.85085) ≈ 0.9224
2. 原始方差Var(X) = nP(1-P) = 150*0.55*0.45 = 37.125
3. 修正後的方差Var_c = 37.125 * (850/999) ≈ 31.586
4. 修正後的標準差σ_c = sqrt(31.586) ≈ 5.620
5. Z = (75 - 82.5)/5.620 ≈ -1.335
6. 查標準正態分佈表,Z=-1.335對應的左側概率約為0.091,即9.1%
因此,這個計算是正確的,所以答案應該是約9.1%的概率。
因此,最終答案應該是使用修正C的情況下,概率約為9.1%。
但使用者可能需要根據題目的要求選擇是否應用FPC。
例如,在考試題目中,有時候會忽略FPC當n/N較小,但在這裡n/N=15%較大,應該應用。所以正確的答案是約9.1%。
不過原示例中也展示了無修正的情況是10.9%,修正H為12.5%,但修正H的FPC應用方式可能不正確,因為通常有限總體修正因數應該是減少方差,而不是增加,而修正H的情況下FPC是sqrt((N + n)/(N + 1)),這會大於1,導致方差增大,這在現實中是沒有意義的,因為抽樣不放回應該減少方差,而不是增加。
因此,修正H可能是一個錯誤的應用,或者題目中存在排版錯誤,例如正確的修正應該是sqrt((N - n)/(N + 1))或其他形式,但無論如何,根據標準統計學知識,正確的FPC應該是sqrt((N - n)/(N - 1)),即修正C的情況。
因此,結論是,在150人中贊成者少於75人的概率約為9.1%,當應用正確的有限總體修正時。
**答案**9.1%
首先,我們需要計算在1000人中抽取150人的樣本中,贊成人數少於75人的概率。題目給出原資料中贊成比例為55%,反對比例為45%,因此總體比例P為0.55,樣本量n為150人,總體N為1000人。
關鍵步驟:
計算期望值μ和原始方差:
期望值μ = nP = 150 × 0.55 = 82.5
原始方差Var(X) = nP(1-P) = 150 × 0.55 × 0.45 = 37.125
原始標準差σ = √37.125 ≈ 6.093
應用有限總體修正因數(FPC):
FPC = √[(N - n)/(N - 1)] = √[(1000 - 150)/999] ≈ √(850/999) ≈ 0.9224
修正後的方差Var_c = 37.125 × (850/999) ≈ 31.586
修正後的標準差σ_c = √31.586 ≈ 5.620
計算Z值:
Z = (75 - 82.5) / σ_c ≈ -7.5 / 5.620 ≈ -1.335
查標準正態分佈表:
Z值-1.335對應的累積概率約為0.091,即9.1%。
結論:
在應用正確的有限總體修正因數(FPC = √[(N - n)/(N - 1)])的情況下,贊成人數少於75人的概率約為9.1%。
________________________________________
________________________________________