指考 99 年大學指考高低標,五標。
年度 99
頂 標 前 標 均 標 後 標 底 標
國文 67 62 54 44 36 *
英文 79 69 48 26 13 *
數甲 79 65 45 25 14 **
數乙 88 78 60 40 22
化學 68 57 38 21 12 *
物理 57 43 24 12 6
生物 81 73 58 40 28
歷史 75 68 57 43 31
地理 63 56 46 34 26 *
这是一个某地学生在 99 年大學指考分数的五標分布表,数据量足够大(large sample size)。
这里的“標”指的是 percentile--
頂標是 88 percentile
前標是 75 percentile
均標是 50 percentile
後標是 25 percentile
底標是 12 percentile
我的问题是,根据这五標,能否大致知道其它分数的 percentile?
例如,在數甲里,70分大致是在什么 percentile?
由于不知道數甲分数的随机变量X的分布函数,因此我只能作一个预先假定(assumption),即,这个随机变量X ~ N( u, sigma ),也就是正态分布。
数表中给出的“均標”应是指中间值(median),而非平均值(X bar)。
“數甲”分数的五標分布结构还算比较对称。
第一步是估算出平均值(X bar)。
如果正态分布的这个 assumption 是对的话,那么,75 percentile 与 25 percentile 的中心点就是平均值。
(65+25)/2 = 45 --这与中间值重合。
同理,88 percentile 与 12 percentile 的中心点也应是平均值。
(79+14)/2 = 46.5 --不与中间值重合。
当然,观察值(observation)如果出现一点小偏差也是正常的。
我决定用这两个平均值来做平均,得到的结果即作为 u 的估计值(estimate)。
(45+46.5)/2 = 45.75
第二步是估算出标准方差 sigma(standard deviation)。
用 88 percentile 来计算,查标准正态分布表值:
(79-45.75)/sigma = 1.175 ==>
sigma =(79-45.75)/1.175 =28.2979
用 75 percentile来计算,
(65-45.75)/sigma =0.675 ==>
sigma =(65-45.75)/0.675 = 28.5185
最后用这两个 sigma 值来做平均,得到的结果即作为 sigma 的估计值(estimate):28.40
正态变量的标准化转换为 Z=(X-u)/sigma
把 70 分代入,得到:(70-45.75)/28.40 = 0.85
查 0.85 的标准正态分布表值,得到 0.8023,即,70分大约是 80 percentile。
另外,我若想知道其它的 percentile 大约是多少分。
例如,60 percentile大约是多少分?
先查 0.60 的标准正态分布表值,得到Z值约为 0.25。
然后,Z=(X-45.75)/28.40 ==>
X=0.25(28.40)+45.75 = 52.85
即,60 percentile大约是 53 分。
希望有高手来不吝赐教,或在文下直接点评,或留悄悄话,一律欢迎。
我这里先谢过了。
- 2樓. 随机2011/08/11 08:06過程
一個雞蛋,一把鹽,這麼閒啊?
随机变量哪裡夠,那就試試隨機過程吧愿闻其详。望大师不吝赐教。
sas 於 2011/08/11 17:07回覆 - 1樓. yichun2011/08/09 01:36如何處理 "skew"?
拜讀貴覆。
1.如分佈果為“完美對稱鐘”(symmetrical bell; http://www-users.york.ac.uk/~mb55/intro/triglhs.gif)或者“接近完美對稱”,則貴法已足堪實用。即:“將z值與百分量比,作自由轉換”(convert z value to percentile). 坊間甚至有商用軟體程式,將常態分佈計算納入內藏計算式,只需鍵入z值,即可得出percentile (例如:http://www.measuringusability.com/zcalcp.php)
2.但若實測分佈為“不對稱鐘” (asymmetrical bell),又稱偏鐘式(skewed bell),有無簡易計算法則?谢兄台之指点。
兄台果然犀利,一出手便戳中我的软肋。
这个思考题我原以为简单,若按书上的经典作法,就是套用“完美對稱鐘”的解法。
但开始入手后,却发现有些科目的五标分布不是很对称,因此陷入困境。再加上一些琐事缠身,无法长考,一时竟卡住了。
后来一想,无论如何,这个思考题必须是按科目分开计算。因此先挑了一些五标比较“對稱鐘”的来,按标准解法先做。
那个“数甲”的分布,应该算是相当对称了。其它还有一些还算对称的,我都打上标记(*)。
剩下的一些有skewness的科目,无非是或 skew to right,或 skew to left。
我还在思索中。一种可考虑的手法是,还是按“對稱鐘”的算法,但做两次。第一次是按高标、顶标来计算,得出结果。
第二次是按低标、底标来计算,得出另一结果。
最后把这两个结果取一平均数来作为最终答案。