網路城邦

上一篇 回創作列表 下一篇   字體:
國中基測是什麼東東?
2009/05/25 23:57:02 瀏覽4057|回應8|推薦13

擁抱聯考,並不是因為喜歡聯考,而是因為現有的制度比聯考還糟。

在以前聯考的時代,分數決定一切。

在現在這個時代,分數不能代表一切,但是沒了分數,就沒了一切。

考試制度的缺失,才是真正造就「分數至上」的主因。

在中研院研究員林妙香為文抨擊基測計分不公之後,心測中心將計分方式做了大幅度調整,從原本的單科60分提升為單科80。然而「舊制基測」到底出了什麼問題?「新式測驗」又會有何種隱憂?適逢第一次「新制基測」 考試告一段落,就讓筆者仿照〈精打細算談量尺〉,的Q&A方式,來替各位回答──

為何今年要改採「新式測驗」?

之所以今年會改採「新式基測」,其實是「舊制基測」被「踢爆」計分方式有問題的緣故,中研院研究員林妙香的研究報告〈90-93年度國中基測量尺及等化程序之個案研究〉,實扮演了關鍵的角色。

談到〈90-93年度國中基測量尺及等化程序之個案研究〉,就一定要說明一下這篇報告的內容。雖然當時媒體有報導,但是除了「分數計算有問題」、「不考二測吃大虧」這兩個「結論」外,對於內容較無深入的探究,在此不得不向各位解釋一番:

就「分數扭曲」的部分,在這篇報告中指出:

考生基測成績通知單1-60分的考科量尺分數是被「調整」過的,沒有按照公告所定的計分遊戲規計算考科量尺分數,加入了莫名奇妙的「調整」:有的考科量尺分數是以最高分64.34計算的,有的考科量尺分數是以最高分59.56計算的。

( 資料來源:《中國統計學報》45卷4期,P.410 )

也就是說,各科量尺分數的最高分並非設定在60分,而且各科各年度皆不相同。

而最高分「人為設定」的結果,所影響到的不只是高分的考生,幾乎所有考生都會受其影響,以91年度數學科為例:

( 資料來源:《中國統計學報》45卷4期,P.412 )

為了讓各位更能方便理解兩者的差距,我將它做成了下面的圖表:

從上表我們可以得知,基測分數經「人為調整」後,低分群的公告成績較「最高分設定為60分」的結果還低。當然,以「最高分設定為60分」計算的結果,高分群錯一題所扣的分數實際上還較原本(公告)的扣分來的重。

為什麼林妙香研究員會認為「不考二測虧大」?

因為按照「標準測驗」的原理(網友時季常的文章對此有詳盡介紹),基測考題的難易度不會有什麼變化,考生的成績在短期內也不會有多大改變才是。然而根據「90-93年度國中基測量尺及等化程序之個案研究」,二測的平均成績比一測都高出幾分,會產生這種原因只有兩種可能:

1.考生整體表現較第一次為進步
2.二次測驗量尺並無等化(equating)步驟,只是單純進行分數連結(linking)。

而為何林妙香研究員會認為「後者」才可能是影響成績的主因呢?因為在研究中她特意比較了「兩次學測都有參加的考生」的一測與二測成績,結果發現:

93學年度而言,二題本原始分數的平均值及標準差皆相近,何以第二次量尺分數總平均值卻多出5.0;92學年度亦然,第二次量尺分數總平均值多出2.3分。91學年度,自然學科二題本原始分數的平均值相近,何以第二次量尺分數平均值低於第一次平均值約2.0分。90學年度,數學考科二題本原始分數的平均值相近,何以第二次量尺分數平均值高於第一次達2.2分之多, 而量尺分數總平均值可增加至8.7分。

( 資料來源:《中國統計學報》45卷4期,P.425 )

也就是說,二次基測分數較一測「墊高」的結果,「人為因素」(測驗成績並無「等化步驟」)有很大的關聯。難怪何林妙香研究員會認為「只考一測較二測都考吃虧」的原因了。

當然,林研究員的論述還必須建立在一個前提上,就是:考生申請入學沒有上。因為二測「整體進步」的結果,也就相當於考生「通通沒進步」,如果申請入學有上,仍想去拼登記分發看看有沒有更好的結果,除非二測有「顯著的進步」(一二十分跑不掉),或者對一測的成績非常有把握(必能上登記分發想要的志願),否則分發較申請的結果還糟絕非不可能的事。

之所以會產生「分數墊高」的問題,在於心測中心捨棄了ACT或ETS的IRT-3參數模式,而採用Rasch的單參數模式建立題庫。雖然同樣是IRT轉換,但是Rasch模式的試題特徵曲線卻是建構在「試題鑑別度相同」且「試題猜度為零」的情況下。至於為何不使用ETS採用的IRT-3參數模式作為分數轉換的方式,在「新制量尺基測問答」中,他們做了如此的回應:

IRT轉換法是最能反應考生真實程度,但這個計分法適用「中間偏難」的試題,國中基測社會大眾的共識是考「中間偏易」,中間偏易的題目採用IRT轉換法,數學錯一題可能扣10分,社會更不能接受。

所以各位真的要體諒主事者為了「順應民意」,而刻意「手動調整」的苦心啊!

分數差距縮小,會不會加重高分群的分數競爭?

,因為雖然分數的差距縮小了,但是在題目難易度仍採「中間偏易」的情況下,可預期高分群考生「錯題數」不至有太大的變化。

除此之外,在分數差距縮小的情況下,以往「各科錯一兩題」較「單科錯多題」低分的情形也將不復見。而這些「各科錯一兩題」的考生的分數較舊制提升的結果,除了導致高分群的人數增多以外,也會從以往「分數」的競爭變成「錯題數」的競爭。前幾志願的分數往往是1~2分之差,競爭更為激烈。

這種情形將有多嚴重呢?根據心測中心對外公布的比較結果,「若以今年(2008年)基測兩次擇優的成績來計算,共有3252人達PR99,但若改以明年實施的新量尺來計分,將有4088人達PR99,比今年的人數多了8百多人,顯示高分群有很多人同分。」

(框起來的才是重點!
資料來源:〈精打細算談量尺〉,P.4)

「新式基測」中 作文扮演的角色?

照理而言,基測五科提高了100分而作文分數沒有變動,作文對總分的影響力應該會降低才是,何以作文反倒成為「決勝關鍵」呢?主要原因有兩個:

一是高分群競爭激烈的緣故。由於「各科錯一兩題」的考生的分數較舊制提升的結果,高分群同分的人數增加。在前幾志願的分數差距縮減為一兩分的情況下,「一級分兩分」的作文自然扮演了決定性的因素。

一是「扣分差距縮小」的緣故。在新制測驗的計分下,由於「每錯一題」的差距縮小,以往單科錯一題扣很多分的情形也將不復見。根據〈精打細算談量尺〉,所提供的「新舊分數對照表」(P.5、P.6),以2008年第一次基測為例,各科只錯一題的結果:國文數學分別從扣4分變為扣2分、英語社會則分別從扣5分減為扣2分、自然從扣3分減為扣1分,作文「一級分兩分」的「價值」相對而言也因此提升(相當於從原來的「半題」提升為「1~2題」)。

根據上面的資料,按舊制計算,作文四級分相當於國文(或數學)錯一題,但若換算成新制的話,作文則必須達到五級分,「扣分」才能相等。

然而教育部與心測中心只隨便丟了一個表格(Q&A第四頁),想「說服」我們「改成新制之後,考生分數差距仍然一模一樣」(見下表):

國中基測分數平移,能更精確地區別原本其他5科只得1分考生間的能力差異,對原本其他5科得分260分的學生而言,無論平移多少分,與他人的分數差距仍然一模一樣,不會因分數範圍增加而擴大,寫作的影響力也沒有增加或減少。

【問題是,教育部與心測中心的計算方式是在兩者都採用「新制」的前提下(單科加20分與否的對照),卻刻意忽略了社會大眾所關心的其實是「新舊制對照的結果

除此之外,「同分比序」先比作文的緣故,作文的影響力會更為增加。

更怪的是,有誰能告訴我,為何作文和測驗題採用的是不同的「計分方式」?

結論:為什麼要設計這種制度來「荼毒」我們的學生?

2009/05/26 聯網首頁|意見評論,十度「榮登」

( 時事評論教育文化 )

回應 推薦文章 轉寄 列印 加入我的文摘
上一篇 回創作列表 下一篇  

引用
引用網址:http://blog.udn.com/article/trackback.jsp?uid=freshbird&aid=2979118
 引用者清單(1)  
2009/05/29 12:53 【狗言鳥語人來瘋】 回應記錄│國中基測是什麼東東?(作者:BigMac)

 回應文章

一生低首拜陽明
等級:7
留言加入好友
想起以前數學老師的說法
2009/06/11 10:18
我那時候準備大學聯考時 國中基測正開始上路

那時候我們數學老師就說 其實來這一招是為了讓學生的學習成就看起來很常態分布所致 表示我們的教育很成功 也沒什麼城鄉差距 學生素質很好

雖然我不完全同意這說法 但是我相信量尺這東西本來就有很強烈的可操作性
所以我不相信基測這種量尺

相較起來 我倒覺得不如用絕對分數來換算(由得分轉換成相對的位置來計算自己的得分數 例如在全國考生前1%者 就是99分 以此類推下去) 至低也應該用大學學測時的級分法(全國前0.5%考生平均成績定為基礎值 然後由此數到0之間等分成15級分 接下來就按照分數換算級分) 似乎都比這種國中基測好點
沒有獨立思考就不能夠談民主與自由

東西雖然不多,但會日漸充實
blog
http://blog.udn.com/longreach

靜 默
等級:8
留言加入好友
謝謝你做了非常詳細的補充
2009/05/29 12:48

我的女兒今年基測,剛考完第一次基測她整個放鬆,因為預測她一定可以上心目中的那個理想學校,所以就抗議不想再考第二次。

我看了新聞還有一些分析(有點太晚看見你這篇文章),得到結果是,歷屆經驗顯示第二次基測成績普遍比第一次來的好。而今年第一次考試題目已獲各界肯定偏簡單容易,所以整體成績是比去年大幅提高,這就符合了你說的,「因為二測「整體進步」的結果,也就相當於考生「通通沒進步」【我應用在:今年大家的得分比去年進步=整體沒有進步】

我告訴她,如果大家都拿第一次成績去申報,那她當然可以上想進的學校。但是有沒有可能第一次考不理想(或實力不錯但考運較差)的同學考了第二次比較好,反而把她給擠了出去?而她自己卻放棄了可能會考更好的第二次基測?

還好,我深刻地想清楚前後關係,就這樣告訴她,她後來可能有跟老師求證我的說法,在這幾天就比較「甘願地」乖乖唸書了。 

很難得,你能這麼深入的做這些精闢的說明,一些不懂「為何要讓孩子參加二次基測」的父母應該要好好看你這篇文章。


靜 默
等級:8
留言加入好友
真的
2009/05/28 21:51

樓下講的真貼切。兩次的基測,差不多=高中聯考考兩次。

BigMac(freshbird) 於 2009-05-28 22:14 回覆:

當然,這還必須建立在一個前提上,就是:考生申請入學沒有上。因為二測「整體進步」的結果,也就相當於考生「通通沒進步」,如果申請入學有上,仍想去拼登記分發看看有沒有更好的結果,除非二測有「顯著的進步」(一二十分跑不掉),或者對一測的成績非常有把握(必能上登記分發想要的志願),否則分發較申請的結果還糟絕非不可能的事。

本段已在文中作補充,謝謝你的提醒。


時季常
等級:8
留言加入好友
剛剛看見這篇文章
2009/05/28 02:49

剛剛看見你的這篇文章。

這個新式聯考,才是真正的怪獸,應該要口誅筆伐,非除之不可。


paul23
等級:7
留言加入好友
好複雜!
2009/05/27 12:44
基本上像是: 可以考兩次的高中聯考,然後用分數去申請學校,是嗎?

全面回復20年前的聯考制度
全面回復20年前的聯考制度
2009/05/27 05:42

東方人上不了明星學校就對不起祖宗十八代的觀念不改,再怎樣教改都沒有辦法減輕學生的壓力,倒不如回復最公平的制度。

聯考不是一試定終身。任何人都可以一考再考。不記名且不分貧富貴賤都能應考的考試,是要選拔出最有潛力通過更高階段教育的人,唯一公平制度。

聯考不是科舉,高普考等國家考試才是科舉。這些教育部官員為什麼不倡導廢除高普考,一律靠特權關說才可以進教育部服務?

BigMac(freshbird) 於 2009-05-27 16:11 回覆:

「為避免社會大眾長久來對聯考「一試定終身」的詬病,國中基測一年舉辦兩次。國外一年多試的入學測驗(如SAT、ACT、GRE)均採用量尺分數,並透過測驗等化的程序,使考不同測驗版本之考生分數可以直接和公平的比較。國中基測採用量尺分數的理由,在於使兩次測驗分數可以直接和公平的比較,傳統聯考的計分方式,無法達到這個目的。」( 見〈精打細算談量尺〉,Q8)

這是心測中心說的!不是我說的!


時和
等級:8
留言加入好友
是誰設計出這種制度來「荼毒」我們的學生?
2009/05/26 02:55

不能只拋出問題,至少要給個解決的辦法吧?

中間偏易的考題也沒有說是對或是不對,反正明星學校一定招得到學生,至於是誰來上明星學校?看起來並沒有差異,公平嘛!

真正的問題是在中間偏易的考題,那是代表台灣學子的程度嗎?

如果中間偏易的考題真的代表台灣學子的程度,那台灣學子的英文和數學程度至少要差大陸學子一到兩年的實力了。

目前台灣學子申請美國留學生獎學金都不如大陸學子來得順利,絕大部分的原因還是出在英文和數學的實力。

目前在美國四十歲以下華裔年輕一輩的教授大都是大陸出身的,他們將影響學術界至為深遠。目前台灣學子連追求台灣的女留學生都被大陸學子搶佔了先機。

而台灣到現在還在強調中間偏易的考題,不知未來台灣的留學生要如何跟別人比?


BigMac(freshbird) 於 2009-05-26 12:54 回覆:

你講到了一個重點。心測中心題庫組長曾芬蘭就坦承基測設計雖是要作門檻,但實際上是用作高中分發的依據,要提升鑑別度,唯有從題目的難易度調整來下手,光靠調整量尺,只能治標、不能治本。

不過另一個重點則是,如果新式基測「每錯一題」的差距縮小成兩三分,為何不直接改採以往「一題幾分」的計分方式?也許有論者以為這還是「標準測驗」的記分方式、和以往聯考的計分不一樣,那我就要質疑,如果要同步採用「標準測驗」的記分方式,為何作文不一併列入考量?既然作文可以用「獨立」(而且還是「主觀」)的方式計分,那採用「標準測驗」的計分意義、公信力又何在?

「結論」我修改了幾個字,希望這樣表達的意義會更清楚一點。


angelhohoho
等級:8
留言加入好友
我真的看不懂
2009/05/26 02:35
也不明白為什麼要這樣做
這個複雜的東西是誰發明的
又是誰要這樣做
看得懂的家長和學生甚至老師
有多少人呢

沒事找事

BigMac(freshbird) 於 2009-05-26 10:01 回覆:

英國首相狄斯雷利有這麼一句名言:「謊話有三種:謊話、可惡的謊話,和統計學。」