Jak těžký má být test?

Vydáno:

Proč je důležité nastavit správně náročnost testu, jak ji dodatečně korigovat a co přesahuje možnosti školy?

Jak těžký má být test?
Mgr.
Jan
Hučín
 
analytik společnosti SCIO
Příliš těžká písemka, to je noční můra žáků i učitelů! Špatné známky nikdo nedostává ani nedává rád. Na úrovni třídy je sice možné v krajním případě
anulovat výsledky
a vyhlásit náhradní test, ovšem to znamená zbůhdarma vynaloženou energii; a jak si poradit, pokud se test týká většího počtu osob a na náhradní termín není prostor?
Opatření, že hranice pro známky může korigovat učitel během opravy, sice umožňuje čestný ústup,
není však úplně fér.
Někdo třeba zvolil strategii podle původního nastavení hranic, někdo kvůli tomu třeba i riskoval.
Kritéria hodnocení mají být stanovena předem
a neměnit se. Česká praxe je v tomto směru nepříliš povzbudivá: problém s nastavením a dodržením kritérií hodnocení mají i zásadní testovací akce typu státní maturity.
Trochu lépe jsou na tom
testy sloužící pro srovnávání žáků
(např. přijímací zkoušky). Dá se předpokládat, že
pořadí účastníků bude v zásadě stejné u lehčího i těžšího testu.
Extrémy ovšem škodí i zde - úloha, kterou vyřeší všichni správně (nebo všichni nesprávně), nám nijak nepomůže v rozlišení mezi lepšími a horšími účastníky.
Existuje vůbec nějaké vodítko,
jaká obtížnost testu je ideální?
Dobrá zpráva je, že existuje, a nepříliš složité. Jeho použití jako vodítka v reálné situaci však může být technicky obtížné.
Vezměme si nejdřív ověřovací test. U něho se o „správnou“ obtížnost úloh ani testu vlastně nemusíme starat. Každou úlohu totiž tvoříme podle toho, jakou dovednost ověřujeme. Dobrá úloha je taková, kterou žáci mající danou dovednost vyřeší a kterou naopak žáci bez dovednosti nevyřeší. Chceme-li například ověřit paměťovou znalost malé násobilky, patrně připravíme sadu úloh tak, aby neznalost zpaměti nebylo možné kompenzovat odvozením, třeba opakovaným sčítáním (obecný postup výběru úloh do ověřovacího testu je složitější a přesahuje rámec tohoto článku).
Hranici úspěšnosti pak určíme podle toho,
jak spolehlivou znalost od žáků chceme
(například nejvýše 10 % chyb). Obtížnost testu pak nemusíme řešit - test bude tak „lehký“, či „těžký“, nakolik žáci příslušnou dovednost mají, nebo nemají. Pokud se nedopatřením stane, že se do testu dostane nevhodná úloha, lze ji
dodatečně vyřadit z hodnocení
a test tím poněkud spravit.
Zdálo by se, že u srovnávacího testu je situace lehčí: úlohy není nutné vázat přesně na konkrétní dovednost a postačuje vyhnout se příliš těžkým nebo příliš lehkým úlohám. Dokáže však autor odhadnout, jak těžká je která úloha?
Praxe ukazuje, že
reálný odhad leckdy nemají ani zkušení tvůrci úloh.
Navíc nejpodstatnější je
schopnost každé úlohy rozlišit lepší od horších;
ideální úlohu u přijímacích zkoušek pak správně vyřeší právě ten podíl žáků, který chceme přijmout. Obtížnosti úloh - a tím i obtížnost testu - jsou až druhořadé.
Tyto vlastnosti úloh obvykle nelze spolehlivě zjistit jinak než
zkušebním ověřením
(tzv. pilotáží) a výpočtem statistických charakteristik. Špatně rozlišující úlohy mohou test znehodnotit, protože vedou k velkému
vlivu náhody
na výsledek testu. Bohužel test se špatně rozlišujícími úlohami již zpravidla nelze dodatečně napravit.