Стр. 42 - 2

Упрощенная HTML-версия

Tempus Programme IB JEP-26029-2005
Тест может быть валидным, если, помимо прочих требова­
ний, средние результаты соответствуют большей части студен­
тов группы, а сами данные распределяются по «нормальному за­
кону». Если это условие не выполняется, то такой тест считается
невалидным с точки зрения соответствия стандартам распреде­
ления. Именно отсюда проистекает стремление создателей теста
добиваться нормальности распределения за счет варьирования
числа легких и трудных тестовых заданий.
В процессе создания теста мера трудности регулярно про­
веряется на случайной выборке из того контингента, для которо­
го тест предназначается. В сбалансированном тесте авторы
обычно легко добиваются нормальности распределения. Даль­
нейшее совершенствование теста идет по пути замены ряда за­
даний, ответы на которые нарушают нормальность распределе­
ния.
Трудность заданий влияет на надежность и валидность. Если
тест очень трудный, то студенты чаще вынуждены догадывать­
ся, какой ответ правильный, но чем чаще они прибегают к догад­
ке, тем больше распределение результатов теста приближается к
случайному распределению. Поэтому пригодность теста для оцен­
ки знаний всей массы студентов будет тем ниже, чем труднее тест.
Такое же влияние на надежность, но по другой причине, оказывает
легкий тест, в котором студенты редко догадываются, их ответы
устойчивы, но нет различий между испытуемыми.
Валидность теста существенно уменьшается из-за снижения
его различающей способности. Различающая способность теста
тем выше, чем меньше одинаковых тестовых баллов набирают
сами студенты.
Валидность теста зависит и от длины теста. Под длиной тес­
та понимают количество заданий, входящих в тест. Существуют
тесты очень короткие, состоящие из 7-15 заданий, и очень длин­
ные, состоящие из более 500 заданий.
Если тест очень длинный, то ухудшается мотивация и внима­
ние у испытуемых, а это снижает надежность и валидность. Прак­
тика показывает, что если тестирование занимает более полутора
41