Tempus Programme IB JEP-26029-2005
Тест может быть валидным, если, помимо прочих требова
ний, средние результаты соответствуют большей части студен
тов группы, а сами данные распределяются по «нормальному за
кону». Если это условие не выполняется, то такой тест считается
невалидным с точки зрения соответствия стандартам распреде
ления. Именно отсюда проистекает стремление создателей теста
добиваться нормальности распределения за счет варьирования
числа легких и трудных тестовых заданий.
В процессе создания теста мера трудности регулярно про
веряется на случайной выборке из того контингента, для которо
го тест предназначается. В сбалансированном тесте авторы
обычно легко добиваются нормальности распределения. Даль
нейшее совершенствование теста идет по пути замены ряда за
даний, ответы на которые нарушают нормальность распределе
ния.
Трудность заданий влияет на надежность и валидность. Если
тест очень трудный, то студенты чаще вынуждены догадывать
ся, какой ответ правильный, но чем чаще они прибегают к догад
ке, тем больше распределение результатов теста приближается к
случайному распределению. Поэтому пригодность теста для оцен
ки знаний всей массы студентов будет тем ниже, чем труднее тест.
Такое же влияние на надежность, но по другой причине, оказывает
легкий тест, в котором студенты редко догадываются, их ответы
устойчивы, но нет различий между испытуемыми.
Валидность теста существенно уменьшается из-за снижения
его различающей способности. Различающая способность теста
тем выше, чем меньше одинаковых тестовых баллов набирают
сами студенты.
Валидность теста зависит и от длины теста. Под длиной тес
та понимают количество заданий, входящих в тест. Существуют
тесты очень короткие, состоящие из 7-15 заданий, и очень длин
ные, состоящие из более 500 заданий.
Если тест очень длинный, то ухудшается мотивация и внима
ние у испытуемых, а это снижает надежность и валидность. Прак
тика показывает, что если тестирование занимает более полутора
41