Разумеется, технические ошибки в регистрации наблюдений, которые
нам удавалось выявить, сразу же, в процессе работы в лаборатории, ис
ключались из выборок.
Коснемся теперь кратко проблемы пропусков.
Пропуски
в
данных
-
это наблюдения, не имеющие интервала опре
деленности, то есть целиком состоящие из интервала неопределенности.
Об этих наблюдениях известен лишь факт их существования, но не их
цифровые значения.
Экспериментальные значения некоторых наблюдений
xtj
или
в на
шем исследовании были утрачены или не были определены по тем или
иным случайным причинам, например, разбилась пробирка и т.п. Эти не
дополученные значения наблюдений называются
пропусками
в данных.
Важно, что благодаря рандомизации исследования образование
таких
пропусков в наших выборках происходило в
случайном
порядке, поэтому
их можно назвать
случайными пропусками.
В настоящей работе мы не прибегали к замене недостающего экспе
риментального значения одного из факторов или отклика какой-либо его
оценкой,
хотя статистических методов восстановления
случайных
про
пусков предложено немало (см. [26]).
Многие авторы (в частности [5]) считают, что исключать из дальней
шего рассмотрения весь объект (столбец, в котором есть пропуск) или
признак (строку, в которой есть пропуск) слишком расточительно с точки
зрения потери информации. Тем не менее мы пошли по этому пути и при
наличии всего лишь одного пропуска исключали “весь объект”, то есть
все экспериментально полученные значения факторов и отклика данного
животного (крысы под номером
j )
из построения математической модели.
Результатом стало сокращение объема (величины
п)
наших и без того не
больших выборок. Это, конечно, спорный подход, и, возможно, в буду
щем мы его пересмотрим. Но сейчас нам придает дополнительную уве
ренность то обстоятельство, что все наши модели построены строго по
“подлинникам”, без примеси “реставрированных копий” эксперименталь
ных данных.
Абсолютно необходимым требованием для использованного нами ме
тода математического моделирования является условие, чтобы число на
блюдений
п
превышало, как минимум, на 2 число факторов
т
в модели. В
нашем исследовании встречались случаи, когда это требование не выпол
нялось из-за ограниченности объема выборки и утраты части наблюдений
(пропусков в данных). Полученные уравнения (их нельзя даже назвать ма
тематическими моделями) могут иметь лишь некоторое описательное зна
чение, никакие статистико-вероятностные процедуры проводить с ними
не имеет смысла.
Как полагают авторы книги [59], посвященной математико
22