Стр. 22 - 2

Упрощенная HTML-версия

Разумеется, технические ошибки в регистрации наблюдений, которые
нам удавалось выявить, сразу же, в процессе работы в лаборатории, ис­
ключались из выборок.
Коснемся теперь кратко проблемы пропусков.
Пропуски
в
данных
-
это наблюдения, не имеющие интервала опре­
деленности, то есть целиком состоящие из интервала неопределенности.
Об этих наблюдениях известен лишь факт их существования, но не их
цифровые значения.
Экспериментальные значения некоторых наблюдений
xtj
или
в на­
шем исследовании были утрачены или не были определены по тем или
иным случайным причинам, например, разбилась пробирка и т.п. Эти не­
дополученные значения наблюдений называются
пропусками
в данных.
Важно, что благодаря рандомизации исследования образование
таких
пропусков в наших выборках происходило в
случайном
порядке, поэтому
их можно назвать
случайными пропусками.
В настоящей работе мы не прибегали к замене недостающего экспе­
риментального значения одного из факторов или отклика какой-либо его
оценкой,
хотя статистических методов восстановления
случайных
про­
пусков предложено немало (см. [26]).
Многие авторы (в частности [5]) считают, что исключать из дальней­
шего рассмотрения весь объект (столбец, в котором есть пропуск) или
признак (строку, в которой есть пропуск) слишком расточительно с точки
зрения потери информации. Тем не менее мы пошли по этому пути и при
наличии всего лишь одного пропуска исключали “весь объект”, то есть
все экспериментально полученные значения факторов и отклика данного
животного (крысы под номером
j )
из построения математической модели.
Результатом стало сокращение объема (величины
п)
наших и без того не­
больших выборок. Это, конечно, спорный подход, и, возможно, в буду­
щем мы его пересмотрим. Но сейчас нам придает дополнительную уве­
ренность то обстоятельство, что все наши модели построены строго по
“подлинникам”, без примеси “реставрированных копий” эксперименталь­
ных данных.
Абсолютно необходимым требованием для использованного нами ме­
тода математического моделирования является условие, чтобы число на­
блюдений
п
превышало, как минимум, на 2 число факторов
т
в модели. В
нашем исследовании встречались случаи, когда это требование не выпол­
нялось из-за ограниченности объема выборки и утраты части наблюдений
(пропусков в данных). Полученные уравнения (их нельзя даже назвать ма­
тематическими моделями) могут иметь лишь некоторое описательное зна­
чение, никакие статистико-вероятностные процедуры проводить с ними
не имеет смысла.
Как полагают авторы книги [59], посвященной математико­
22