37
При отборе методов статистического анализа данных и оформлении ре-
зультатов были учтены рекомендации авторов методических публикаций в об-
ласти статистики и результаты исследований в нашей стране и за рубежом,
электронная справка Microsoft Excel [3, 23, 24, 31, 32, 36, 47, 55, 56, 88, 93, 96,
126, 127, 132–134, 141, 164, 166, 168, 176, 179, 200, 202, 236]. В большой мере
использована технология статистического анализа, предложенная Ж. В. Гуди-
новой [38, 169]. Настоящее исследование складывалось из следующих ос-
новных этапов:
I.
подготовка данных: сбор информации, заполнение электронных
таблиц, проверка и сортировка, формирование матрицы, импорт в
программу статистической обработки;
II.
разведочный
анализ:
вычисление
основных
статистик,
визуализация данных (построение графиков и картограмм);
III.
оценка связей в системе «среда обитания – здоровье населения»
(корреляционный анализ);
IV.
многомерная классификация территорий по ряду показателей
здоровья и среды обитания населения с выделением наиболее
проблемных регионов (кластерный анализ);
V.
анализ зависимостей и прогнозирование путем построения
моделей (множественный регрессионный анализ).
Исходя из задач исследования, сравнение и анализ данных проводились в
совокупности всех регионов Российской Федерации.
На начальном этапе статистической обработки материала была использо-
вана программа Microsoft Office Excel 2003 для работы с электронными табли-
цами (лицензионное соглашение 8800967). Кроме того, для статистического
анализа материала был применен пакет прикладных программ STATISTICA
6.1 (лицензионное соглашение BXXR904Е306823FAN10).
Оценка характера распределения признаков с помощью критерия Шапи-
ро-Уилка показала, что большая часть количественных признаков имела рас-
пределение отличное от нормального. Информация обработана с применением