98
Использовался быстрый кластерный анализ, носящий название метода «k-
средних» [83, 93, 101, 144, 148, 246, 474].
Быстрый кластерный анализ.
Эта процедура пытается выявить относительно однородные группы
наблюдений на основе выбранных характеристик, используя алгоритм,
позволяющий отобрать большое число наблюдений. Быстрый кластерный
анализ требует указание числа кластеров.
Наиболее приемлем быстрый алгоритм, носящий название метода "k-
средних". Алгоритм заключается в следующем: выбирается заданное число k-
точек и на первом шаге эти точки рассматриваются как "центры" кластеров.
Каждому кластеру соответствует один центр. Объекты распределяются по
кластерам по такому принципу: каждый объект относится к кластеру с
ближайшим к этому объекту центром. Таким образом, все объекты
распределились по k кластерам.
Затем заново вычисляются центры этих кластеров, которыми после этого
момента считаются покоординатные средние кластеров. После этого опять
перераспределяются объекты. Вычисление центров и перераспределение
объектов происходит до тех пор, пока не стабилизируются центры.
В быстром кластерном анализе используется только евклидово расстояние.
Используются только метрические переменные.
Analyze
Classify
K-means Cluster
.
Перед вами появится следующее диалоговое окно (Рис. 21).