55
интересуют такие модели патологических процессов и такое их применение,
которые существенно повышают производительность труда врача или ученого.
Этому требованию удовлетворяют не только модели в виде уравнений, но и
относительно простые вероятностно-статистические описания биологических
процессов и явлений [194, 218].
Под кластерным анализом понимают группировку совокупности индивидов
таким образом, чтобы в каждой группе находились лица более схожие по
набору факторов риска по сравнению с другими группами. Такие группы
называются кластерами (классами). Кластерный анализ позволяет не только
разделить пациентов на группы по сочетанию наиболее информативных
факторов риска, но и провести идентификацию каждого обследуемого для
выделения пациентов, имеющих наихудший набор социально-биологических
параметров, которые требуют повышенного внимания [58]. Основной задачей
кластерного анализа является образование единой меры, охватывающей ряд
признаков, и чисто количественное решение вопроса о группировке объектов
наблюдения [83, 148, 238, 246]. Группировочные признаки подвергаются
объединению с помощью некоторой «метрики». Очень популярной и наиболее
употребительной считается евклидова метрика, которая обозначает расстояние
между векторами размерности результатов измерений той или иной
характеристики исследуемого объекта, которое эквивалентно расстоянию
между двумя объектами соответственно выбранным характеристикам.
Многие процедуры при кластеризации совершаются ступенчато, т.е. два
наиболее близких объекта объединяются и рассматриваются как один кластер.
Одним из важных вопросов при решении кластерной проблемы является выбор
необходимого числа кластеров. Часто это число определяется в процессе
разбиения множество на кластеры. В качестве альтернативы этого метода
используется метод математического программирования, который сокращает
объём вычислений и приводит к оптимальному результату.