47
расстояния. Выбор функций расстояния в качестве инструмента
классификации является естественным следствием того обстоятельства,
что наиболее очевидный способ введения меры сходства для векторов
образов – определение их близости. В этой методике класс задается одним
или несколькими образами называемыми эталонами.
Образы любого из рассматриваемых классов проявляют тенденцию
к тесной группировке вокруг некоторого образа, являющегося
типичным, или репрезентативным, для соответствующего класса.
m
классов
представлены с помощью эталонных образов
y
1
,
y
2
, … ,
y
m
. Евклидово
расстояние между произвольным вектором образа x и
i
-м эталоном
определяется следующим выражением:
n
j
ij
j
i
i
xy x
yxd d
1
2
,
Классификатор, построенный по принципу минимума расстояния,
вычисляет расстояние, отделяющее классифицируемый образ
x
от эталона
каждого класса, и зачисляет этот образ в класс, оказавшийся ближайшим
к нему. Другими словами,
i
Ax
, если
j
i
d d
j=1,m j
i.
Случаи равенства
расстояния разрешаются произвольным образом.
В ряде случаев более удобно ввести меру сходства
yx
yx
yxd
,
,
[*],
представляющую собой косинус угла образованного векторами
x
и
y
и
достигающую максимума, когда их направления совпадают. Этой
мерой сходства удобно пользоваться в тех случаях, когда классы
обнаруживают тенденцию располагаться вдоль радиальных осей.
Когда рассматриваются двоичные образы, и их элементы принимают
значения из множества {0, 1}, то функции сходства можно дать
не геометрическую интерпретацию. Если
x
j
=1, то считается, что двоичный
образ
x
обладает
j
-м признаком. В таком случае член (
x,y
) просто характеризует
число общих для образов
x
и
y
признаков, а
yx
- среднее геометрическое
числа признаков которыми обладает образ
x
и числа признаков которыми