характеризует число общих для образов
х
и
у
признаков, a Ik Ik/ I —
среднее геометрическое числа признаков которыми обладает образ х и
числа признаков которыми обладает образ у. Функция [*] есть мера на
личия общих признаков у двоичных векторов
х
и
у.
Двоичным вариантом формулы [*], который нашел широкое рас
пространение в нозологии и таксономии является так называемая ме
ра Роджерса-Танимото:
С*.?)
(*.*)+ (у. >)-(*, у)
Кроме того, известны также меры Рао, Хэмминга, Жаккарда.
Обозначения:
—
х
— число нулевых значений свойств в векторе;
—
у"
— число единичных значений свойств в векторе;
—
р(х,у)
— число совпадающих нулевых значений свойств в
векторах;
~
—
q(x,y)
— число совпадающих единичных значений свойств в
векторах;
—
г(х,у)
— число совпадающих значений свойств в векторах.
1) Рао
(х, y)=q(x,y)/n
2) Хэмминга
(х, у)=г(х,у)/п
3) Роджерса-Танимото
(х, y )=q {x ,y )/ (х "+ у " -q(x,y))
4 )Жаккарда
(х, y )=q (x ,y)/(q (x ,y)+n-r(x ,y))
В нашем случае исходное множество — это совокупность людей,
имеющих наследственные синдромы. Таким образом, элемент множе
ства — это человек. Признаки, которыми характеризуется пациент —
это симптомы. И, наконец, подмножества — это совокупности людей,
больных определенным синдромом.
В качестве исходных данных имеются список синдромов, список
симптомов, разделенных на группы, таблица, строки которой соответ
ствуют диагнозам, а столбцы — признакам. Наиболее подробно среди
симптомов даны разнообразные структурные нарушения в челюстно-
лицевой области.
Пакет программ учитывает 257 симптомов, встречающихся при
265 наследственных синдромах, имеющих проявления в челюстно- ли
цевой области. Образом каждого больного является двоичный вектор
x=(xi,
х
где
Xj
равен 1, если у пациента имеется /-й симптом и О
— в противном случае. Таким образом, пространство Л — это сово
купность двоичных векторов, соответствующих пациентам. Набор
31