В данной работе выполнен обзор мер сходства между вершинами графа. Описаны меры, основанные на расстоянии, и меры структурной эквивалентности. Показано, что большинство из них вырождаются, если их непосредственно применять к узлам дерева. Предложена скорректированная мера сходства, основанная на расстоянии, а также новый метод представления узлов дерева бинарными векторами, основанный на использовании матрицы предков. Показано, что применение обычных мер сходства к этому представлению даёт желаемые нетривиальные результаты.
In this paper, a survey of similarity measures between vertices of a graph is presented. Distance-based and structural equivalence measures are described. It is demonstrated that most of them degenerate if applied directly to the tree nodes. Adjusted path-based similarity measure is proposed as well as a new method for representing tree nodes as binary vectors that is based on using of an ancestor matrix. It is shown that application of ordinary similarity measures to this representation gives desired non-trivial results.
Ключевые слова: мера сходства, расстояние на узлах дерева, структурная эквивалентность, матрица предков.
Keywords: similarity measure, distance on tree nodes, structural equivalence, ancestor matrix.