Matriz de distancias

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En matemática, una matriz de distancias es una matriz cuyos elementos representan las distancias entre los puntos, tomados por pares, de un conjunto. Se trata, por lo tanto, de una matriz simétrica de tamaño NxN (dado un conjunto de N puntos en el espacio euclídeo) conteniendo números reales no negativos como elementos. El número N de pares de puntos, (N-1)/2, es el número de elementos independientes en la matriz de distancias.

Las matrices de distancias están relacionadas con las matrices de adyacencia, diferenciándose en que las últimas sólo informan sobre qué vértices están conectados, pero no especifican costes o distancias entre los vértices; además, cada elemento de una matriz de distancias es más pequeño cuanto más cercanos se encuentren los puntos, mientras que vértices cercanos (conectados) producen elementos mayores en una matriz de adyacencia.

Supóngase, por ejemplo, el siguiente conjunto de datos a analizar, donde la distancia euclidiana entre píxeles es la métrica de la distancia:

Datos en bruto.

La matriz de distancias podría ser:

a b c d e f
a 0 184 222 177 216 231
b 184 0 45 123 128 200
c 222 45 0 129 121 203
d 177 123 129 0 46 83
e 216 128 121 46 0 83
f 231 200 203 83 83 0

Estos datos pueden ser vistos de forma gráfica como un mapa de calor. En la siguiente imagen, el negro denota una distancia de 0, representando el blanco la distancia máxima:

Vista gráfica.

En bioinformática se usan las matrices de distancias para representan estructuras de proteínas de una forma independiente de las coordenadas, además de como distancias de emparejamiento entre dos secuencias. Son usadas en alineamientos tanto estructurales como de secuencias, y en la determinación de las estructuras de las proteínas en RMN (resonancia magnética nuclear) o cristalografía de rayos X.

Algunas veces es más convenientes expresar la información como una matriz de sustitución.

Véase también[editar]