Emparejamiento óptimo

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

El emparejamiento óptimo es un método de análisis secuencial utilizado en ciencias sociales, para evaluar la similitud de arreglos ordenados de símbolos que normalmente representan una secuencia temporal ordenada de los estados socioeconómicos dos individuos han experimentado. Una vez que tales distancias han sido calculadas para un conjunto de observaciones (por ejemplo, individuos de una cohorte) herramientas clásicas (tales como el Algoritmo de agrupamiento) pueden ser utilizados. El método fue adaptado a las ciencias sociales[1] a partir de una técnica introducida originalmente para estudiar la biología molecular. El emparejamiento óptimo utiliza el Algoritmo Needleman-Wunsch.

Algoritmo[editar]

Sea S = (s_1, s_2, s_3, \ldots s_T) una secuencia de estados s_i que pertenecen a un conjunto finito de estados posibles. Denotemos {\mathbf S} el espacio de secuencias, es decir, el conjunto de todas las posibles secuencias de estados. Los algoritmos de correspondencia óptimos funcionan mediante la definición de operador simples álgebras que manipulan secuencias, es decir, un conjunto de operadores a_i: {\mathbf S} \rightarrow {\mathbf S}. En el enfoque más simple, se utiliza un conjunto compuesto de solamente tres operaciones básicas para transformar secuencias:

  • un estado s se inserta en la secuencia a^{\rm Ins}_{s'} (s_1, s_2, s_3, \ldots s_T) = (s_1, s_2, s_3, \ldots, s', \ldots s_T)
  • un estado es borrado de la secuencia a^{\rm Del}_{s_2} (s_1, s_2, s_3, \ldots s_T) = (s_1, s_3, \ldots  s_T) y
  • un estado s_1 es reemplazado (substituted) por un estado s'_1, a^{\rm Sub}_{s_1,s'_1} (s_1, s_2, s_3, \ldots s_T) = (s'_1, s_2, s_3, \ldots s_T).

Imagínese ahora que un coste c(a_i) \in {\mathbf R}^+_0 se asocia a cada operador. Dadas dos secuencias S_1 and S_2, La idea es medir el costo de obtener S_2 de S_1 utilizando los operadores del álgebra. Dejar A={a_1, a_2, \ldots a_n} ser una secuencia de operadores de manera que la aplicación de todos los operadores de esta secuencia La a la primera secuencia S_1 da la segunda secuencia S_2 : S_2 = a_1 \circ a_2 \circ \ldots \circ a_{n} (S_1) donde a_1 \circ a_2 denota el operador compuesto. A este conjunto asociamos el costo c (A) = \ sum_ {i = 1} ^ n c (a_i) , Que representa el costo total de la transformación. Hay que tener en cuenta en este punto que podría existir diferentes tales secuencias La que transforman S_1 en S_2; Una elección razonable es para seleccionar el más barato de tales secuencias. Por la presente instamos a distancia
 :
d(S_1,S_2)= \min_A \left \{ c(A)~{\rm such~that}~S_2 = A (S_1)  \right \} 
es decir, el coste del conjunto menos costosa de las transformaciones que se convierten S_1 en S_2 . Tenga en cuenta que d (S_1, S_2) es por definición no negativo, ya que es la suma de los costes de positivos, y trivialmente d (S_1, S_2) = 0 si y sólo si S_1 = S_2 , Es decir, no hay ningún costo. La función de distancia es simétrica si los costos de inserción y supresión son iguales c (a ^ {\ rm Ins}) = c (a ^ {\ rm Del}) , El término costo indel lo general se refiere a los gastos comunes de inserción y supresión.

Teniendo en cuenta un conjunto compuesto de sólo las tres operaciones básicas descritas anteriormente, esta medida proximidad satisface la desigualdad triangular. transitividad sin embargo, depende de la definición del conjunto de las operaciones elementales.

Crítica[editar]

Aunque las técnicas de juego óptimas son ampliamente utilizadas en sociología y la demografía, estas técnicas también tienen sus defectos. Como se ha señalado por varios autores (por ejemplo L. L. Wu[2] ), el principal problema en la aplicación de emparejamiento óptimo es definir adecuadamente los costos c(a_i).

Emparejamiento óptimo en el modelado causal[editar]

El emparejamiento óptimo es también un término usado en el modelado estadístico de efectos causales. En este contexto se refiere a la combinación "casos" con "controles", y es completamente independiente del sentido de la secuencia analítica.


Referencias[editar]