Diferencia entre revisiones de «Escala Likert»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Ebergerz (discusión · contribs.)
→‎Ventajas y desventajas: Eliminando información sin referencias
Ebergerz (discusión · contribs.)
→‎Niveles de medida: agregando sección basada en la traducción de la versión en inglés
Línea 80: Línea 80:
=== Presentación visual de datos tipo Likert ===
=== Presentación visual de datos tipo Likert ===
Una parte importante del análisis y la presentación de datos es la visualización (o trazado) de datos. El tema de graficar los datos de calificación Likert (y otros) se discute extensamente en dos artículos de Robbins y Heiberger.<ref>{{Cita libro|apellidos=Robbins|nombre=N. B.|apellidos2=Heiberger|nombre2=R. M.|capítulo=Plotting Likert and Other Rating Scales|título=JSM Proceedings, Section on Survey Research Methods|fecha=2011|páginas=1058–1066|editorial=American Statistical Association|chapter-url=http://www.asasrms.org/Proceedings/y2011/Files/300784_64164.pdf}}</ref> En el primero, recomiendan el uso de lo que llaman gráficos de barras apiladas divergentes y los comparan con otros estilos de trazado. El segundo artículo describe el uso de la función de Likert en el paquete HH para R y da muchos ejemplos de su uso.<ref>{{Cita libro|apellidos=Heiberger|nombre=R. M.|apellidos2=Robbins|nombre2=N. B.|capítulo=Design of Diverging Stacked Bar Charts for Likert Scales and Other Applications|título=Journal of Statistical Software|fecha=2014|páginas=1–32|editorial=American Statistical Association|chapter-url=http://www.jstatsoft.org/v57/i05}}</ref>
Una parte importante del análisis y la presentación de datos es la visualización (o trazado) de datos. El tema de graficar los datos de calificación Likert (y otros) se discute extensamente en dos artículos de Robbins y Heiberger.<ref>{{Cita libro|apellidos=Robbins|nombre=N. B.|apellidos2=Heiberger|nombre2=R. M.|capítulo=Plotting Likert and Other Rating Scales|título=JSM Proceedings, Section on Survey Research Methods|fecha=2011|páginas=1058–1066|editorial=American Statistical Association|chapter-url=http://www.asasrms.org/Proceedings/y2011/Files/300784_64164.pdf}}</ref> En el primero, recomiendan el uso de lo que llaman gráficos de barras apiladas divergentes y los comparan con otros estilos de trazado. El segundo artículo describe el uso de la función de Likert en el paquete HH para R y da muchos ejemplos de su uso.<ref>{{Cita libro|apellidos=Heiberger|nombre=R. M.|apellidos2=Robbins|nombre2=N. B.|capítulo=Design of Diverging Stacked Bar Charts for Likert Scales and Other Applications|título=Journal of Statistical Software|fecha=2014|páginas=1–32|editorial=American Statistical Association|chapter-url=http://www.jstatsoft.org/v57/i05}}</ref>

== Niveles de medida ==
A menudo se cree que las cinco categorías de respuesta representan un [[Nivel de medida|nivel de medición]] de intervalo. Pero este solo puede ser el caso si los intervalos entre los puntos de escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) muestran que este criterio se cumple mucho mejor con una [[Escala análoga visual|escala analógica visual]].<ref>{{Cita publicación|título=Interval level measurement with visual analogue scales in Internet-based research: VAS Generator|apellidos=Reips|nombre=Ulf-Dietrich|apellidos2=Funke|nombre2=Frederik|publicación=Behavior Research Methods|volumen=40|número=3|páginas=699–704|doi=10.3758/BRM.40.3.699|pmid=18697664|año=2008}}</ref> De hecho, también pueden aparecer fenómenos que cuestionen incluso el nivel de la escala ordinal en las escalas Likert. Por ejemplo, en un conjunto de elementos {{Var|A}},&#x2009;{{Var|B}},&#x2009;{{Var|C}} clasificado con la escala de Likert, pueden aparecer relaciones circulares como {{Var|A}}&nbsp;>&nbsp;{{Var|B}}, {{Var|B}}&nbsp;>&nbsp;{{Var|C}} y {{Var|C}}&nbsp;>&nbsp;{{Var|A}}. Esto viola el axioma de transitividad para la escala ordinal.<ref>{{Cita conferencia|conferencia=The Annual Meeting of the American Educational Research Association|fecha=April 12–16, 1993}}</ref>

Las investigaciones de Labovitz y Traylor proporcionan evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de escala, los ítems de tipo Likert se comportan de forma cercana a escalas que se perciben como de intervalos iguales. Por lo tanto, estos elementos y otras escalas que aparecen en los cuestionarios son robustos ante las violaciones del supuesto de igual distancia que muchos investigadores creen que son necesarios para los procedimientos y pruebas estadísticos paramétricos.<ref>{{Cita publicación|título=Some observations on measurement and statistics|apellidos=Labovitz|nombre=S.|publicación=Social Forces|volumen=46|número=2|páginas=151–160|doi=10.2307/2574595|año=1967}}</ref><ref>{{Cita publicación|título=Ordinal and interval scaling|apellidos=Traylor|nombre=Mark|fecha=October 1983|publicación=Journal of the Market Research Society|volumen=25|número=4|páginas=297–303}}</ref>


== Referencias ==
== Referencias ==

Revisión del 15:07 1 abr 2021

Escala Likert

Cuestionario en inglés sobre el diseño de un sitio web, con respuestas en escala Likert.
Likert scale
Desarrollado por Rensis Likert
Año 1932
Información técnica
Áreas de aplicación psicología, sociología, estadística, marketing
Versiones
Versión castellana
Nombre Escala de Likert



La escala de Likert (también denominada método de evaluaciones sumarias) se denomina así por Rensis Likert, quien publicó en 1932 un informe donde describía su uso. Es una escala psicométrica comúnmente utilizada en cuestionarios y es la escala de uso más amplio en encuestas para la investigación, principalmente en ciencias sociales. Al responder a una pregunta de un cuestionario elaborado con la técnica de Likert, se especifica el nivel de acuerdo o desacuerdo con una declaración (elemento, ítem, reactivo, o también pregunta).[1]

Composición

Un ejemplo en inglés de un cuestionario sobre el diseño de un sitio web, con respuestas en escala Likert.

Una escala de Likert es la suma de las respuestas de varios ítems de Likert. Debido a que muchas escalas Likert emparejan cada elemento Likert constituyente con su propia instancia de una escala analoga visual (p. Ej., una línea horizontal, en la que el sujeto indica una respuesta haciendo un círculo o marcando cajas de verificación), a veces se hace referencia de forma errónea a un elemento individual. como si fuera o tuviera una escala, con este error creando una confusión generalizada en la literatura y el lenguaje del campo.

Un ítem de Likert es simplemente una afirmación que se le pide evaluar al encuestado dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo / desacuerdo la dimensión más comúnmente utilizada. Los artículos Likert bien diseñados exhiben tanto "simetría" como "equilibrio". Simetría significa que contienen el mismo número de posiciones positivas y negativas cuyas respectivas distancias son simétricas bilateralmente con respecto al valor "neutral" (se presente o no ese valor como una opción). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre elementos que contienen más de dos valores candidatos.[2]

El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:

  1. Totalmente en desacuerdo
  2. En desacuerdo
  3. Ni de acuerdo ni en desacuerdo
  4. De acuerdo
  5. Totalmente de acuerdo

La escala Likert es un método de valoración bipolar, que mide la respuesta positiva o negativa a una declaración. En ocasiones se utiliza una escala con un número par de puntos, donde la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. Esto a veces se denomina método de "elección forzada", ya que se elimina la opción neutral.[3]​ La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una opción verdaderamente neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de "indeciso" y "neutral" como la opción intermedia en una escala Likert de cinco puntos.[4]

Las escalas Likert pueden estar sujetas a distorsiones por varias causas. Los encuestados pueden:[5]

  • Evitar usar categorías de respuesta extremas (sesgo de tendencia central ), especialmente por el deseo de evitar que se perciba que tienen puntos de vista extremistas (un ejemplo de sesgo de deseabilidad social ). Este efecto puede aparecer al principio de una prueba debido a la expectativa de que puedan seguir preguntas sobre las que el sujeto tiene opiniones más sólidas, de modo que en las preguntas anteriores uno "deja espacio" para respuestas más sólidas más adelante en la prueba. Esta expectativa crea un sesgo que es especialmente pernicioso en el sentido de que sus efectos no son uniformes a lo largo de la prueba y no pueden corregirse mediante una simple normalización generalizada;
  • Acordar con las declaraciones presentadas ( sesgo de aquiescencia), este efecto es especialmente fuerte entre las personas que están sujetas a una cultura de institucionalización que fomenta e incentiva el afán de agradar, como los niños, las personas con discapacidades del desarrollo y los ancianos o enfermos.
  • No estar de acuerdo con las oraciones presentadas por un deseo defensivo de evitar hacer declaraciones erróneas y/o evitar las consecuencias negativas que los encuestados pueden temer que resulten de que sus respuestas se usen en su contra, especialmente si se malinterpretan y/o se sacan de contexto.
  • Proporcionar respuestas que se cree que se evaluarán como indicadoras de fortaleza o falta de debilidad / disfunción ("fingir positivismo").
  • Proporcionar respuestas que creen que se evaluarán como indicadoras de debilidad o presencia de discapacidad / patología ("fingir negatividad").
  • Tratar de retratarse a sí mismos o a su organización en una luz que ellos creen que el examinador o la sociedad consideran más favorable que sus creencias verdaderas ( sesgo de deseabilidad social, la versión intersubjetiva del objetivo de "fingir positivismo" discutido anteriormente).
  • Tratar de retratarse a sí mismos o a su organización de una manera que crean que el examinador o la sociedad consideran menos favorable / más desfavorable que sus verdaderas creencias (desafío a las normas, la versión intersubjetiva del objetivo "fingir negatividad" discutido anteriormente).

El diseño de una escala equilibrada (con un número igual de declaraciones positivas y negativas y, especialmente, un número igual de declaraciones positivas y negativas con respecto a cada posición o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en elementos positivos tiende a equilibrar la aquiescencia en elementos negativos, pero los sesgos defensivos, de tendencia central y de deseabilidad social son más problemáticos.

Puntuación y análisis

Una vez completado el cuestionario, cada ítem se puede analizar por separado o, en algunos casos, las respuestas de los ítems se pueden sumar para crear una puntuación para un grupo de ítems. Por lo tanto, las escalas Likert a menudo se denominan escalas sumativas.

Si los elementos individuales de Likert pueden considerarse como datos de nivel de intervalo, o si deben tratarse como datos ordenados-categóricos es objeto de un considerable desacuerdo en la literatura, con fuertes convicciones sobre cuáles son los métodos más aplicables. Este desacuerdo se remonta, en muchos aspectos, a la medida en que los elementos de Likert se interpretan como datos ordinales.[6][7]

Hay dos consideraciones principales en esta discusión: Primero, las escalas Likert son arbitrarias. El valor asignado a un ítem de Likert no tiene una base numérica objetiva, ya sea en términos de teoría de medida o valor (a partir de la cual se puede determinar una métrica de distancia). El valor asignado a cada elemento de Likert lo determina simplemente el investigador que diseña la encuesta, quien toma la decisión en función del nivel de detalle deseado. Sin embargo, por convención, a los elementos de Likert se les suele asignar valores enteros positivos progresivos. Las escalas de Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 las más comunes. Además, esta estructura progresiva de la escala es tal que cada elemento de Likert sucesivo se trata como si indicara una respuesta "mejor" que el valor anterior. (Esto puede diferir en los casos en los que se necesite un orden inverso de la escala Likert).[8]

El segundo punto, y posiblemente más importante, es si la "distancia" entre cada categoría de elementos sucesivos es equivalente. Esto tradicionalmente es inferido. Por ejemplo, en el ítem Likert de cinco puntos anterior, la inferencia es que la 'distancia' entre las categorías 1 y 2 es la misma que entre las categorías 3 y 4. En términos de buenas prácticas de investigación, es importante una presentación equidistante por parte del investigador; de lo contrario, puede producirse un sesgo en el análisis. Por ejemplo, es poco probable que un elemento Likert de cuatro puntos con las categorías "Pobre", "Promedio", "Bueno" y "Muy bueno" tenga todas las categorías equidistantes, ya que solo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otro lado, incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no lo interprete como tal.[8]

Una buena escala Likert, como la anterior, presentará una simetría de categorías alrededor de un punto medio con calificadores lingüísticos claramente definidos. En tal escala simétrica, los atributos equidistantes normalmente se observarán más claramente o, al menos, se inferirán. Es cuando una escala Likert es simétrica y equidistante que se comportará más como una medición de nivel de intervalo. Entonces, si bien una escala Likert es de hecho ordinal, si está bien presentada, puede aproximarse a una medición de nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara solo como una escala ordinal, se podría perder información valiosa si la "distancia" entre los elementos de Likert no estuviera disponible para su consideración. La idea importante aquí es que el tipo de análisis apropiado depende de cómo se haya presentado la escala Likert.[8]

Las nociones de tendencia central suelen aplicarse a nivel de ítem, es decir, las respuestas suelen mostrar una distribución cuasi normal. La validez de tales medidas depende de la naturaleza del intervalo subyacente de la escala. Si se asume una naturaleza de intervalo para una comparación de dos grupos, las muestras-t pareadas no son inapropiadas.[9]​ Si se van a realizar pruebas no paramétricas, la modificación de Platt (1959)[10]​ a la prueba de rangos con signos de Wilcoxon se recomienda sobre la prueba estándar de rangos con signos de Wilcoxon.

Las respuestas a varias preguntas Likert se pueden sumar siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. Si las respuestas sumadas cumplen con estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza. Los puntos de corte típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma.[11][7]

Para modelar respuestas tipo Likert binarias directamente, se las puede representar en forma binomial sumando las respuestas de acuerdo y en desacuerdo por separado. La prueba chi-cuadrado, la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos comunes que se utilizan después de esta transformación. Pruebas no paramétricas como la prueba de chi-cuadrado, la prueba de Mann-Whitney, la prueba de rangos con signo de Wilcoxon o la prueba de Kruskal-Wallis se utilizan a menudo en el análisis de datos en escala Likert.[12]

Alternativamente, las respuestas de la escala de Likert se pueden analizar con un modelo probit ordenado, preservando el orden de las respuestas sin la suposición de una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen cuando se tratan las calificaciones ordenadas como medidas de nivel de intervalo.[13]

Presentación visual de datos tipo Likert

Una parte importante del análisis y la presentación de datos es la visualización (o trazado) de datos. El tema de graficar los datos de calificación Likert (y otros) se discute extensamente en dos artículos de Robbins y Heiberger.[14]​ En el primero, recomiendan el uso de lo que llaman gráficos de barras apiladas divergentes y los comparan con otros estilos de trazado. El segundo artículo describe el uso de la función de Likert en el paquete HH para R y da muchos ejemplos de su uso.[15]

Niveles de medida

A menudo se cree que las cinco categorías de respuesta representan un nivel de medición de intervalo. Pero este solo puede ser el caso si los intervalos entre los puntos de escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) muestran que este criterio se cumple mucho mejor con una escala analógica visual.[16]​ De hecho, también pueden aparecer fenómenos que cuestionen incluso el nivel de la escala ordinal en las escalas Likert. Por ejemplo, en un conjunto de elementos A, B, C clasificado con la escala de Likert, pueden aparecer relaciones circulares como A > B, B > C y C > A. Esto viola el axioma de transitividad para la escala ordinal.[17]

Las investigaciones de Labovitz y Traylor proporcionan evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de escala, los ítems de tipo Likert se comportan de forma cercana a escalas que se perciben como de intervalos iguales. Por lo tanto, estos elementos y otras escalas que aparecen en los cuestionarios son robustos ante las violaciones del supuesto de igual distancia que muchos investigadores creen que son necesarios para los procedimientos y pruebas estadísticos paramétricos.[18][19]

Referencias

  1. «What is a Likert Scale and How Do You Pronounce Likert?». core.ecu.edu. Consultado el 6 de noviembre de 2019. 
  2. Burns, Alvin; Burns, Ronald (2008). Basic Marketing Research (Second edición). New Jersey: Pearson Education. pp. 250. ISBN 978-0-13-205958-9. 
  3. Allen, Elaine; Seaman, Christopher (2007). «Likert Scales and Data Analyses». Quality Progress: 64-65. 
  4. Armstrong, Robert (1987). «The midpoint on a Five-Point Likert-Type Scale». Perceptual and Motor Skills 64 (2): 359-362. doi:10.2466/pms.1987.64.2.359. 
  5. Allen, Elaine; Seaman, Christopher (2007). «Likert Scales and Data Analyses». Quality Progress: 64-65. 
  6. Jamieson, Susan (2004). «Likert Scales: How to (Ab)use Them». Medical Education 38 (12): 1217-1218. 
  7. a b Norman, Geoff (2010). «Likert scales, levels of measurement and the “laws” of statistics». Advances in Health Science Education 15 (5): 625-632.  Error en la cita: Etiqueta <ref> no válida; el nombre «NormanGeoff» está definido varias veces con contenidos diferentes
  8. a b c «Likert Scale Explanation - With an Interactive Example». SurveyKing. Consultado el 13 August 2017. 
  9. Derrick, B; White, P (2017). «Comparing Two Samples from an Individual Likert Question». International Journal of Mathematics and Statistics 18 (3): 1-13. 
  10. Pratt, J. (1959). «Remarks on zeros and ties in the Wilcoxon signed rank procedures». Journal of the American Statistical Association 54 (287): 655-667. doi:10.1080/01621459.1959.10501526. 
  11. Carifio, James; Perla, Rocco J. (2007). «Ten Common Misunderstandings, Misconceptions, Persistent Myths and Urban Legends about Likert Scales and Likert Response Formats and their Antidotes». Journal of Social Sciences 3 (3): 106-116. doi:10.3844/jssp.2007.106.116. 
  12. Mogey, Nora (March 25, 1999). «So You Want to Use a Likert Scale?». Learning Technology Dissemination Initiative. Heriot-Watt University. Consultado el April 30, 2009. 
  13. Liddell, T.; Kruschke, J. (2018). «Analyzing ordinal data with metric models: What could possibly go wrong?». Journal of Experimental Social Psychology 79: 328-348. doi:10.1016/j.jesp.2018.08.009. 
  14. Robbins, N. B.; Heiberger, R. M. (2011). «Plotting Likert and Other Rating Scales». JSM Proceedings, Section on Survey Research Methods. American Statistical Association. pp. 1058-1066. 
  15. Heiberger, R. M.; Robbins, N. B. (2014). «Design of Diverging Stacked Bar Charts for Likert Scales and Other Applications». Journal of Statistical Software. American Statistical Association. pp. 1-32. 
  16. Reips, Ulf-Dietrich; Funke, Frederik (2008). «Interval level measurement with visual analogue scales in Internet-based research: VAS Generator». Behavior Research Methods 40 (3): 699-704. PMID 18697664. doi:10.3758/BRM.40.3.699. 
  17. . The Annual Meeting of the American Educational Research Association. April 12–16, 1993. 
  18. Labovitz, S. (1967). «Some observations on measurement and statistics». Social Forces 46 (2): 151-160. doi:10.2307/2574595. 
  19. Traylor, Mark (October 1983). «Ordinal and interval scaling». Journal of the Market Research Society 25 (4): 297-303. 

Bibliografía

  • Sánchez, F. y otros (1993). Psicología social. Madrid: McGraw-Hill.