Validez: ¿qué significa una prueba?

Repuesta de: La respuesta de Ryan Farmer a ¿Las pruebas de coeficiente intelectual dan resultados correctos?

Las pruebas psicológicas, al igual que las pruebas de inteligencia, se evalúan en dos grandes dimensiones: confiabilidad y validez. La confiabilidad es lo consistente que es una prueba, mientras que la validez es lo precisa que es una prueba.

Las pruebas no pueden ser válidas (es decir, no se puede decir que midan lo que pretenden medir) hasta que sean confiables por primera vez. Los objetivos anteriores dan una buena idea de cómo funciona esto. Tanto la confiabilidad como la validez se representan con un rango entre .00 y 1.00, donde 1.00 se considera una precisión “perfecta”. Ninguna prueba en existencia, incluso aquellas que damos por sentado como escalas para el peso, es perfecta.

Hay un montón de diferentes tipos de validez. Algunos incluyen:

  1. Validez de la cara: la prueba parece medir lo que pretende medir
  2. Validez de construcción: el grado en que una prueba mide lo que pretende significar
  3. Criterio de validez (también conocido como validez concreta): el grado en que el puntaje de la prueba está relacionado con alguna medida de resultado (por ejemplo, ¿SAT predice el éxito universitario?)
  4. Validez divergente: el grado en que la prueba NO mide construcciones similares pero diferentes

La “validez” de una prueba significa que mide lo que se dice que mide.

Una báscula de baño, por ejemplo, es una medida de peso “válida” si mide su peso con precisión. Un termómetro es una medida de temperatura “válida” si le indica la temperatura correcta.

En psicología, estamos muy interesados ​​en la “validez” porque estamos midiendo cosas que son difíciles de medir y no siempre se miden en unidades estándar, como los metros o el volumen.

Estamos midiendo conceptos abstractos, como “depresión” o “adicción”, o estamos midiendo comportamientos, como “mentir” o “ser agresivo”. Tal vez estamos midiendo cosas que son difíciles de ver, como el disparo o el dolor de las células cerebrales. Una gran cantidad de energía, tiempo, debate, análisis y supervisión respaldan todas las medidas estándar en psicología si son aceptadas por el campo como un todo en la búsqueda de una buena validez.

Hay muchas “amenazas” a la validez. Para nombrar algunos: confiabilidad test-retest (cuán precisa es una prueba para medir algo si se usa más de una vez); error estándar (la cantidad de tonterías sin medir en el entorno es responsable de los hallazgos); historial (es la prueba todavía válida durante un período de años, o con una generación diferente); selección (son las personas que fueron investigadas lo suficientemente similares a las personas en las que se usa la prueba en el público en general). Hay varios otros.

¿Quieres decir “cómo significa una medida de prueba?”?

Generalmente por sigma (valores) div n (valores), que produce la media aritmética normalmente indicada por la letra griega mu.

Hay otros medios distintos a la media aritmética: por ejemplo, la media armónica, que es aplicable a las tasas. También hay una media geométrica, y probablemente un montón de otros.