¿Qué hace que una prueba de inteligencia sea válida? Mantén la curiosidad y sigue aprendiendo

Una prueba válida mide lo que pretende (reclama) medir.

Por ejemplo, una báscula de baño es una medida válida de peso. No es una medida válida de la frecuencia del pulso.

Una prueba válida también es confiable, lo que significa que cada vez que se administra, obtiene aproximadamente la misma puntuación. (El coeficiente de confiabilidad de la prueba WAIS IQ es más / menos 5 puntos). Eso significa que si obtiene un puntaje de 100, la próxima vez que lo tome, su puntaje estará dentro del rango de 95-105.

Maneras en que se valida una prueba.

Validez de la cara: en la cara de la prueba, usted entiende que es válida, por ejemplo, el uso de una vara de medir para medir la longitud, el uso de un cronómetro para medir la velocidad. Nadie discutirá con usted que su instrumento de medición es inapropiado.
Validez del contenido – por ejemplo. un examen final Esto lo determina una junta de expertos que aceptan que el material de este examen puede evaluar con precisión su capacidad en ese tema. Si se presenta a un examen de matemáticas y encuentra preguntas en botánica, puede cuestionar la validez del contenido del examen.
Validez concurrente . Tiene una prueba que puede medir una característica que está presente al mismo tiempo, por ejemplo, una prueba de escritura como medida de la velocidad y la precisión de la escritura.

Una prueba de embarazo precoz ( EPT) también tendría que demostrar la validez concurrente.

La condición del embarazo ya existe o no existe. Si realiza una prueba de embarazo una hora después de la concepción, será negativo ya que los cambios hormonales son demasiado pequeños para ser detectados. Después de una semana, será positivo. La compañía EPT debe realizar pruebas para determinar el retraso preciso después de la concepción, cuando la prueba recoge alrededor del 99 al 100% de los embarazos.

La etiqueta de la caja que contiene el EPT proporcionará la información de validez en términos de duración y porcentaje, por ejemplo, “En el día 3, esta prueba detecta el 60% de todos los embarazos. En el día 4, se detectan el 80% de los embarazos, etc.

Si se puede diagnosticar el 100% de todos los embarazos para el día 5, entonces la prueba puede afirmar que tiene validez concurrente solo después de 5 días desde la concepción. De lo contrario, tiene una tasa del 20% de falsos negativos en el Día 4

(Por supuesto, es posible que alguien tenga un resultado positivo en el día 5 pero no en el día 20, ya que muchos embarazos se abortan espontáneamente.

Una prueba que requiere que el usuario espere una larga duración para obtener los resultados se vende por menos dinero que una que puede diagnosticar el embarazo en un día. Esta prueba costosa se usa en las salas de emergencia de los hospitales, de modo que si una mujer inconsciente necesita una radiografía pélvica, Primero debes determinar que ella no está embarazada. Dado que no está disponible para ser interrogada, se debe utilizar la prueba más sensible que existe para evitar daños al feto.

4. Validez predictiva . Usted da una prueba (por ejemplo, la prueba SAT) a todos y NO la use como criterio para determinar la admisión a la universidad. En su lugar, continúa admitiendo o rechazando solicitantes utilizando sus criterios habituales como si la prueba SAT no existiera.

Después de 4 años, observa toda la puntuación del SAT en relación con el GPA final. Si descubre que todas las personas con un puntaje en el SAT por encima de un cierto valor pueden terminar 4 años de estudios universitarios con un GPA superior a 3.0, Y que ninguna persona con un puntaje en el SAT por debajo de cierto valor puede completar ni un año de estudios universitarios, luego, puede demostrar que la prueba SAT tiene validez predictiva para el éxito universitario.

En el proceso de validación de una prueba como el SAT, una vez que se cuenta con los datos finales (con respecto a quién se graduó y quién no), los responsables de las pruebas realizan un análisis pregunta por pregunta para eliminar cualquier pregunta que no esté relacionada con el resultado.

5. CONSTRUCCIÓN DE VIGENCIA . Esta forma de validez implica un salto teórico, ya que estás midiendo algo intangible como el “sentido del humor”, la “represión”, la “inteligencia”, la “creatividad”, etc. Primero debes encontrar alguna forma de medir esta entidad hipotética.

Luego hace una predicción sobre los puntajes de las pruebas usando su batería específica; por ejemplo, si se trata de una prueba de CI, aquellos que obtengan una puntuación alta en su prueba estarán en la parte superior de la clase y los que obtengan una puntuación baja tendrán dificultades. Si su prueba realmente tiene éxito en predecir resultados, puede llamarla válida. . (Tenga en cuenta que el coeficiente intelectual se desarrolló inicialmente para determinar qué niños, de un grupo de niños retrasados, podrían ser educados y cuáles no. Pruebas a los que están en el extremo superior llegaron más tarde)

Las preguntas específicas no importan. Lo único que importa es si esta pregunta puede predecir la capacidad académica. Entonces, por ejemplo, si responde “sí” a una pregunta como “¿Le pica el hombro izquierdo a las 4 de la tarde?” Predijo el rendimiento escolar, se incluiría en el examen de inteligencia incluso aunque no parece estar relacionado con la inteligencia. (Por supuesto, no está relacionado con el rendimiento escolar y no está en la prueba)

Entonces, cuando las personas se quejan de que el contenido de la prueba de CI no tiene nada que ver con la inteligencia, están equivocados. En una prueba de CI válida, solo se conservan aquellos elementos que están relacionados con el resultado.

Una vez que se valida una prueba, el creador de la prueba incluye datos sobre ella, como el coeficiente de validez, que informa al usuario (con un número que varía de 0.0 a 1.0) qué tan bien se realiza la prueba para medir con precisión la entidad para la cual fue diseñada. En el caso de la prueba WAIS IQ, también se proporciona información de validez para las diferentes subpruebas. Por ejemplo, el mejor predictor general si la inteligencia es la puntuación en la subprueba de vocabulario. Una subprueba con menos validez predictiva es el intervalo de dígitos (en el que se deben recitar hacia adelante y hacia atrás conjuntos de números cada vez más largos). Sin embargo, el bajo rendimiento en el intervalo de dígitos puede sugerir ADD, por lo que es un componente útil de las pruebas.

En las instrucciones se incluye información sobre qué subpruebas se deben realizar primero si se debe realizar una evaluación en un tiempo limitado, para asegurarse de que se incluyan los predictores más fuertes.

Muchas pruebas en Internet que “afirman” medir el coeficiente intelectual o la personalidad nunca se han validado. Toma el examen en línea (bajo condiciones no estandarizadas, por ejemplo, habla por teléfono entre preguntas, dedica una hora a una pregunta, realiza el mismo examen varias veces con diferentes nombres de usuario, etc.) y se le asigna un coeficiente intelectual según la cantidad de Las respuestas fueron correctas. Pero estas pruebas NO se han validado. . La única forma de validar esta nueva prueba de Internet sería TAMBIÉN proporcionarle la prueba de CI estándar y ver qué tan bien esta nueva prueba de Internet (administrada en condiciones controladas) predice su puntuación de CI convencional.

Esto es caro y no está hecho. Entonces, si tomas una prueba de IQ en línea, es solo por diversión. No asignes significado a la puntuación.

cociente de inteligenciaexámenes y pruebasInteligenciaPruebas estandarizadas