¿Qué hace que una prueba de inteligencia sea válida?

Una prueba válida mide lo que pretende (reclama) medir.

Por ejemplo, una báscula de baño es una medida válida de peso. No es una medida válida de la frecuencia del pulso.

Una prueba válida también es confiable, lo que significa que cada vez que se administra, obtiene aproximadamente la misma puntuación. (El coeficiente de confiabilidad de la prueba WAIS IQ es más / menos 5 puntos). Eso significa que si obtiene un puntaje de 100, la próxima vez que lo tome, su puntaje estará dentro del rango de 95-105.

Maneras en que se valida una prueba.

  1. Validez de la cara: en la cara de la prueba, usted entiende que es válida, por ejemplo, el uso de una vara de medir para medir la longitud, el uso de un cronómetro para medir la velocidad. Nadie discutirá con usted que su instrumento de medición es inapropiado.
  2. Validez del contenido – por ejemplo. un examen final Esto lo determina una junta de expertos que aceptan que el material de este examen puede evaluar con precisión su capacidad en ese tema. Si se presenta a un examen de matemáticas y encuentra preguntas en botánica, puede cuestionar la validez del contenido del examen.
  3. Validez concurrente . Tiene una prueba que puede medir una característica que está presente al mismo tiempo, por ejemplo, una prueba de escritura como medida de la velocidad y la precisión de la escritura.

Una prueba de embarazo precoz ( EPT) también tendría que demostrar la validez concurrente.

La condición del embarazo ya existe o no existe. Si realiza una prueba de embarazo una hora después de la concepción, será negativo ya que los cambios hormonales son demasiado pequeños para ser detectados. Después de una semana, será positivo. La compañía EPT debe realizar pruebas para determinar el retraso preciso después de la concepción, cuando la prueba recoge alrededor del 99 al 100% de los embarazos.

La etiqueta de la caja que contiene el EPT proporcionará la información de validez en términos de duración y porcentaje, por ejemplo, “En el día 3, esta prueba detecta el 60% de todos los embarazos. En el día 4, se detectan el 80% de los embarazos, etc.

Si se puede diagnosticar el 100% de todos los embarazos para el día 5, entonces la prueba puede afirmar que tiene validez concurrente solo después de 5 días desde la concepción. De lo contrario, tiene una tasa del 20% de falsos negativos en el Día 4

(Por supuesto, es posible que alguien tenga un resultado positivo en el día 5 pero no en el día 20, ya que muchos embarazos se abortan espontáneamente.

Una prueba que requiere que el usuario espere una larga duración para obtener los resultados se vende por menos dinero que una que puede diagnosticar el embarazo en un día. Esta prueba costosa se usa en las salas de emergencia de los hospitales, de modo que si una mujer inconsciente necesita una radiografía pélvica, Primero debes determinar que ella no está embarazada. Dado que no está disponible para ser interrogada, se debe utilizar la prueba más sensible que existe para evitar daños al feto.

4. Validez predictiva . Usted da una prueba (por ejemplo, la prueba SAT) a todos y NO la use como criterio para determinar la admisión a la universidad. En su lugar, continúa admitiendo o rechazando solicitantes utilizando sus criterios habituales como si la prueba SAT no existiera.

Después de 4 años, observa toda la puntuación del SAT en relación con el GPA final. Si descubre que todas las personas con un puntaje en el SAT por encima de un cierto valor pueden terminar 4 años de estudios universitarios con un GPA superior a 3.0, Y que ninguna persona con un puntaje en el SAT por debajo de cierto valor puede completar ni un año de estudios universitarios, luego, puede demostrar que la prueba SAT tiene validez predictiva para el éxito universitario.

En el proceso de validación de una prueba como el SAT, una vez que se cuenta con los datos finales (con respecto a quién se graduó y quién no), los responsables de las pruebas realizan un análisis pregunta por pregunta para eliminar cualquier pregunta que no esté relacionada con el resultado.

5. CONSTRUCCIÓN DE VIGENCIA . Esta forma de validez implica un salto teórico, ya que estás midiendo algo intangible como el “sentido del humor”, la “represión”, la “inteligencia”, la “creatividad”, etc. Primero debes encontrar alguna forma de medir esta entidad hipotética.

Luego hace una predicción sobre los puntajes de las pruebas usando su batería específica; por ejemplo, si se trata de una prueba de CI, aquellos que obtengan una puntuación alta en su prueba estarán en la parte superior de la clase y los que obtengan una puntuación baja tendrán dificultades. Si su prueba realmente tiene éxito en predecir resultados, puede llamarla válida. . (Tenga en cuenta que el coeficiente intelectual se desarrolló inicialmente para determinar qué niños, de un grupo de niños retrasados, podrían ser educados y cuáles no. Pruebas a los que están en el extremo superior llegaron más tarde)

Las preguntas específicas no importan. Lo único que importa es si esta pregunta puede predecir la capacidad académica. Entonces, por ejemplo, si responde “sí” a una pregunta como “¿Le pica el hombro izquierdo a las 4 de la tarde?” Predijo el rendimiento escolar, se incluiría en el examen de inteligencia incluso aunque no parece estar relacionado con la inteligencia. (Por supuesto, no está relacionado con el rendimiento escolar y no está en la prueba)

Entonces, cuando las personas se quejan de que el contenido de la prueba de CI no tiene nada que ver con la inteligencia, están equivocados. En una prueba de CI válida, solo se conservan aquellos elementos que están relacionados con el resultado.

Una vez que se valida una prueba, el creador de la prueba incluye datos sobre ella, como el coeficiente de validez, que informa al usuario (con un número que varía de 0.0 a 1.0) qué tan bien se realiza la prueba para medir con precisión la entidad para la cual fue diseñada. En el caso de la prueba WAIS IQ, también se proporciona información de validez para las diferentes subpruebas. Por ejemplo, el mejor predictor general si la inteligencia es la puntuación en la subprueba de vocabulario. Una subprueba con menos validez predictiva es el intervalo de dígitos (en el que se deben recitar hacia adelante y hacia atrás conjuntos de números cada vez más largos). Sin embargo, el bajo rendimiento en el intervalo de dígitos puede sugerir ADD, por lo que es un componente útil de las pruebas.

En las instrucciones se incluye información sobre qué subpruebas se deben realizar primero si se debe realizar una evaluación en un tiempo limitado, para asegurarse de que se incluyan los predictores más fuertes.

Muchas pruebas en Internet que “afirman” medir el coeficiente intelectual o la personalidad nunca se han validado. Toma el examen en línea (bajo condiciones no estandarizadas, por ejemplo, habla por teléfono entre preguntas, dedica una hora a una pregunta, realiza el mismo examen varias veces con diferentes nombres de usuario, etc.) y se le asigna un coeficiente intelectual según la cantidad de Las respuestas fueron correctas. Pero estas pruebas NO se han validado. . La única forma de validar esta nueva prueba de Internet sería TAMBIÉN proporcionarle la prueba de CI estándar y ver qué tan bien esta nueva prueba de Internet (administrada en condiciones controladas) predice su puntuación de CI convencional.

Esto es caro y no está hecho. Entonces, si tomas una prueba de IQ en línea, es solo por diversión. No asignes significado a la puntuación.

En primer lugar, válido tiene múltiples definiciones. Busqué la definición de Webster y encontré cuatro de ellas; Ignoraré los significados legales y biológicos y me concentraré en:

2. bien fundamentado o justificable

3. apropiado al final a la vista

Si bien, personalmente, las personas colocan una gran cantidad de acciones en la puntuación, me parece que el coeficiente intelectual juega un papel menos importante a medida que se envejece. Algunos sistemas escolares utilizan pruebas de CI para ayudarlos a asignar recursos y determinar la entrada en programas para estudiantes dotados y talentosos. Muchas personas podrían objetar esto y preferirían una métrica más personalizada. Sin embargo, usar una métrica objetiva acordada incluso si tiene fallas inherentes se considera mejor que abrirla a los prejuicios de los guardianes. Teniendo en cuenta lo que he visto de otros padres de escuela primaria, puedo entender totalmente por qué los administradores escolares confían en la prueba. Entonces, aquí se usa válido en la definición # 2.

En la edad adulta, muy pocas organizaciones le piden a un individuo su coeficiente intelectual. Las universidades, las escuelas de posgrado y los empleadores no los solicitan. De hecho, si se ofrecieran, me sorprendería que se vieran favorablemente. ¿Por qué? Es debido a la definición # 3. Si estoy buscando un modelador de primera clase, IQ me revela muy poco. Lo que más pesaría es una recomendación de otro profesional superior que respeto. Alguien con un coeficiente intelectual más alto podría no necesitar mucho tiempo para ser acelerado, pero, si no son buenos y no tienen experiencia en estructurar problemas, entonces pasaré mucho más tiempo en la parte de atrás. Del mismo modo, las universidades deben sopesar una serie de factores al considerar la admisión. En última instancia, están buscando postulantes que se gradúen y enriquezcan el ambiente académico de sus compañeros y personal más amplio.

Entonces, ¿dónde están las excepciones a la regla? MENSA es una excepción. Otro curiosamente son los policías. En el año 2000, el Tribunal de Apelaciones del 2º Circuito de los EE. UU. En Nueva York confirmó la decisión de un tribunal inferior de que la ciudad no discriminaba a Robert Jordan porque se aplicaban los mismos estándares a todos los que tomaron la prueba [IQ]. En este caso particular, solo se consideraron las puntuaciones entre 20 y 27 puntos. Jordan obtuvo un 33, el equivalente de IQ de 125, y fue, por lo tanto, rechazado. La razón dada por los defensores en el caso es que la capacitación es muy costosa, y las personas con mayor inteligencia se aburrirán del trabajo policial y se irán después de un año o dos. Sé que los militares utilizan diferentes procedimientos de evaluación. Recibí un comentario útil de Álvaro Neira que dijo que el ejército tiene un corte más bajo de 83 IQ. La fuente que dio fue de un profesor Jordan Peterson.

More Interesting

¿Debemos hacer el IB o el CBSE? ¿Es conveniente obtener una calificación SAT para obtener un puesto en una de las mejores universidades de ingeniería de los EE. UU. O es conveniente obtener un asiento en un IIT?

¿Qué posibilidades tengo de ingresar a una universidad con un puntaje de 1500 SAT?

¿Qué piensan los maestros / educadores acerca de las pruebas estandarizadas en Carolina del Norte?

¿En qué se diferencian las pruebas estandarizadas de "logro" de los años 70 de las actuales pruebas básicas comunes? Me refiero al contenido, no a la política.

Cómo aumentar mi puntuación en matemáticas, SAT 1, de 500 a 800 en un mes

¿En qué universidades puedo postularme con un puntaje SAT de 1200?

¿Cómo debo prepararme para obtener buenos resultados en el SAT?

¿Cómo debo lidiar con el error de SAT?

¿Tiene que enviar sus calificaciones del SAT a las universidades en la fecha de su examen o puede hacerlo más tarde?

Estoy tomando mi SAT Nivel 2 de matemáticas el 1 de octubre, ¿y estaría bien si mi calculadora TI 83 plus está en francés?

¿Tienes algún consejo para la nueva sección de lectura SAT? Normalmente tengo problemas para administrar mi tiempo en esta sección.

Si obtienes un puntaje de 1900 en SAT, ¿estás a tu favor para obtener un puntaje de matemáticas perfecto y 550 en ambas secciones de inglés en lugar de obtener 630 en todas las secciones?

¿Qué es el examen SAT, qué temas se incluyen en este examen y cuáles son los beneficios para los estudiantes indios?

¿Debo hacer una entrevista en línea con InitialView (por 220 USD) si mis calificaciones del SAT ya demuestran mi dominio del inglés?

¿Por qué las pruebas de inglés SAT utilizan un vocabulario poco común? ¿Cuál es el punto de?