Desde que estudié psicometría en la escuela de posgrado para mis preparativos en educación, he sido extremadamente escéptico de casi todas las pruebas psicométricas “populares” utilizadas como una forma de “pruebas estandarizadas” para niños y como pruebas psicosociales para adolescentes y adultos .
Como han dicho otros aquí, el establecimiento de la validez de estas pruebas a través de medios fuera de las mismas pruebas es escaso o inexistente.
Hay dos requisitos fundamentales para cualquier instrumento utilizado para la evaluación (prueba) que conduzca a la evaluación (dar un significado a los resultados, o aún más, agregar algún tipo de valor a un conjunto particular de datos): confiabilidad y validez . Hay mucho más para diseñar e implementar una prueba confiable, válida, significativa y útil, pero la fiabilidad y la validez son las dos piedras fundamentales sobre las cuales se construye todo lo demás.
- ¿Qué son los centros de examen AMCAT?
- ¿Quién es un estudiante promedio?
- Cómo obtener menos del rango 100 en IIT-JEE 2016
- ¿Cuáles son las mejores maneras de prepararse para el examen de la comisión de servicio público de Maharashtra sin ningún entrenamiento?
- ¿Cómo fue Gate 2017 CSE para ti?
La confiabilidad es más sencilla, como la probabilidad de que si le hiciera la misma prueba a la misma población, bajo las supuestas condiciones hipotéticas, la prueba sea la “primera” vez en ambas ocasiones, y obtenga los mismos resultados. Una medida de confiabilidad generalmente se da como una función de probabilidad donde un “1” es 100% de probabilidad de que obtenga una alineación del 100% de los puntajes cada vez que le dio la prueba a una población definida. Una confiabilidad de 0.95 es realmente alta, pero comienza a tener reservas una vez que el número comienza a caer muy por debajo de 0.90.
La validez es la declaración de probabilidad en cuanto a si la prueba está realmente midiendo lo que dice medir. La validez es mucho más difícil de demostrar. La mayoría de las grandes compañías de pruebas actuales confían mucho en el uso de lo que se conoce como “validez interna”. Esto se debe entender adecuadamente para demostrar que cuando la pregunta # 23 pregunta sobre el concepto de “x”, obtenemos datos sobre lo que el examinador sabe sobre “x”. La validez interna generalmente se determina más simplemente al proporcionarle al examinador varios elementos que cada uno pregunta sobre “x”, luego, comparando la capacidad del examinador para responder a todos estos de manera consistente. Si el examinador es inconsistente, o bien no saben mucho acerca de “x”, están adivinando, o los elementos acerca de “x” no están bien o de manera consistente. Los fabricantes de pruebas de grandes compañías entregan sus pruebas a examinados expertos para que las prueben, por lo que afirman que los resultados inconsistentes se deben a los errores de los examinados (falta de conocimiento). (Independiente) La validez de debe medir 0.95 o superior. ¡Muchas pruebas psicométricas que he visto y que he tomado se han medido muy por debajo de 0.90 y algunas incluso han sido tan bajas como 0.67!
Si una de mis propias pruebas que he generado para mis propias clases tuviera una validez tan baja, ¡la descartaría! Ciertamente, no usaría los resultados de la prueba para evaluar ni a mis alumnos ni su conocimiento del tema que pretendía medir.
Esta validez interna no es en absoluto igual, por supuesto, como una medida externa de validez. Hacer una medida externa independiente de validez es costoso y requiere mucho tiempo, por lo que la mayoría de las pruebas no se han validado de forma independiente.
Un tercer tipo de validación es correlacionar los resultados de una prueba con los resultados de una prueba diferente, pero relacionada que cubra el mismo material o conceptos. Esta correlación entre pruebas, se afirma, valida la segunda prueba, ya que la primera ya ha sido aceptada. ¿Ves el problema aquí? Si la primera prueba no es válida, la segunda no puede ser más válida simplemente porque se alinea (se correlaciona) con la primera. Esta técnica, sin embargo, parece ser bastante común en muchas pruebas de CI y de personalidad populares.
Muchas pruebas psicométricas populares NO tienen base en la investigación cognitiva real o en estudios psicológicos o cognitivos doble ciego controlados. Gran parte de lo que pasa como pruebas psicométricas “científicas” se ha basado en suposiciones basadas en evidencia escasa de un estudio de IRM funcional de una sola muestra pequeña, o en extensiones de ideas sobre cómo alguien “cree” que funciona el cerebro. La prueba del cerebro izquierdo / cerebro derecho, por ejemplo, se basa en una idea errónea apoyada por la pseudociencia y la evidencia anecdótica. No existe un cerebro normal con un cuerpo calloso intacto que funcione como dos hemisferios separados, con las matemáticas teniendo lugar solo o predominantemente en la izquierda y la creatividad y el arte provenientes de la derecha. Sin embargo, las pruebas y los exámenes siguen siendo utilizados para describir a las personas y asignarles un tipo de personalidad y / o un “estilo de aprendizaje”. Los estilos de aprendizaje (llamados), por cierto, no son una ciencia, ni están respaldados por evidencia científica o estudios. Se basó esencialmente en un par de conceptos erróneos sobre inteligencias múltiples y luego se convirtió en un producto de la industria de la educación comercial. Se ha ganado mucho dinero y muchos sistemas escolares han aceptado la idea, pero es pseudociencia.
Del mismo modo, las pruebas de personalidad tienen poco que ver con la ciencia y mucho que ver con la pseudociencia y una confusión entre la correlación y la causalidad.
Quizás esto resume las pruebas psicométricas. Cuando se pregunta a los psicometristas qué es la inteligencia, los psicométricos honestos deben responder: “La inteligencia es lo que miden las pruebas de inteligencia”.
¿Suena como una respuesta imprudente? Es. También es lo mejor que pueden hacer. Con casi 100 años de prueba y error, estudios científicos y muchos miles de pruebas realizadas y evaluadas, las pruebas psicométricas son solo medidas “aproximadas” de lo que afirman. Algunos no tienen valor. Se puede demostrar que son poco fiables y no tienen certeza de validez. Algunos tienen un poco de valor predictivo, aunque lo que predicen es impreciso, si no también algo impreciso.
MI opinión es que ningún empleador debería utilizar las pruebas psicométricas como factores predictivos del comportamiento, la capacidad de una persona para trabajar con otros o como un medio para determinar el pago o la promoción. Estas pruebas simplemente no están diseñadas para estas cosas, y ni siquiera son demostrablemente válidas para gran parte de lo que afirman.
De manera similar, las pruebas psicométricas de los niños en las escuelas deben cesar, ya que la mayoría (no todas) de estas pruebas son una pérdida de tiempo y conducen a evaluaciones inapropiadas de los estudiantes, sus capacidades o las vías en las que podrían o deberían seguir en su educación. .