¿Cuál es una mejor métrica de la capacidad: preguntas de opción múltiple con deducciones por adivinar, o pruebas que no tienen tales deducciones?

Las pruebas con deducciones para adivinar parecen reducir los puntajes de las mujeres y las personas más adversas al riesgo. Un nuevo artículo de Katherine Baldiga, estudiante de posgrado en economía de Harvard, examina si hombres y mujeres abordan el tema de manera diferente. De lo abstracto:

En este documento, presentamos los resultados de un experimento que explora si las mujeres saltan más preguntas que los hombres. La prueba experimental consiste en preguntas de práctica de las pruebas de asignaturas SAT II de Historia mundial e Historia de EE. variaremos el tamaño de la sanción impuesta por una respuesta incorrecta y la importancia de la naturaleza evaluativa de la tarea. Encontramos que cuando no se evalúa una multa por una respuesta incorrecta, todos los examinados responden todas las preguntas. Pero, cuando hay una pequeña penalización por respuestas incorrectas y la tarea se enmarca explícitamente como un SAT, las mujeres responden significativamente menos preguntas que los hombres. No vemos diferencias en el conocimiento del material ni la confianza en estos examinados, y las diferencias en las preferencias de riesgo no explican toda la brecha observada. Debido a que la brecha de género existe solo cuando la tarea se enmarca en un SAT, argumentamos que las diferencias en las actitudes competitivas pueden impulsar las diferencias de género que observamos. Finalmente, demostramos que, dependiendo de su conocimiento del material, los examinados que se saltan las preguntas obtienen resultados significativamente peores en nuestro examen experimental, poniendo a las mujeres y más adversos al riesgo en desventaja “.

– Vea la publicación relevante en el blog de Freakonomics: http://www.freakonomics.com/2011…
– el artículo completo: http: //www.people.fas.harvard.ed…

Cualquier prueba es, en última instancia, una medida de la capacidad de la persona para tomar esa prueba. La deducción de puntos por adivinar simplemente no importa mucho.

Sí, hay una distinción entre las personas que saben cuándo adivinar y las que no. De manera similar, existe una distinción entre las personas que estudian para el examen y las que no lo hacen. Es fácil comprender el formato y el diseño de una prueba estandarizada; se describe con precisión en el sitio web de la prueba y en el material entregado a los examinados.

En el SAT, el punto es prácticamente discutible. La deducción por adivinar en el SAT hace que la prueba sea neutral en promedio. Si adivina las preguntas en las que no tiene conocimiento, en promedio no cambiará su puntaje bruto *. Si toma las preguntas donde no tiene idea, puede adivinarlas o no. No importa.

* Sin embargo, es posible que puedas cambiar tu puntuación escalada en promedio, dependiendo del sistema de conversión, que no creo que esté disponible públicamente.