¿Las pruebas estandarizadas son más difíciles para las minorías?

Ciertamente estaré de acuerdo con los otros comentaristas sobre los efectos de la pobreza y del ingreso familiar en general.

Pero creo que hay mucho más que eso, tanto en términos de equidad educativa como en términos de construcción de pruebas.

1. El racismo en las escuelas no se trata solo de economía. Los estudiantes de las minorías a menudo son maltratados por los profesores blancos, incluso los bienintencionados. El 40% de los estudiantes en los Estados Unidos son personas de color, pero solo el 17% de los maestros (cita). Los estudiantes negros y los hombres negros especialmente están sujetos a castigos mucho más severos por infracciones infantiles, comenzando en el jardín de infantes. No se trata de dinero, se trata de raza. Aquí: los chicos negros vistos como mayores, menos inocentes que los blancos, según encuentra una investigación. Puede pensar que me estoy desviando del tema de las pruebas estandarizadas, pero no lo creo. He pasado años pensando en mi propia experiencia escolar, dándome cuenta retroactivamente de la medida en que mis maestros de la infancia (en Virginia en los años 80) automáticamente calificaron a los estudiantes negros de “problemáticos”, y cómo mi propia mala conducta (principalmente hablando en clase) pequeñas marcas en una tabla o amonestaciones suaves, no viajes a la oficina del director. Estoy 100% a favor de resolver la pobreza, pero eso no hará desaparecer el racismo. Y el lugar más tóxico en el mundo para que aparezca el racismo es en los años formativos de la educación de un niño (aquí hay un relato personal de Mia McKenzie). La inequidad educativa que comienza en el jardín de infantes no se arregla mágicamente por sí misma: si te atrasas, tiendes a quedarte atrás.

2. Estereotipo de amenaza . Las personas que forman parte de los grupos que se cree que no obtienen buenos resultados en las pruebas se congelan, temen confirmar el estereotipo. Aquí: ReducingStereotypeThreat.org Es bien sabido que colocar preguntas demográficas (raza, género, etc.) antes de la prueba hace que las mujeres y las minorías empeoren, mientras que colocar esas preguntas al final de la prueba no perjudica el rendimiento. (Aquí hay un informe de un estudio en el que las niñas asiático-americanas obtuvieron mejores resultados en una prueba de matemáticas cuando se les pidió que reflexionaran sobre su origen étnico, pero peor cuando se les pidió que reflexionaran sobre su género). Mientras que los cambios pequeños como las preguntas demográficas se mueven al final del Las pruebas son una buena práctica, por supuesto que no pueden solucionar el problema mayor.

3. Las pruebas estandarizadas están “normalizadas” para grupos en su mayoría blancos de examinados. Permíteme explicarte.

Imagine una prueba de ingeniería donde todas las preguntas son bastante sencillas sobre ingeniería. Hay una pregunta sobre el estrés en un puente que el profesor pretendía ser de dificultad moderada, al igual que las dos preguntas inmediatamente después. La clase de ingeniería es 90% masculina. ¡Si por alguna extraña razón la mayoría de los estudiantes varones entendieran mal la pregunta (y las estudiantes mujeres lo entendieran bien), la profesora lo notaría! O bien esa pregunta fue más difícil de lo que pensó, o hay algo extraño o engañoso al respecto. Pero si la mayoría de las estudiantes femeninas entendieron mal la pregunta (y los estudiantes varones lo hicieron bien), el profesor probablemente ni siquiera lo notaría, ya que la cantidad de estudiantes femeninas es muy pequeña. ¿Por qué las mujeres se desempeñan peor en esta pregunta, pero bien en las dos preguntas aparentemente similares justo después? Nadie lo sabe, y ninguna malicia debe ser intencionada. Pero terminas con un efecto en el que se revisa una pregunta que es inesperadamente difícil para los hombres, y otra que es inesperadamente difícil para las mujeres.

Ahora, tal vez a un profesor de ingeniería no le importe cambiar sus preguntas en función del rendimiento de los estudiantes. Porque las pruebas en las universidades no están estandarizadas.

Entra en el psicometrista …

Pruebas como las de SAT, GMAT y GRE desarrollan constantemente nuevas preguntas, que luego deben evaluar en verdaderos examinados. Para realmente “probar” una pregunta, la persona que completa la pregunta no puede saber que la pregunta no cuenta, por lo tanto, el SAT y el GRE contienen una sección completa que no cuenta (pero usted no sabe cuál ), y el GMAT mezcla las preguntas experimentales en todo. Uno de los objetivos de este proceso es desechar cualquier pregunta que no predice el rendimiento como se esperaba.

Por ejemplo, el GMAT está calificado de 200-800. Una pregunta que los fabricantes de pruebas pretenden ser una pregunta “650” debe ser tal que las personas que obtienen menos de 650 en el GMAT en su mayoría se equivocan, y las personas que obtienen más de 650 en el GMAT en su mayoría lo hacen bien. Si las respuestas están en todo el mapa (por ejemplo, es probable que los puntajes muy bajos adivinen la respuesta correcta), la pregunta se modifica o se descarta.

Ahora imagine que la pregunta experimental 650 está probada y sale bastante bien; digamos que el 80% de las personas que obtienen puntajes por debajo de 650 se equivocan y el 80% de las personas que obtienen puntajes por encima de 650 lo hacen bien. PERO, cuando se desglosan los datos para esa pregunta para grupos más pequeños, resulta que los examinados minoritarios que normalmente obtienen más de 650 puntos NO responden correctamente a esta pregunta en particular. Pero si ese grupo es solo el 10% de los examinados, sus números no serán suficientes para desechar la pregunta. Este es un efecto que no presupone racismo o incluso falta de sentido o insensibilidad (“Si hay 8 yates en la regata …”): es posible construir una pregunta de álgebra que ni siquiera tenga palabras, y para algunos La razón por la cual algunos grupos, en promedio, obtendrán mejores calificaciones que otros, sin ninguna razón obvia. Es incluso más fácil imaginar que un pasaje de lectura sobre un tema aparentemente inocuo sería más comprensible o interesante para un grupo que para otro.

Alrededor de 2005, el SAT comenzó a hacer esfuerzos para incluir más pasajes de lectura sobre mujeres y minorías. Esto es muy bueno, pero no resuelve lo que es esencialmente un problema de números.

Si pudiéramos incluir a un psicometrista actual aquí, me encantaría saber si hay algún problema grave con este problema (o con una mirada más reciente).

4. También preguntó si la prueba estaba “diseñada” para los blancos. Como casi todo hecho por gente blanca en la década de 1930, sí, más o menos. El SAT originalmente tenía la intención de identificar candidatos fuertes para la Ivy League entre, esencialmente, los granjeros del Medio Oeste (vea La Gran Prueba: La Historia Secreta de la Meritocracia Americana: Nicholas Lemann: 9780374527518: Amazon.com: Libros, o esta entrevista más corta). Parece irónico que los creadores de la prueba pensaron que estaban ayudando a los niños pobres (blancos) inteligentes a vencer a los varones ricos pero medios (blancos) al crear lo que pensaron que sería una prueba de “coeficiente intelectual puro”. en la escuela para que aquellos que asisten a escuelas de baja calidad no sean penalizados. Ahora sabemos que no funciona así.

Tenga en cuenta que el SAT de hoy es radicalmente diferente de la prueba de la década de 1930, o incluso de la prueba que tomé por primera vez en los años 90. Pero una de las grandes quejas que los padres y maestros tienen sobre el examen, que no refleja el material que se enseña en la escuela, fue originalmente por diseño. Los vientos de cambio ahora se están moviendo en la dirección opuesta: la nueva SAT del 2016 promete evaluar más de cerca el material que los estudiantes han aprendido en la escuela. Si esto tendrá algún efecto para cerrar la brecha racial o la brecha de ingresos familiares aún está por verse.

5. También vale la pena señalar que una de las razones por las que se desarrolló la prueba, y una razón que aún se aplica hoy, es que los Estados Unidos son un país grande sin un sistema educativo nacional. Por lo tanto, es muy difícil comparar a dos estudiantes con un promedio de calificaciones (GPA, por sus siglas en inglés) similares, de dos sistemas escolares y áreas geográficas diferentes (aunque las principales universidades sí mantienen registros, si un valedictorian de su escuela secundaria se retiró, otros candidatos de esa escuela pueden tener un momento más difícil para entrar).

Es por eso que muchas personas piensan que necesitamos una prueba grande que todos deben tomar.

Ahora hay una tendencia de que algunas escuelas opten por la prueba, aunque las mejores requieren un “portafolio” o algún otro paquete de materiales. Parece que estas “carteras” pueden estar aún más sujetas a manipulaciones por parte de los consultores que a las calificaciones del SAT. Puedes contratar a alguien para que haga el portafolio de tu hijo, pero contrata a todos los tutores que quieras, el niño todavía tiene que tomar el examen ella misma.

Personalmente, soy un fanático de los exámenes AP, que creo que son pruebas bien diseñadas. Creo que si a un estudiante le va bien en 4 o más exámenes AP, su SAT debería ser básicamente irrelevante. Pero solo el escalón superior toma AP en primer lugar, por lo que este no es un sustituto amplio (y las Pruebas de materias SAT no son tan útiles, son cortas, dependen de la opción múltiple y no incluyen tareas complejas como la Ensayos y secciones de interpretación de documentos en algunos exámenes AP).

6. Creo que mi solución ideal sería dejar que todos vayan a la universidad gratis – admisiones abiertas – y solo ver quién puede hacer el trabajo. Eso significa que las clases introductorias tendrían miles de personas, al menos al principio. Quien lo logre será recompensado con clases mucho más pequeñas cuanto más difícil sea el material.

Esto no es diferente de lo que está sucediendo ahora con el software gratuito Open Courseware de MIT. Puede parecer realmente genial y sorprendente que puedas obtener una versión de una educación de MIT de forma gratuita. Es decir, suena bien hasta que te das cuenta de que esto va a ser difícil como si fueses siete minutos.

Creo que es un poco tóxico que nuestro sistema educativo se base en gran medida en recompensar a las personas al admitirlas en las mejores universidades, con poco énfasis en lo que sucede cuando llegan allí. Lo “increíble” de los graduados de Harvard no es realmente lo que aprendieron allí, ¡es que entraron! Cuando tenían 18 años! ¿Es eso realmente lo que es importante?

¿Qué pasaría si alguien (bueno, alguien con tiempo libre, transporte o acceso a Internet, cuidado de niños, etc.) pudiera inscribirse en Harvard, pero solo un pequeño porcentaje de esas personas alguna vez obtuvieron un título? Creo que estaríamos mucho más impresionados con los graduados de Harvard que ahora, porque sabríamos lo duro que realmente trabajaron para graduarse (y porque muchos de nosotros habríamos tenido la experiencia de obtener 30 minutos en una clase de cálculo diferencial, o dos semanas en alguna teoría crítica, y darme cuenta de que simplemente no va a suceder 😉

No tengo una respuesta autorizada a su pregunta, por lo que casi la pasé por alto. Pero, lo dejé en mi lista y finalmente decidí volver a él y ofrecer lo que sé.

No hay evidencia concluyente de un sesgo racial significativo en las pruebas preuniversitarias. Sin embargo, la sugerencia de que las pruebas son sesgadas es más que una mitología.

Históricamente, los estudiantes negros tienen una puntuación significativamente peor en promedio que los estudiantes blancos. Durante muchos años, se creyó que esta era una función simple de la oportunidad socioeconómica. Como los estudiantes negros eran estadísticamente más propensos a vivir en la pobreza, a asistir a escuelas públicas de baja calidad, etc., naturalmente se siguió que el impacto conocido de estos factores afectaría de manera desproporcionada a los estudiantes negros.

Sin embargo, al final, un par de estudios (uno a principios de la década de 2000 y el otro alrededor de 2010) examinaron más de cerca una pregunta por otra. Lo que descubrieron fue que había preguntas particulares que sesgaban significativamente de una manera u otra: que los estudiantes blancos tendían a mejorar en esas preguntas o los estudiantes negros lo hacían.

Sin embargo, esto aún dejó muchas preguntas abiertas, porque algunas preguntas favorecían a los blancos y algunos negros. Y, algunas preguntas no mostraron diferenciación racial. Los investigadores hicieron el mismo análisis con los estudiantes latinos y no pudieron identificar ninguna de estas preguntas disidentes.

La conclusión es que no sé, y los datos, expertos, etc. no pueden llegar a un consenso. Pero, hay algunos datos para apoyar la idea. Y, estadísticamente, los estudiantes negros obtienen puntuaciones más bajas que los estudiantes blancos en masa, aunque eso no es necesariamente cierto en una base persona por persona.

He trabajado con muchos estudiantes pertenecientes a minorías que se desempeñan extremadamente bien en los exámenes estandarizados, pero sus padres están bien educados y tienen ventajas económicas. Así que no hay nada intrínseco en ser una minoría y puntuar mal.

Es fácil culpar a las pruebas, pero yo diría que reflejan la calidad desigual de la educación en Estados Unidos. (Culpar a la prueba es como culpar al mensajero).

El acceso a una educación de calidad es mucho de lo que crea la diferencia en los puntajes entre grupos. Esto es lo que debe abordarse para corregir la diferencia.

Dicho esto, hay muchas personas económicamente desfavorecidas que superan estos obstáculos: el neurocirujano, el Dr. Ben Carson, y el economista Thomas Sowell son solo dos de esas personas que vienen a la mente.

Los buenos mentores pueden hacer una gran diferencia en las vidas de los jóvenes. Según Carson, era su propia madre (analfabeta).

Ya hay buenas respuestas a su pregunta, le indicaré un detalle en la pregunta a continuación.

No, las pruebas estandarizadas no son más difíciles para las minorías.

La gente usa incorrectamente el término ‘prueba estandarizada’ para referirse a todo tipo de cosas: pruebas de opción múltiple, pruebas diseñadas por firmas comerciales, una prueba de alto riesgo, etc.

Una prueba estandarizada es una prueba uniforme. Esto significa que todos los examinados se enfrentan a las mismas tareas, se administran de la misma manera y se califican de la misma manera.

Esto no significa que las pruebas estandarizadas específicas sean o no sean más difíciles para las minorías. ¡Solo que esto no tiene nada que ver con la estandarización de la prueba!


Espero que esto responda a su pregunta.

Para obtener más información, vea Measuring Up by Daniel Koretz – es un gran libro sobre pruebas y exámenes en educación.

Todo lo demás es igual, cualquier grupo subrepresentado / oprimido / tradicionalmente no permitido está sujeto a algo llamado amenaza de estereotipo

Si tiene a alguien con una fuerte identidad de grupo en ese momento (es decir, haga que marque una casilla que diga “mujer” y / o una que diga “negro” en la primera página de la prueba) y existe una preocupación sobre cómo está ese grupo percibido en esa tarea (es decir, “las niñas no pueden hacer matemáticas” o “los negros no son inteligentes”), entonces hay una respuesta de estrés. Esa respuesta al estrés te hace tener una calificación más baja en un examen.

Una solución simple para parte del problema es recopilar información personal / demográfica al final en lugar del comienzo de la prueba. Otra es proporcionar un entorno en el que esas amenazas no sean relevantes para los estudiantes, donde se celebre que las personas académicamente dotadas de ambos sexos y todas las razas son parte de la norma (en lugar de una “científica femenina”).

Esto es solo un ancidote, pero les enseño a estudiantes nativos de Alaska y yo estaba administrando un examen estandarizado del estado hace varios años (no un examen ACT o SAT sino una idea similar). Hubo una sección de muestra que los estudiantes tuvieron que completar donde leyeron un pasaje corto, luego respondieron un par de preguntas de opción múltiple y una pregunta de respuesta corta. Se suponía que debían hacer esta sección y hacerme todas las preguntas que querían porque no podían preguntar ninguna una vez que llegaban a la parte principal de la prueba.

El pasaje de lectura fue sobre cangrejos comerciales, que uno pensaría que era un gran tema para los niños de Alaska. De hecho, había niños en mi clase que trabajaban comercialmente con sus familias. Uno de esos niños levantó la mano y preguntó: “¿Debo dejar la respuesta que dice el pasaje o la forma en que lo hacemos en el bote?” Tuve que decirle al alumno que dejara la respuesta que coincidiera con lo que decía en el pasaje.

La persona que escribió la prueba intentaba ser culturalmente sensible, pero en realidad no sabían lo suficiente sobre el tema para escribir el pasaje correctamente. Cuando tienes personas de una cultura que escriben preguntas, no pueden saber lo que no saben o cómo las personas de otras culturas verán sus preguntas.

La única forma de solucionar este problema es dar las preguntas como ejemplos y observar los datos para resolver preguntas injustas. Jennifer Dziura hizo un buen trabajo explicando eso.

Lo que realmente me frustra más es que mis alumnos tienen tanto conocimiento que no cuenta. Saben más de lo que nunca sabré sobre cosas como el clima, las mareas y los motores de las embarcaciones, pero se meten en problemas porque no pueden recordar lo que es un bordillo o una tienda por departamentos. Para que les vaya bien en este tipo de pruebas, tienen que saber todo lo que sabrían como niños suburbanos blancos y todo lo que necesitan saber para vivir donde están. Luego, cuando no lo hacen tan bien, tiende a reforzar el estereotipo de que los niños de minorías no son tan inteligentes.

No creo que las pruebas afecten de manera desproporcionada a las minorías tanto como a las personas que viven en la línea de pobreza o por debajo de ella. En pocas palabras, los que viven en la pobreza tienden a tener puntuaciones más bajas en exámenes como el ACT / SAT.

No hay implicaciones aquí. Es solo que entiendo que la riqueza tiene una correlación más fuerte con los puntajes de las pruebas que con la raza.

Es cierto que las minorías tienen problemas con estas pruebas estandarizadas porque hacen preguntas asumiendo experiencias que no son comunes entre personas de escasos recursos y minorías. Esto es algo que se está abordando en la construcción de prueba para hacerlos más justos. Este problema es tratado diariamente por las escuelas de Título 1.

Estas pruebas requieren algunas preparaciones, y las minorías pueden tener preparaciones deficientes que pueden afectar negativamente sus resultados. Considere si alguien tiene una preparación de prueba decente y otra es pobre o difícil de obtener. Su diferencia es debida a esto.

Pero eso no es lo único. Si creces, puede que tu padre tenga una buena experiencia con esas pruebas, las considerará fáciles, pero si te dicen que las pruebas matan que no las aprobarás, Va a ser afectado psicológicamente.

Para la minoría, creo que hay una parte de los efectos de su economía (preparación de exámenes), factores psicológicos (historias, motivación de los padres, el entorno en el que crecieron, etc.) que la raza.