¿Por qué son los sindicatos y los maestros en su mayor parte en contra del uso de pruebas estandarizadas, ya sea para maestros o para estudiantes, como un buen indicador de la eficacia de los maestros?

Permítanme comenzar diciendo que personalmente soy un gran fanático de las pruebas estandarizadas cuando las pruebas se usan bien. Proporciona una medida del rendimiento de los alumnos, proporciona retroalimentación a todas las personas involucradas y ayuda a garantizar que los alumnos reciban una educación de calidad y no solo se transmitan sin conocimiento para demostrar por sí mismos. Sin embargo, las pruebas son perjudiciales si nos centramos demasiado en los resultados sin mirar el contexto general. Aquí están mis preocupaciones con las evaluaciones de los maestros que están vinculadas demasiado estrechamente a una prueba:

1) ¿De quién se mide la efectividad?
He tenido alumnos con tutores. Por lo general, les va muy bien en las pruebas, pero ¿es porque yo, el profesor, soy efectivo o porque su tutor es?

2) ¿Son las pruebas confiables, o son una broma para algunos estudiantes?
Mi colega dio su examen anual del distrito el día en que tuvo un sustituto. Los estudiantes jugaron durante el examen y uno de ellos obtuvo un puntaje de 17. En el examen previo, obtuvo un 65 en el inicio del año. Nada indica que un 17 sea una medida verdadera de su conocimiento, pero usted quiere que esa puntuación se use para calificar la efectividad de su maestro.

3) ¿Cómo evaluamos el área de contenido asignada a un maestro?
La prueba no tiene en cuenta la discapacidad / fortalezas / debilidades del estudiante. En mi trabajo actual, tengo muchos estudiantes que son fantásticos en matemáticas, pero son fóbicos de la lectura. Pueden resolver todo, pero se congelan ante la vista de un problema verbal. Podrían responder a la pregunta si se les pregunta oralmente. Personalmente, estoy de acuerdo con que les falten las preguntas de dos problemas de palabras en la prueba, pero ¿podría ver cómo una educación deficiente en lectura puede hacer que un profesor de matemáticas (o historia o ciencias) parezca más ineficaz? Aunque no es el contenido, las debilidades de los estudiantes se filtran en el proceso de prueba.

4) Nuestro modelo para medir el rendimiento de las pruebas no tiene en cuenta el rendimiento histórico de un estudiante. En una clase de profesor eficaz, debería obtener una A en la prueba posterior. Si me colocaran en una clase de profesor ineficaz, también debería obtener una A en el examen posterior (porque me enseñaría a mí mismo). He tenido maestros horribles donde los desconecté y leí el libro de texto en su lugar, y obtuve una calificación excelente porque el libro de texto era un maestro efectivo. El aprendizaje sucedió, pero no fue por el profesor …

De la misma manera, conozco a estudiantes que aún podrían obtener una D incluso después de horas y horas de asistencia fantástica de maestros, porque normalmente tienen un promedio de E. He trabajado para lograr que los estudiantes de secundaria alcancen un nivel de dominio de matemáticas de segundo o tercer grado, y me sentí orgulloso de ellos por ese progreso (y lamenté que esto no haya sucedido antes en su carrera). ¿Soy un mal maestro porque mi alumno de 9no grado se evalúa como un alumno de tercer grado?

5) Los maestros y los administradores son actores inteligentes y racionales, y como tales manipularán la situación. Se sabe que los administradores tienen estudiantes “ausentes” / suspendidos durante la semana de exámenes. Verifican las direcciones y envían a los estudiantes que fallan a las escuelas de su vecindario, y esto sucede un mes antes de los exámenes estatales (¿coincidencia?) Este nuevo maestro en la otra escuela obtiene los resultados del estudiante, aunque se conocen unos a otros menos de un mes.

A veces, estos nuevos estudiantes no hablan inglés y son inmigrantes legales con menos de un año en el sistema escolar estadounidense. Sus resultados todavía cuentan.

Los maestros manipulan los resultados enseñando lo que es más probable que esté en la prueba. Así que renuncian a las actividades de enriquecimiento para “matar y perforar” los 50 elementos principales de la prueba.

¿Quieres un ejemplo concreto de este efecto? Tuve un estudiante que vino de Texas a Virginia. Pasó su EOC de Texas para la historia de los EE. UU., Pero tuvo que volver a realizar la prueba en Virginia para obtener su diploma aquí. Cuando la sacaron de mi clase de matemáticas para tomar el examen de historia, le dije que “Ben Franklin era amigo de Francia”.
Parece confundida, y le expliqué que si alguna vez veía a Ben Franklin, Francia o Alianzas (amigos), debería elegir a los otros para completar la pregunta. Al día siguiente, dijo “gracias” porque esa pregunta estaba en el examen estatal, y dijo que no la habría recibido sin mi ayuda. ¿Le enseñé algo en la historia de los Estados Unidos? ¡NO! ¿Le ayudé a aprobar su examen estatal con una sesión de cram de un minuto de antemano? ¡SÍ! Sin embargo, eso es en lo que quiere medir el desempeño de su profesor de historia actual.

No hice trampa al decirle un hecho que sabía que era estadísticamente probable que estuviera en el examen y que es poco probable que ella tuviera un conocimiento previo, pero ¿cómo es lo que le dije a ella que es radicalmente diferente a decirle sus respuestas durante la prueba? (que obviamente sería hacer trampa)? Veo esta práctica como una trampa “legal”, y es una forma en que estas pruebas no son válidas. Medir a una maestra de historia de Virginia basándose en las calificaciones de esta niña tejana también es una práctica tan inválida, cuando la única historia que aprendió en este estado fue una sesión de estudio de un minuto de un maestro de matemáticas.

6) Han encontrado brechas en el rendimiento de las pruebas entre razas y géneros. Los estudiantes afroamericanos con padres de educación de doctorado obtienen una puntuación equivalente o ligeramente peor que los estudiantes blancos de educación universitaria en sus SAT. Pasé más tiempo concentrado en mis estudiantes minoritarios que en mis estudiantes blancos (porque necesitan más ayuda para ponerse al día), soy un profesor “más efectivo” en darles tiempo individual, pero aún así obtienen calificaciones más bajas que mis estudiantes blancos . Y lo harán, hasta que cerremos significativamente las brechas de riqueza racial, las brechas de privilegios educativos y las brechas de empleo en nuestra sociedad.
Por cierto, cuando digo “todavía tengo una puntuación más baja”, quiero decir que pueden comenzar 70 puntos por detrás en una prueba de 600 puntos, y puedo obtenerlos dentro de los 20 puntos. Mucho progreso, pero no equidad.

Entonces, paso mis días reflexionando sobre las pruebas, preparando a los niños para las pruebas, y estoy de acuerdo con que me evalúes a partir de ellos. En su mayor parte … Pero vincular los bonos de rendimiento y los incentivos de alto riesgo es ridículo. No es beneficioso para los estudiantes, y no valora el hecho de que tengan diferentes niveles cognitivos (¿por qué el niño A está tomando la misma prueba que el niño E?), Diferentes habilidades (tareas de lectura en un examen de matemáticas) , diferentes destrezas lingüísticas (mi estudiante hondureño podría resolver ecuaciones y decir una palabra – “baño” – en inglés), y diferentes historias de fondo (faltaron meses de escuela debido a la falta de vivienda, padres encarcelados, inseguridades alimentarias vs. tomar un examen de historia después de pasar el giras de verano por Francia y Alemania).

Respuesta corta: no pueden y no pueden trabajar como quieren los proponentes.

Respuesta más larga: NO tome mis comentarios por una afirmación de que las pruebas estandarizadas son inútiles como afirman muchos oponentes. Son muy importantes para tareas como las comparaciones de grupo (ver NAEP) y, cuando se construyen correctamente , proporcionan información de diagnóstico a los estudiantes. Sin embargo, muchas pruebas no se construyen bien y, en general, los proponentes quieren demasiado de ellas. Una cosa de la que realmente no pueden decirnos mucho es el desempeño del maestro. Irónicamente, un examen puede tener una confiabilidad bastante buena * tanto a nivel de los estudiantes como a nivel de la escuela y carece de este a nivel del maestro. Por lo tanto, es irresponsable dado que los puntajes de los maestros se usan para decisiones de alto nivel.

También es muy difícil generar una prueba que sea buena para un solo propósito, pero todos los responsables de formular políticas (y demasiados maestros y padres) están atrapados en su noción de psicometría popular, y suponen que realmente no es gran cosa generar una prueba que sea comparable A través de muchos estudiantes en diferentes contextos. Lo siento, eso no es cierto.

Estoy expresando mi opinión profesional aquí, pero es uno de los miembros de mi profesión mucho más sénior que yo que he hecho declaraciones en el mismo sentido: “No en nuestro nombre”.

http://www.epi.org/publication/b…

https://www.amstat.org/policy/pd

Una vez que tomas en cuenta la ley de Campbell, se hace:

“Cuanto más se utilice cualquier indicador social cuantitativo (o incluso algunos indicadores cualitativos) para la toma de decisiones sociales, más sujeto estará a las presiones de corrupción y más propicio será distorsionar y corromper los procesos sociales que se pretende controlar. . ”

Y, por cierto, he dicho lo mismo en reuniones con PARCC hace algunos años. A nadie le importa una mierda lo que pienso, pero si nos fijamos en los autores de los informes vinculados anteriores, y mucho más, además, quién es quién de psicometría y estadística, no proviene de mi profesión. Hemos dicho repetidamente a las personas que este régimen de pruebas de alto riesgo es una mala idea. (Sin embargo, hay gente feliz de tomar el dinero. No estoy diciendo que seamos más virtuosos que la otra persona).

Quiero decir que los sindicatos de docentes no siempre han sido útiles en su oposición y, a menudo, lo hacen parecer una protección laboral. Además, la mayoría de los maestros no entienden realmente la evaluación tan bien fuera de la evaluación en el aula, y recurren a la “psicometría popular” bastante engañosa, como mencioné anteriormente. Muy a menudo han sido su peor enemigo en esta lucha en particular.

* La fiabilidad es un término técnico. No es exactitud. Significa que los resultados de las pruebas serían replicables, pero eso no dice que la prueba sería realmente precisa en el sentido de medir lo que se pretendía medir.

Una razón importante es que las pruebas estandarizadas son una evaluación conjunta de los estudiantes y sus maestros actuales y anteriores. Separar estos factores es difícil o imposible de hacer con precisión, pero las decisiones basadas en ellos a menudo se toman como si fueran precisas. Las consecuencias a menudo se manifiestan en formas que son evidentemente irrazonables e injustas.

Porque es una noción idealizada que no toma en cuenta las realidades de la vida escolar.

La teoría es que se sientan unos treinta niños al comienzo del año y se les hace una prueba. Luego, se sienta a los mismos treinta niños al final del año y les hace otra prueba y al comparar los dos resultados podemos determinar qué tan bueno es el profesor en comparación con el maestro en la sala de al lado.

Asume que el único factor variable en el aula es la calidad del maestro, por lo que nuestras dos pruebas hablan exclusivamente sobre su capacidad de enseñanza.

La realidad es totalmente diferente. El factor más importante en el aprendizaje de los alumnos no es el profesor, son los propios alumnos. Determinan la eficacia con la que aprenden y hay innumerables factores que determinan su actitud hacia su propia educación.

El mejor estudiante del mundo puede verse afectado por factores emocionales que destruyen su capacidad de aprendizaje. Un duelo personal, una ruptura familiar, una enfermedad u otro factor emocional pueden convertir al mejor estudiante de la clase en alguien que apenas está haciendo frente.

Los factores externos también pueden funcionar a la inversa. Todos los maestros se han encontrado con estudiantes que, de repente, han pasado de vagabundos sin rumbo en el aula a estudiantes enfocados. Se decidieron por una carrera y se dieron cuenta de los pasos necesarios para llegar allí. Han valorado su propia educación y han madurado en el proceso. Es algo que, literalmente, puede suceder de la noche a la mañana cuando un niño crece y considera la edad adulta y de repente indica un cambio masivo en su actitud hacia el aprendizaje.

Las variables entran en la ecuación en el momento de la prueba también. Los adolescentes son humanos y están afectados por las emociones y los problemas humanos tanto como cualquier otro individuo. Haga un examen a un alumno en un día en el que haya dormido bien, haya tenido un buen desayuno y se encuentre en un buen estado de ánimo. Obviamente, lo harán mucho mejor que en un día en que Cansado y emocionalmente drenado. Todos estos son factores que están completamente fuera del control de un maestro.

Las pruebas estandarizadas como un medio para medir la calidad de los maestros también juegan con la falsa idea de que enseñar es como lanzar jabalinas y puede clasificarse por completo con una sola habilidad. Los mejores lanzadores de jabalina lanzan las jabalinas más lejos que los peores para que podamos decir fácilmente cuáles son las mejores. Pero enseñar no es así porque es un gran conjunto de habilidades y habilidades. Cada maestro tiene fortalezas y debilidades. Algunos pueden mantener una disciplina de clase increíble, pero no pueden inspirar a los estudiantes de manera efectiva. Otros pueden inspirar a los buenos niños a nuevas alturas, pero no pueden mantener bajo control a los creadores de problemas. Algunos pueden usar la pizarra como lienzo y crear brillantes ayudas visuales que inspiran a los aprendices visuales, otros pueden usar palabras para llegar a los aprendices auditivos de manera más efectiva. Cada maestro tiene alumnos que les encanta enseñar y alumnos que no, y es diferente para cada maestro porque sus diferentes estilos de enseñanza hablan a diferentes alumnos.

Las pruebas estandarizadas simplemente no son un buen indicador de la capacidad de un profesor. Simplemente no son efectivos. Pero mientras están siendo ineficaces, están dañando las escuelas al convertirlas en instituciones que alejan su enfoque de la educación y el bienestar de los niños y obtienen buenos resultados en las pruebas estandarizadas.

¿Desea despedir a un médico porque sus pacientes se enferman o mueren?
¿O si él / ella no pudo salvarlos en la sala de emergencias?
¿Desea despedir a un dentista si sus pacientes tienen caries o necesitan un tratamiento de conducto?
¿Le despediría a un policía si ocurriera un crimen en su guardia?

Esperemos que estés pensando … “por supuesto que no”.

Iba a escribir algo elaborado, pero muchos de los puntos más destacados ya se han visto afectados. Lo resumiré con un aforismo:
‘Lo único que miden los buenos puntajes es la capacidad del estudiante para obtener buenos puntajes’.

More Interesting

¿Vale la pena volver a tomar mi SAT para las aplicaciones de la Ivy League con un 1530 en mi primer intento?

Cómo prepararme para el SAT y cómo puedo obtener una puntuación alta (1400 o superior)

¿Cuántos estudiantes toman clases de SAT o ACT cada año?

Tengo la puntuación de 720 Matemáticas nivel 2,720 Física y 1210 SAT. ¿Es mi puntaje suficiente para las mejores universidades de ingeniería?

¿Cuál es la buena puntuación del SAT para obtener en las mejores universidades?

¿Cuáles son las mejores maneras más rápidas de mejorar mucho en el SAT?

¿Cuándo debo tomar mis exámenes de materia SAT?

Dependiendo de la puntuación del SAT, ¿cuál es la beca máxima que se puede obtener en el MIT?

Cómo prepararse para el SAT de nivel 2 de matemáticas sin un libro

¿Cuáles son algunos consejos y sugerencias que le gustaría dar de su experiencia SAT?

¿Cuántos puntos puedo mejorar mi puntuación SAT en 4 meses?

Mi puntaje actual en el SAT es 1930. No he practicado durante 5 meses. Mi próximo examen es en una semana. ¿Qué tengo que hacer?

¿Debo volver a tomar mis exámenes de materia SAT?

¿Cómo un 1530 SAT y mis otros resultados de exámenes (en la descripción) buscan a un estudiante internacional cuya escuela no ofrece estos cursos?

¿Qué tan probable es que una universidad te acepte si tu promedio de calificaciones es más bajo que el de ellos, pero tu puntuación en el SAT / ACT es más alta / en el lugar que ellos quieren? ¿O viceversa?