A continuación, se incluye una recopilación de extractos del manual “Diseño de evaluación” que escribí para el sistema de ayuda de Illuminate Education, que refleja las mejores prácticas basadas en la investigación para preguntas de examen y cada examen en su totalidad:
CADA PREGUNTA
Además de las respuestas de otros sobre el examen en su conjunto, existen mejores prácticas para cada pregunta del examen.
Contenido
Cada pregunta debe estar diseñada para medir algo específico. Si una pregunta mide demasiadas cosas, no sabrá dónde está luchando un estudiante cuando se pierde la pregunta. La pregunta también debe coincidir con el estándar de contenido (en evaluación) en términos de contenido . Los estándares de contenido más utilizados en la educación K-12 son actualmente la CCSS (Common Core State Standards Initiative). Por ejemplo , si el estándar de contenido requiere una fábula estadounidense, ¿la pregunta se relaciona con una fábula estadounidense?
Rigor
La pregunta debe coincidir con la norma en términos de rigor . Por ejemplo , si la norma requiere que los estudiantes evalúen los argumentos que contribuyen al desarrollo de la Constitución, la pregunta debe requerir que los estudiantes evalúen . Considere el nivel de taxonomía de Bloom de la norma que se está evaluando.
Vocabulario
El vocabulario debe ser apropiado para el nivel estándar que se está evaluando. No debes convertir la evaluación en una prueba de vocabulario. En otras palabras, no debe incluir un alto vocabulario académico que no sea apropiado para el estándar que se está evaluando; de lo contrario, sus resultados podrían implicar que los estudiantes tienen dificultades con un estándar cuando, de hecho, estaban teniendo dificultades con el idioma. Sin embargo (y este es un gran “sin embargo”), recuerde que el vocabulario debe ser apropiado para el estándar, y que debe usar los términos que el estándar y / o la vida real requerirán junto con el concepto (es decir, no se refiera a restar como “para llevar” en su examen porque esa es la forma en que se refiere a la sustracción cuando enseña – use terminología que el estudiante encontrará y debería entender). Si le preocupa que los Estudiantes de inglés y los estudiantes de educación especial que toman una prueba, recuerde que puede optar (de manera uniforme para todos los maestros que administran la prueba) a emular las prácticas de evaluación estatales de permitir el uso de glosarios de definición mientras se toma la prueba para algunos estudiantes
Claridad
La pregunta debe ser clara en lo que se está preguntando y lo más concisa posible. Además, no debe haber distractores engañosos (por ejemplo, no intente “engañar” a los estudiantes).
Libertad de sesgo
La pregunta debe estar libre de sesgos, lo que significa que los estudiantes de todos los orígenes deben tener las mismas oportunidades de hacerlo bien. Por ejemplo , ¿estarían los estudiantes en desventaja socioeconómica en desventaja debido a la falta de familiaridad con algo (por ejemplo, una analogía de remonte usada en una pregunta de cálculo de pendiente)? … o podrían confundirse los estudiantes no hispanos con el término Quinceañera?
Distractores significativos
Las opciones de respuesta equivocadas deben seleccionarse cuidadosamente en función de la probabilidad de su selección y la información que ofrecerán a los educadores después de la prueba. Considera este ejemplo :
14 x 6 =
A. 20
B. 30
C. 64
D. 84
- A me permitirá saber qué estudiantes agregaron en lugar de multiplicarse (tal vez necesiten ayuda para encontrar detalles o quizás no sepan cómo multiplicar).
- B me permitirá saber qué estudiantes multiplicaron 6 por cada número en 14 y luego sumaron los 2 juntos.
- C me permitirá saber qué estudiantes olvidaron llevar el 2 al multiplicar.
- D es la respuesta correcta.
Orden del distractor logico
Cuando las respuestas son numéricas, enumérelas de bajo a alto.
Redacción positiva
Las preguntas deben ser positivas en términos de cómo están redactadas y / o las implicaciones que hacen. Por ejemplo, evite usar los términos no , ninguno de los siguientes , excepto , etc., y si debe usar dichos términos, colóquelos en mayúsculas (por ejemplo, “NO”).
Independencia
Si bien las preguntas de opción múltiple pueden compartir el mismo material de estímulo, todas las preguntas deben funcionar de forma independiente. Por ejemplo, responder a una pregunta correctamente no debe depender de haber respondido correctamente a una pregunta anterior, ni debe basarse en (o ser ayudado por) la información revelada en otra pregunta (dentro de las opciones de respuestas).
Considere todo lo siguiente en la forma de formato:
Contexto
Considere el mejor contexto para hacer la pregunta. Tenga en cuenta que no todas las preguntas / elementos o evaluaciones deben involucrar opciones múltiples, pero tenga en cuenta la eficiencia y los recursos si es absolutamente necesario un formato diferente. En otras palabras, no abandone la opción múltiple simplemente porque no le “gusta” la opción múltiple; más bien, abandónelo si realmente no es la mejor manera de evaluar un estándar (p. ej., un estándar de “Lenguas de Lenguaje y Lenguaje en Inglés” para escuchar y hablar, los miembros del personal tienen una sólida comprensión de las evaluaciones auténticas, etc.).
# de opciones de respuesta
En una prueba de opción múltiple, 2 o 4-5 opciones de respuesta es el número deseable. Evite 3 (más fácil de responder que 4) a menos que busque simplificar la prueba (por ejemplo, como la Evaluación Modificada de California es como una versión simplificada de la Prueba de Estándares de California para estudiantes de Educación Especial), ya que aumenta la probabilidad de que los estudiantes simplemente adivinen correctamente. Es mejor si todas las preguntas de la prueba contienen el mismo número de opciones de respuesta. Si esto no es posible, intente agrupar las preguntas con la misma cantidad de opciones de respuesta.
Longitud
Las opciones de respuesta deben tener aproximadamente la misma longitud. Las instrucciones dirigidas al alumno (p. Ej., “Lea el pasaje a continuación y responda a las preguntas que siguen”) o al administrador de la prueba (p. Ej., En los niveles elementales inferiores donde el maestro lee las preguntas a la clase) deben ser tan breves como directas. como sea posible.
MIRA
Puede optar por reflejar el aspecto de las evaluaciones estandarizadas en términos de cómo se numeran las preguntas, cómo se detallan las opciones de respuesta, cuántas columnas se usan, cuánto espacio en blanco hay en una página, etc. Si esta evaluación es una de una serie, todos deben mantener una mirada cohesiva.
Recuerde que si bien hay numerosas ventajas en las pruebas de opción múltiple (por ejemplo, son un buen comienzo para un programa de evaluación, especialmente si sus colegas se resisten, mantienen el objetivo de la puntuación, facilitan la retroalimentación instantánea para los estudiantes / padres / educadores, salvan a los educadores tiempo, son rentables, etc.), también tienen limitaciones. Por lo tanto, su evaluación puede presentar una combinación de tipos de evaluación.
TOMAR EL EXAMEN
Está bien. Tome el examen, tal como lo haría un estudiante, preferiblemente una semana después de haber escrito o seleccionado las preguntas para él (o hacer que otros tomen la prueba que no participaron en la redacción / selección de las preguntas). Observe qué preguntas y secciones de exámenes son más fáciles, cuáles son las más difíciles, que podrían generar una confusión innecesaria para los estudiantes, etc.
A pesar de que ya se ha pensado detenidamente en cada pregunta, aún puede detectar problemas en esta etapa. Además, desea tener una idea del rigor y el equilibrio en general. ¿Ya ves cambios que deben hacerse?
BALANCE Y LA GRAN IMAGEN
Esta sección se aplica a la prueba en su totalidad y a sus secciones (no a preguntas individuales):
Amplitud / Alcance de la Norma
Las normas a menudo requieren múltiples cosas de los estudiantes. ¿Las preguntas en su prueba cubren adecuadamente la amplitud de la norma, o están limitadas a solo uno de sus aspectos? Incluso si las preguntas están bien elaboradas, es posible que deba reemplazar algunas preguntas con otras para evaluar minuciosamente un estándar.
Rigor
¿La recopilación de preguntas que evalúa un estándar coincide con el rigor que requiere el estándar? Por ejemplo , si el estándar requiere que los estudiantes evalúen los argumentos que contribuyen al desarrollo de la Constitución, la prueba requiere que los estudiantes evalúen con éxito. Considere el nivel de taxonomía de Bloom de la norma que se está evaluando.
# de preguntas por estándar
Considere la evaluación como un todo, la guía de ritmo y la serie de evaluaciones como un todo. Por ejemplo , ¿la nota de la guía de ritmo esta evaluación debería cubrir 5 estándares, mientras que las pruebas de 20 preguntas contienen 11 preguntas sobre un estándar relativamente simple, dejando solo 9 preguntas para evaluar los 4 estándares restantes? Ese sería un problema que querrías remediar. Por lo general, se necesita un mínimo de 3-4 preguntas para evaluar con precisión el dominio de un estándar, aunque este número puede variar según el alcance y la complejidad del estándar. Si está reflejando planos o asignaciones de preguntas determinadas con anticipación, asegúrese de comparar la evaluación con estos.
Independencia
Si bien las preguntas de opción múltiple pueden compartir el mismo material de estímulo, todas las preguntas deben funcionar de forma independiente. Por ejemplo, responder a una pregunta correctamente no debe depender de haber respondido correctamente a una pregunta anterior, ni debe basarse en (o ser ayudado por) la información revelada en otra pregunta (dentro de las opciones de respuestas).
FORMATO
Considere todo lo siguiente en la forma de formato:
Instrucciones
Si hay instrucciones previas a la prueba para alumnos y profesores, ¿son lo más claras y breves posible?
Materiales de estimulo
Si los materiales de estímulo se utilizan para responder preguntas (p. Ej., Gráfico, tabla, pasaje, mapa, imagen, diagrama, etc.), ¿son las imágenes de buena calidad, claras, etc.? ¿Está clara su conexión con la (s) pregunta (es decir, sabrán los alumnos que tienen que usarlas para responder preguntas relacionadas)?