¿El año del asterisco? La propuesta de prueba de California subvierte la responsabilidad basada en las pruebas

A medida que los estados planean nuevas evaluaciones de estudiantes alineadas con los estándares comunes en la primavera de 2015, los legisladores están luchando para hacer la transición de sus programas de evaluación y rendición de cuentas. La semana pasada, los legisladores de California dieron un paso sin precedentes: votaron para descontinuar su prueba anterior y realizar una prueba de campo en todo el estado de la Evaluación Smarter Balanced Assessment en la primavera de 2014. De manera más controvertida, excluirán a muchos estudiantes elegibles de las pruebas y retendrán las calificaciones de distritos escolares, maestros o padres. Este aspecto del plan ha generado advertencias del Departamento de Educación de EE. UU., Lo que pone en riesgo los $ 1.5 mil millones en fondos federales anuales para el Título I del estado.



Es comprensible que el secretario Duncan esté ansioso por desalentar esos esfuerzos. Hay muchos estados en una posición similar a California, ya que planean participar en una prueba de campo con el consorcio Smarter Balanced o Partnership for Assessment of Readiness for College and Careers (PARCC) en la primavera. Si el secretario Duncan concediera una exención a California para su plan actual, es probable que otros estados sigan su ejemplo. Contrariamente a las percepciones de los legisladores y administradores en California, esto no es simplemente un enfrentamiento de rencor entre el Departamento de Educación de California y el Secretario Duncan (que se han peleado antes). Por el contrario, esta disputa tiene implicaciones más amplias para la rendición de cuentas basada en pruebas en todo el país.

El 17 de septiembre, el Departamento de Educación de EE. UU. Emitió una nueva guía para los estados, indicando que podían esperar que una exención sustituyera cualquiera de las pruebas de campo por sus pruebas estatales existentes, siempre que los estudiantes elegibles en el estado tomaran una evaluación de inglés y matemáticas. . En una concesión significativa, no se requeriría que los estados reporten los puntajes de los estudiantes que toman la prueba de campo. A los efectos de la rendición de cuentas, las escuelas que realizan pruebas de campo podrían usar sus puntajes de 2012-13 en los grados relevantes. Implícita en la guía está la suposición de que los estados administrarán la prueba de campo a un número limitado de escuelas o aulas.



Al menos hasta que California anunció sus planes recientemente, la mayoría de los miembros del consorcio Smarter Balanced planeaban hacer precisamente eso: administrar la prueba de campo a una muestra del 10 por ciento de estudiantes y mantener las pruebas existentes un año más para la gran mayoría de los estudiantes.

Pero muchos en California (y quizás en otros estados) no estarán satisfechos con la nueva guía. Argumentarán que tiene más sentido zarpar hacia los nuevos estándares ahora, para permitir que los maestros y las escuelas comiencen a prepararse para las expectativas más altas del Common Core. Al mismo tiempo, argumentan que sería injusto responsabilizar a los profesores, las escuelas y los estudiantes por su desempeño durante este período de transición. Si eligen seguir este curso, deben rediseñar sus pruebas de campo para que funcionen como evaluaciones estatales y proporcionar puntajes a los estudiantes y escuelas.



El plan de California

Los líderes de Sacramento han tomado lo que fue diseñado para ser una prueba de campo limitada de la nueva evaluación y han intentado extenderla para cubrir a lo largo y ancho de California. No encaja, porque la prueba de campo nunca fue diseñada para ser una evaluación estatal.

Muchos otros han señalado las fallas de la propuesta: los distritos escolares que no están preparados para la versión electrónica pueden no tener la opción de papel y lápiz; muchos estudiantes tomarán el examen de matemáticas o ELA, pero no ambos.



¿Por qué teoría es famoso Charles Darwin?

Sin embargo, hay otras cuestiones que han atraído sorprendentemente poca atención. Por ejemplo, no está claro cuánto aprenderán los maestros, los estudiantes y los padres durante este año intermedio si no se les da a conocer sus resultados. En baloncesto, un tiro de práctica es beneficioso solo cuando se ve si la pelota entra o no. Según la propuesta, el estado pide a los estudiantes y maestros que realicen tiros de práctica en la oscuridad.

Quizás lo más importante, para los propósitos de la prueba de campo, los diseñadores de pruebas solo necesitan respuestas del 10 por ciento de los estudiantes de California en cada materia. (Si los estudiantes tomaran ambas pruebas, esto sería el 10 por ciento de los estudiantes; si los estudiantes tomaran ELA o matemáticas (pero no ambas), esto sería el 20 por ciento de los estudiantes de California). No está claro si los desarrolladores de las pruebas incluso calificarían el resto pruebas! Entonces, podría haber millones de estudiantes en California que dediquen 3.5 horas a tomar una prueba de materia que nunca se calificará. (Dado que las puntuaciones se retendrían de todos modos, supongo que lo único más irracional sería hacer el gran gasto de puntuar todas las pruebas y luego retener las puntuaciones).

Rediseño de la prueba de campo para que funcione en todo el estado



Aquellos que abogan por una transición más temprana a una evaluación alineada con los Estándares Comunes tienen razón. También tienen un punto de que una moratoria sobre las apuestas altas podría ser apropiada durante un año de transición. Sin embargo, sería un desperdicio no usar el año de transición para decirles a los estudiantes, maestros y padres cuál es su posición en relación con los nuevos estándares, y eso significa darles a todos los estudiantes la oportunidad de participar en la prueba, calificando todas sus pruebas y proporcionándoles con una puntuación.

Aquí hay una opción que estaría disponible ahora: (i) Administrar las nuevas evaluaciones a todos los estudiantes elegibles; (ii) Califique las evaluaciones para un 10 por ciento de estudiantes elegidos al azar; (iii) Estimar los parámetros del artículo y descartar los artículos que no funcionaron como se esperaba; (iv) Regrese y califique las pruebas restantes para el 90 por ciento restante de estudiantes; (v) Proporcionar puntajes reducidos a los distritos escolares, padres y maestros.

Aparentemente, un socio estatal en el consorcio Smarter Balanced está considerando esta opción (aunque su nombre se ha retenido a la espera de una decisión final).



Sin embargo, los líderes del consorcio Smarter Balanced han estado desanimando a los estados para que lo hagan. ¿Por qué? Hay dos razones. Primero, la prueba de campo ha sido diseñada para evaluar elementos individuales, no para proporcionar puntajes escalonados confiables para estudiantes individuales. Una de las consideraciones clave en el diseño de una prueba de campo es la cantidad de elementos comunes compartidos en los múltiples formularios. Cuanto más grande sea el bloque de elementos comunes, más confiable será la puntuación escalada para los estudiantes individuales. Sin embargo, cuando la cantidad de elementos comunes es grande, el tamaño de la muestra disponible para los elementos no comunes se reduce. Cuando hay muchos elementos para evaluar y un número limitado de estudiantes disponibles, los diseñadores de la prueba deben limitar el tamaño del bloque de elementos comunes.

En 2015, la prueba Smarter Balanced tendrá un diseño adaptativo y las pruebas adaptativas requieren muchos elementos (porque cada estudiante recibirá elementos adaptados a su nivel de rendimiento). Como resultado, para probar una mayor cantidad de elementos, los diseñadores se vieron obligados a utilizar un bloque común relativamente pequeño de 10 elementos en la prueba de campo.

La pequeña cantidad de elementos comunes hace que los desarrolladores de pruebas se pongan nerviosos acerca de las puntuaciones resultantes a nivel de estudiante. Todavía es posible generar una puntuación escalada para cada alumno. Y la puntuación escaladaseráproporcionar información sobre la puntuación probable de un estudiante en las futuras evaluaciones Smarter Balanced. Pero no será tan confiable como lo será la evaluación final.

cual rey de inglaterra tuvo 6 esposas

Pero, por supuesto, el diseño actual de la prueba de campo se basa en la expectativa de que solo el 10 por ciento de la población estudiantil tomará la prueba. Si la prueba de campo fuera 10 veces más grande, permitiría un diseño diferente, con un conjunto más grande de elementos comunes, más formularios, menos elementos no comunes en cada formulario. Una prueba de campo típica está diseñada simplemente para probar los parámetros de un artículo. Pero, con el objetivo de darles a los estudiantes y maestros una ventaja en el Common Core, el estado está pidiendo algo que el diseño típico de una prueba de campo no puede ofrecer. Una prueba rediseñada en todo el estado de la evaluación Smarter Balanced podría cumplir la función típica de una prueba de campo y generar puntajes más confiables a nivel de estudiante.

La segunda razón por la que el consorcio Smarter Balanced ha desalentado este enfoque es política. El liderazgo de Smarter Balanced está interesado principalmente en estimar los parámetros de los elementos, no en generar puntajes a nivel de los estudiantes. El valor informativo para los estudiantes, maestros y padres de California no es su principal preocupación. Además, si describen un plan para generar puntajes a nivel de estudiante como viable, corren el riesgo de alienar los intereses organizados en California que disfrutan de la perspectiva de un año sin puntajes de exámenes (¡incluso si no es un año sin exámenes!). Por lo tanto, se ha vuelto políticamente conveniente para ellos afirmar que cualquier puntaje no tendría sentido, incluso si lo saben mejor.

Por lo tanto, si California u otro estado estuviera ansioso por acelerar la transición a los Estándares Básicos Comunes, no debería intentar extender una prueba de campo limitada para servir en todo el estado, debería rediseñar la prueba de campo, eliminar los elementos que funcionan mal y producir a nivel de estudiante puntajes escalados logrando un nivel mínimo de confiabilidad. La cuestión de cómo se usan esas pruebas, y si alguna exención permite una moratoria en el uso de esas pruebas para propósitos de alto riesgo, es un tema aparte. En ausencia de tal avance, el 2014 puede convertirse en el año del asterisco en CA y, potencialmente, también en otros estados.