Национальная оценка прогресса в образовании (NAEP ) - это крупнейшая продолжающаяся и репрезентативная на национальном уровне оценка того, что студенты США знают и могут делать по различным предметам. NAEP - это проект, утвержденный Конгрессом США, который реализуется Национальным центром статистики образования (NCES) в рамках Института педагогических наук (IES) штата США. Департамент образования. Первое национальное управление NAEP произошло в 1969 году. Национальный совет управления оценкой (NAGB) - это независимый двухпартийный совет, который устанавливает политику NAEP и отвечает за разработку структуры и спецификаций тестов. Национальный совет управления оценкой, члены которого назначаются США Министр образования включает губернаторов, законодателей штатов, местных и государственных школьных чиновников, преподавателей, представителей бизнеса и представителей широкой общественности. В 1988 году Конгресс учредил Управляющий совет из 26 членов.
Результаты NAEP предназначены для предоставления данных об успеваемости учащихся по различным предметам на уровне группы и публикуются в виде табеля успеваемости нации. Нет результатов для отдельных учащихся, классов или школ. NAEP сообщает результаты для различных демографических групп, включая пол, социально-экономический статус и расу / этническую принадлежность. Чаще всего оценки даются по математике, чтению, естествознанию и письму. Другие предметы, такие как искусство, обществоведение, экономика, география, технологии и инженерная грамотность (TEL) и США. история оценивается периодически.
Помимо оценки достижений учащихся по различным предметам, NAEP также проводит опросы учащихся, учителей и школьных администраторов, чтобы помочь предоставить контекстную информацию. Вопросы, касающиеся расы или этнической принадлежности участников, посещаемости школы и академических ожиданий, помогают политикам, исследователям и широкой общественности лучше понять результаты оценки.
Учителя, директора школ, родители, политики и исследователи - все используют результаты NAEP для оценки успеваемости учащихся по всей стране и разработки способов улучшения образования в Соединенных Штатах. NAEP предоставляет достоверные и надежные данные об успеваемости учащихся с 1969 года.
NAEP использует тщательно разработанную процедуру выборки, которая позволяет оценивать репрезентативность географических, расовых, этнических и социально-экономических факторов. разнообразие школ и студентов в Соединенных Штатах. Также предоставляются данные об учащихся с ограниченными возможностями и изучающих английский язык. Поскольку оценки NAEP проводятся единообразно для всех участвующих студентов с использованием одних и тех же тестовых буклетов и идентичных процедур по всей стране, результаты NAEP служат общей метрикой для штатов и выбранных городских округов, которые участвуют в оценке.
Существует два веб-сайта NAEP: веб-сайт NCES NAEP и веб-сайт табеля успеваемости нации. На первом сайте программа NAEP подробно описана, а на втором основное внимание уделяется отдельным выпускам данных.
NAEP началась в 1964 году с гранта от корпорации Карнеги на создание Исследовательского комитета по оценке прогресса в образовании (ESCAPE). Первые общенациональные оценки были проведены в 1969 году. Добровольные оценки для штатов начались в 1990 году на экспериментальной основе, а в 1996 году стали постоянным элементом NAEP и проводились каждые два года. В 2002 году отдельные городские округа участвовали в оценках на уровне штата на экспериментальной основе и продолжаются в качестве пробной оценки городских округов (TUDA).
В разработке успешной программы NAEP принимали участие многие, включая исследователей, государственных служащих системы образования, подрядчиков, политиков, студентов и учителей.
Есть два типа оценок NAEP, основной NAEP и долгосрочный тренд NAEP. Такое разделение позволяет достичь двух целей:
Основные оценки NAEP проводятся по ряду предметов с участием учеников четвертого, восьмого и двенадцатого классов по всей стране. Чаще всего оценки даются по математике, чтению, естественным наукам и письму. Периодически оцениваются и другие предметы, такие как искусство, обществоведение, экономика, география, технологии и инженерная грамотность (TEL), а также история США.
Эти оценки соответствуют рамкам предметных областей, разработанным NAGB, и используют последние достижения в методологии оценки. В рамках основного NAEP результаты сообщаются на национальном уровне, а в некоторых случаях - на уровне штата и округа.
Национальный NAEP сообщает статистическую информацию об успеваемости учащихся и факторах, связанных с успеваемостью, для нации и для определенных демографических групп населения (например, раса / этническая принадлежность, пол). В него входят учащиеся как государственных, так и негосударственных (частных) школ, и, в зависимости от предмета, представлены результаты для 4, 8 и 12 классов.
Результаты NAEP штата доступны по некоторым предметам для 4 и 8 классы. Это позволяет государствам-участникам следить за своим прогрессом в математике, чтении, естествознании и письме с течением времени. Затем они могут сравнить знания и навыки своих студентов со студентами из других штатов и страны.
Оценки, которые даются в штатах, точно такие же, как и на национальном уровне. Традиционно NAEP штата оценивался только в 4 и 8 классах. Однако пилотная программа 2009 г. разрешила 11 штатов (Арканзас, Коннектикут, Флорида, Айдахо, Иллинойс, Айова, Массачусетс, Нью-Гэмпшир, Нью-Джерси, Южная Дакота и Западная Вирджиния). чтобы получить баллы на уровне двенадцатого класса.
В течение 1988 г. NAEP сообщал только об академических достижениях нации в целом и по демографическим группам населения. В 1988 году Конгресс принял закон, разрешающий добровольную оценку состояния дел. Отдельные репрезентативные выборки студентов были отобраны из каждого штата или юрисдикции, которые согласились участвовать в программе NAEP штата. Оценка состояния судебного разбирательства проводилась в 1990, 1992 и 1994 годах. Начиная с оценки 1996 года, санкционирующий статут больше не считал государственный компонент «судом».
Существенное изменение в штате NAEP произошло в 2001 году с повторным утверждением Закона о начальном и среднем образовании, также известного как Закон «Ни один ребенок не останется без внимания». Этот закон требует, чтобы штаты, получающие финансирование по Разделу I, каждые два года участвовали в оценках NAEP по математике и чтению в 4 и 8 классах. Участие штата в других предметах, оцениваемых NAEP штата (естествознание и письмо), остается добровольным.
Как и все оценки NAEP, NAEP штата не предоставляет индивидуальные баллы для оцениваемых учащихся или школ.
Пробная оценка городского округа (TUDA ) - это проект, разработанный для определения целесообразности использования NAEP для составления отчетов об успеваемости учащихся государственных школ на районном уровне. Согласно разрешению Конгресса, NAEP проводил тесты по математике, чтению, естествознанию и письму. выборкам студентов в сел районы городского типа.
TUDA началось с шести городских округов в 2002 году и с тех пор расширилось до 27 округов для цикла оценки 2017 года.
Долгосрочная тенденция NAEP применяется для 9-, 13-, и 17-летние периодически на национальном уровне. Оценка долгосрочных тенденций позволяет измерять успеваемость учащихся по математике и чтению и позволяет сравнивать успеваемость сегодняшних учащихся с успеваемостью учащихся с начала 1970-х годов.
Хотя долгосрочная тенденция и основной NAEP оценивают и математику, и чтение, между ними есть несколько различий. В частности, оценки различаются по оцениваемому содержанию, частоте проведения оценки и способу представления результатов. Эти и другие различия означают, что результаты долгосрочного тренда и основного NAEP нельзя сравнивать напрямую.
NAGB устанавливает календарь оценок NAEP. Пожалуйста, обратитесь к графику оценок для всех оценок NAEP с 1968 года и запланированных до 2017 года.
Основные оценки NAEP обычно проводятся примерно в течение шести недель с конца января до начала Март каждого года. Оценка долгосрочных тенденций обычно проводится каждые четыре года по возрастным группам с октября по май. Все оценки проводятся нанятыми NAEP полевыми сотрудниками по всей стране.
NAEP проводится в партнерстве со штатами. Программа NAEP обеспечивает финансирование штатных НСК в каждом штате. Он или она служит связующим звеном между NAEP, государственным образовательным агентством и школами, выбранными для участия.
НСК предоставляют множество важных услуг для программы NAEP и несут ответственность за:
В то время как большинство оценок NAEP проводится в формате, основанном на бумаге и карандаше, NAEP развивается для решения изменяющийся образовательный ландшафт в результате перехода к цифровым оценкам. NAEP использует новейшие доступные технологии для проведения оценок для студентов, и по мере развития технологий будет меняться и характер предоставления администраторов баз данных. Цель состоит в том, чтобы к концу десятилетия все оценки NAEP были безбумажными. Письменная оценка 2011 года была первой, полностью компьютеризированной.
В 2009 году ИКТ применялись в рамках научной оценки по бумаге и карандашу. Компьютерная доставка позволяет измерять научные знания, процессы и навыки, которые невозможно оценить в других режимах. В задачи входило проведение исследований, включающих наблюдения за явлениями, которые в противном случае потребовали бы много времени, моделирование явлений в очень больших масштабах или невидимых невооруженным глазом, а также изучение обширных справочных документов.
В этом специальном исследовании по многоэтапному тестированию, реализованному в 2011 году, исследовалось использование принципов адаптивного тестирования в контексте NAEP. Некоторым учащимся была предложена онлайн-оценка по математике, которая адаптируется к их уровню способностей. Все предметы в исследовании являются существующими предметами NAEP.
Система оценки TEL описывает технологическую и инженерную грамотность как способность использовать, понимать и оценивать технологии, а также понимать необходимые технологические принципы и стратегии для разработки решений и достижения целей. Оценка проводится по трем направлениям:
Учащиеся восьмиклассников по всей стране прошли тестирование зимой 2014 года. Результаты этого теста были опубликованы в мае 2016 года.
В 2011 году NAEP перешла в экзаменах по письму (в 8 и 12 классах) с бумаги и карандаша на компьютерное администрирование, чтобы измерить способность учащихся писать с помощью компьютера. В оценке используются многие функции современных цифровых технологий, а задания предоставляются в мультимедийных форматах, таких как короткие видео и аудио. Кроме того, чтобы охватить как можно больше студентов, компьютерная система оценивания по письму включает в себя несколько функций универсального дизайна, таких как преобразование текста в речь, регулируемый размер шрифта и электронная проверка орфографии.. В 2012 году NAEP опробовал компьютерное оценивание для учеников 4 класса.
Помимо оценок, NAEP координирует ряд связанных специальных исследований, которые часто включают специальные процессы сбора данных, вторичный анализ результатов NAEP и оценка технических процедур.
Разрыв в успеваемости возникает, когда одна группа студентов превосходит другую группу и разница в средних баллах для двух групп является статистически значимой (то есть больше, чем предел погрешности). В первоначальных выпусках отчетов NAEP подчеркивает пробелы в успеваемости по студенческим группам. Однако NAEP также выпускает ряд отчетов и сводок данных, в которых подчеркивается разрыв в достижениях. - Некоторые примеры включают школьную композицию и разницу в успеваемости между черными и белыми, а также показатели разницы в успеваемости между испаноязычными и белыми и черными и белыми. В этих публикациях используются оценки NAEP по математике и / или чтению для этих групп, чтобы либо предоставить сводку данных, либо выявить закономерности и изменения в этих пробелах с течением времени. Отчеты об исследованиях, такие как "Состав школы" и "Разрыв в достижениях черно-белых", также содержат предостережения и предостережения при интерпретации данных.
HSTS исследует взаимосвязь между достижениями NAEP в 12 классе и академической карьерой в старшей школе путем изучения учебных программ, которым следуют в старших классах нашей страны. школ и моделей прохождения курсов старшеклассниками через сборник стенограмм. В недавних исследованиях особое внимание уделялось образованию STEM и тому, как оно соотносится с успеваемостью учащихся по математическим и естественным оценкам NAEP.
Тенденции в международных исследованиях математики и естествознания (TIMSS) - международная оценка Международной ассоциации по оценке образовательных достижений (IEA).), который измеряет уровень обучения студентов математике и естественным наукам. NCES инициировал связующее исследование NAEP-TIMSS, чтобы штаты и отдельные округа могли сравнить успеваемость своих студентов с международными эталонными показателями. Исследование связывания было проведено в 2011 году в 8 классе по математике и естественным наукам. NCES будет «проецировать» баллы на уровне штата и округа по TIMSS по обоим предметам, используя данные NAEP.
NIES - это исследование, состоящее из двух частей, предназначенное для описания условий обучения американских индейцев / коренных жителей Аляски в Соединенных Штатах. Состояния. Первая часть исследования состоит из результатов оценки по математике и чтению в 4 и 8 классах. Во второй части представлены результаты опроса, проведенного среди учащихся из числа американских индейцев / коренных жителей Аляски, их учителей и школьных администраторов. Опросы сосредоточены на культурном опыте учащихся в школе и за ее пределами.
В соответствии с повторным утверждением Закона о начальном и среднем образовании (ESEA) 1965 года в 2001 году, штаты разрабатывают свои собственные оценки и устанавливают свои собственные стандарты квалификации для измерения успеваемости учащихся. Каждый штат контролирует свои собственные программы оценивания, включая разработку собственных стандартов, что приводит к большим различиям между штатами в практике оценивания учащихся в масштабах штата. Эта вариативность создает проблему для понимания уровней успеваемости учащихся в Соединенных Штатах. С 2003 года NCES поддерживает исследования, сравнивающие стандарты квалификации NAEP со стандартами отдельных штатов. Оценки штатов помещаются в общую шкалу, определяемую оценками NAEP, что позволяет сравнивать стандарты квалификации штатов не только с NAEP, но и друг с другом. NCES выпустил отчет Mapping State Proficiency Standards с использованием государственных данных по математике и чтению в 2003, 2005, 2007, 2009 и совсем недавно в 2013 году.
На протяжении многих лет NCES проводил провели ряд других исследований, связанных с различными аспектами программы NAEP. Несколько исследований недавнего прошлого перечислены ниже:
Активное использование NAEP проверки статистических гипотез вызвало некоторую критику, связанную с интерпретация результатов. Например, в табеле успеваемости нации сообщается, что «в 2005 году мальчики превосходят девочек во всех трех классах» по результатам тестов по естествознанию 100 000 учащихся в каждом классе. Хайд и Линн раскритиковали это утверждение, потому что средняя разница составляла всего 4 из 300 пунктов, что подразумевает небольшой размер эффекта и сильно перекрывающиеся распределения. Они утверждают, что «небольшие различия в результатах NAEP и других исследований получают широкую огласку, усиливая тонкие, стойкие предубеждения».
Выбор NAEP того, какие ответы отмечать правильные или неправильные, также подвергался критике. Например, исторический вопрос, заданный по поводу решения 1954 года Браун против Совета по образованию, и прямо ссылается на решение 1954 года, которое выявило проблему, а не на решение 1955 года, предписывающее десегрегацию. NAEP попросил студентов «описать условия, которые было призвано исправить это решение 1954 года». Они неправильно отметили студентов, которые упомянули сегрегацию, не упомянув десегрегацию. Фактически вопрос задавался только о существующих условиях, а не о средствах правовой защиты, и в любом случае решение 1954 года не предписывало десегрегацию. Страна ждала до решения 1955 Brown II, чтобы услышать о «полностью преднамеренной скорости». Другой исторический вопрос указал на то, что студенты, которые знали, что США воевали с русскими, а также с китайцами и северокорейцами в Корейской войне, ошибались. Другие опубликованные вопросы по математике и письму подверглись аналогичной критике. Ответы по математике наказывают студентов, которые понимают отрицательные квадратные корни, проценты по ссудам и ошибки при экстраполяции графика за пределы данных.
Заявление NAEP об измерении критического мышления имеет также подверглись критике. Исследователи Калифорнийского университета в Лос-Анджелесе обнаружили, что студенты могут выбирать правильные ответы без критического мышления.
NAEP оценивает каждый тест статистическим методом, устанавливает пороговые значения для «базовых» и «профессиональных» стандартов и приводит примеры того, что учащиеся на каждом уровне выполнено на тесте. Процесс разработки тестов и стандартов подвергся критике со стороны Университета Западного Мичигана (1991), Национальной академии образования (1993), Счетной палаты правительства (1993), Национальная академия наук (1999), Американские исследовательские институты и RTI International (2007), Институт Брукингса (2007 и 2016), Центр тестирования Buros (2009) и Национальные академии наук, инженерии и медицины (2016).
Интерпретация Результаты NAEP были трудными: категория NAEP "хорошо" на тесте по чтению, даваемому четвероклассникам, отражает учащихся, которые хорошо справляются с тестом и находятся на уровне седьмого класса. Категория NAEP "хорошо" на тесте по математике для восьмиклассников отражает учащихся, которые хорошо сдали тест и находятся на уровне двенадцатого класса. Тот факт, что немногие восьмиклассники владеют этим стандартом и достигают уровня двенадцатого класса, был неверно истолкован как утверждение о том, что немногие восьмиклассники достигают даже восьмого класса. NAEP говорит: «Студенты, которые могут хорошо владеть предметом, учитывая обычное использование этого термина, могут не соответствовать требованиям к успеваемости на уровне достижений NAEP» Джеймс Харви, главный автор книги A Nation at Risk, говорит: «Трудно избежать вывода о том, что это слово было выбрано сознательно, чтобы сбить с толку политиков и общественность».