что такое тестирование в образовании
Тестирование в учебном процессе: его история и возможности
Автор: Иван Подласый | Источник: Элитариум
Качество обучения напрямую зависит от количества, глубины, своевременности и объективности оценки получаемых знаний и навыков. Грамотно составленные тесты позволяют надежно определять уровень усвоения знаний и степень формирования навыков в процессе обучения.
Применение диагностических тестов в зарубежных школах имеет давнюю историю. Признанный авторитет в области педагогического тестирования Э. Торндайк (1874—1949) выделяет три этапа внедрения тестирования в практику американской школы:
1. Период поисков (1900—1915). На этом этапе происходило осознание и первоначальное внедрение тестов памяти, внимания, восприятия и других, предложенных французским психологом А. Бинэ. Разрабатываются и проверяются тесты интеллекта, позволяющие определять коэффициент умственного развития.
2. Последующие 15 лет — годы «шума» в развитии школьного тестирования, приведшие к окончательному осмыслению его роли и места, возможностей и ограничений. Были разработаны и внедрены тесты О. Стоуна по арифметике, Б. Зекингема для проверки правописания, Э. Торндайка по диагностике большинства школьных предметов. Т. Келли разработал способ измерения интересов и наклонностей обучаемых (при изучении алгебры), а Ч. Спирмен предложил общие основы использования корреляционного анализа для стандартизации тестов.
3. С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляются на повышение объективности тестов, создание непрерывной (сквозной) системы школьной тестовой диагностики, подчиненной единой идее и общим принципах, созданию новых, более совершенных средств предъявления и обработки тестов, накопления и использования диагностической информации.
Напомним в связи с этим, что педагогика, развившаяся в России в начале века, безоговорочно приняла тестовую основу объективного школьного контроля.
После известного постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпроса» (1936) были ликвидированы не только интеллектуальные, но и безобидные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.
В школах развитых стран внедрение и совершенствование тестов шло быстрыми темпами. Широкое распространение получили диагностические тесты успеваемости, использующие форму альтернативного выбора правильного ответа из нескольких правдоподобных, написания очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т. п. С помощью этих несложных заданий удается накапливать значительный статистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые предъявляются к тестовой проверке. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на цифровых носителях.
Проблема соотношения устных и письменных форм контроля разрешается в большинстве случаев в пользу последних. Считается, что хотя устный контроль больше способствует выработке быстрой реакции на вопросы, развивает связную речь, он не обеспечивает надлежащей объективности. Письменная проверка, обеспечивая более высокую объективность, кроме того, способствует развитию логического мышления, целенаправленности: обучаемый при письменном контроле более сосредоточен, он глубже вникает в сущность вопроса, обдумывает варианты решения и построения ответа. Письменный контроль приучает к точности, лаконичности, связности изложения мыслей.
В области определения системы оценок (отметок) наблюдается большое разнообразие как в принципах, так и в конкретных подходах, выборе способов оценивания и выставлений оценок. В зарубежных образовательных заведениях практикуются различные системы оценивания знаний, умений, навыков, приняты различные шкалы оценок, включая сто-, двенадцати-, десяти-, двухбалльную и др. Во французском лицее, например, при сдаче выпускных экзаменов результаты определяются по 20-балльной шкале. При этом для каждого предмета устанавливается определенный весовой коэффициент, определяющий значимость данного предмета для избранной обучаемым специальности, профиля или отделения лицея. Благодаря этому оценки по профилирующим предметам приобретают большую весомость.
При значительной децентрализации большинства зарубежных образовательных систем, при условии свободного выбора школой учебных планов и программ, а обучаемыми — учебных предметов редко проводятся централизованные проверки и оценивание знаний, умений. В Великобритании, например, функцию практического контроля за качеством академической подготовки берут на себя университетские комиссии, к которым на период сдачи выпускных экзаменов прикрепляются все грамматические и привилегированные школы, ориентирующиеся в подготовке своих выпускников на дальнейшее университетское образование.
В целом же нужно признать, контроль и учет успеваемости, диагностирование обученности в зарубежных школах носят характер объективной констатации результатов. Он не предполагает заботу о всеобуче. Общепринятый принцип индивидуализации обучения диктует один подход — каждый идет своим путем и темпом, обучается в меру своих возможностей, потребностей, реальных оценок будущего.
До революции в России существовала шестибалльная система оценки знаний с баллами от нуля до пяти. В 1918 г. оценка «0» была упразднена. Но постепенно и оценка «1» стала использоваться все реже, а начиная с 50-х годов все меньше стала использоваться и оценка «2». Пятибалльная система оценок фактически превратилась в трехбалльную, а для большинства обучаемых, которые не могут учиться на «4» и «5», эта шкала стала двухбалльной. Такая оценочная система очень слабо стимулирует учебный труд, «ступенька» между тройкой и четверкой непреодолима для большинства обучаемых.
Однако многие педагоги используют «дополнения» к обычной пятибалльной шкале в виде знаков «плюс», «минус». Реально получается три градации пятерки («пять с плюсом», «пять», «пять с минусом»), три градации четверки (аналогично), три градации тройки и двойки. Получается типичная десятибалльная шкала оценок.
Научно-исследовательские учреждения РАО предложили новые оценочные шкалы, которые проходят экспериментальную проверку в различных регионах страны. Некоторые регионы склонны принять двенадцатибалльную систему оценок, в которой кроме названных десяти баллов существует два экстремальных: балл «1» — «спасайте» — свидетельствует о том, что учащийся требует немедленной индивидуальной помощи или особенного внимания, вплоть до помещения в специальное учебное учреждение; высший балл «12» — экстремальный максимум («ура»), свидетельствующий о появлении способного и чрезвычайно одаренного учащегося, которого следует обучать индивидуально по специальной программе или же в учебном заведении с углубленным изучением предметов.
Тестирование достижений и развития
Слово «тест» английского происхождения и на языке оригинала означает «испытание», «проверка». Тест обученности — это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения.
Правильно составленные тесты обученности должны удовлетворять ряду требований. Они должны быть:
- относительно краткосрочными, т. е. не требовать больших затрат времени; однозначными, т. е. не допускать произвольного толкования тестового задания; правильными, т. е. исключать возможность формулирования многозначных ответов; относительно краткими, требующими сжатых ответов; информационными, т. е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалой измерений; удобными, т. е. пригодными для быстрой математической обработки результатов; стандартными, т. е. пригодными для широкого практического использования — измерения уровня обученности возможно более широких контингентов обучаемых, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.
Если в основу классификации тестов положить различные аспекты (компоненты) развития и формирования человеческих качеств, то она будет выглядеть следующим образом:
1. Тесты общих умственных способностей, умственного развития.
2. Тесты специальных способностей в различных областях деятельности.
3. Тесты обученности, успеваемости, академических достижений.
4. Тесты для определения отдельных качеств (черт) личности (памяти, мышления, характера и др.).
5. Тесты для определения уровня воспитанности (сформированности общечеловеческих, нравственных, социальных и других качеств).
Применение тех или иных тестов будет наиболее успешным и обеспечит надежные выводы лишь при условии правильного их сочетания со всеми другими группами тестов. Поэтому тестовые испытания всегда имеют комплексный характер. Делать общие выводы, например, об уровне развития обучаемых на основе применения лишь тестов обученности было бы непростительной ошибкой. Когда ставится задача диагностирования обученности в связи с достижениями и развитием личности, нужно применять соответствующие виды тестовых заданий и предписанные им методики измерения, не забывая о локальном характере диагностирования.
При разработке тестов важно, насколько они соответствуют запроектированным целям обучения, образования, развития обучаемых. Важнейшими критериями диагностических тестов обученности являются действенность (валидность, показательность), надежность (вероятность, правильность), дифференцированность (различимость).
Действенность теста по своему содержанию близка к требованию полноты, всесторонности проверки, пропорционального представления всех элементов изучаемых знаний, умений. Термин «действенность» имеет, как минимум, два синонима — валидность (от англ. Valid — имеющий значение, ценный) и показательность, представительность, трактуемые так же, как репрезентативность. Всегда имеется в виду, что составитель теста обязан тщательно изучить все разделы учебной программы, учебные книги, хорошо знать цель и конкретные задачи обучения. Лишь тогда он сможет составить тесты, которые будут действенными для определенной категории обучаемых.
Четкая и ясная постановка вопроса в пределах освоенных знаний — неотъемлемое условие действенности теста. Если тест выходит за пределы освоенного содержания или же не достигает этих пределов, превышает запроектированный уровень обучения, то он не будет действенным для тех обучаемых, которым он адресован. Действенность теста определяется статистическими методами. Величина 0,7—0,9 свидетельствует о высокой действенности тестов обученности. Если же коэффициент корреляции достигает 0,45—0,55, то действенность теста считается удовлетворительной, при более низких значениях она считается неудовлетворительной.
Степень Надежности характеризуется стабильностью, устойчивостью показателей при повторных измерениях с помощью того же теста или его равноценного заменителя. Количественно этот показатель характеризуется вероятностью достижения запроектированных результатов (правильностью значений). Грамотно составленные и апробированные тесты обученности позволяют достичь коэффициента надежности 0,9. Установлено, что надежность теста повышается при увеличении количества тестовых заданий.
Установлено также, что чем выше тематическое, содержательное разнообразие тестовых заданий, тем ниже надежность теста. Это следует понимать так: тест, нацеленный на проверку усвоения конкретной темы, всегда будет более надежным, чем тест, направленный на проверку всего раздела (курса), охватывающий значительное количество материала — закономерностей, концепций, фактов. Происходит это именно потому, что содержательное разнообразие последнего выше.
Надежность тестов обученности значительно зависит от трудности их выполнения. Трудность определяется по соотношению правильных и неправильных ответов на тестовые вопросы. Включение в состав тестов таких заданий, на которые все обучаемые отвечают правильно или же, наоборот, неправильно, резко снижает надежность теста в целом. Наибольшую практическую ценность имеют задания, на которые правильно отвечают 45—80% обучаемых.
Характеристика Дифференцированности (различимости) связана с использованием таких тестов, где нужно выбирать правильный ответ из нескольких возможных альтернатив. Если, скажем, все учащиеся безошибочно находят правильный ответ на один вопрос и также дружно не могут ответить на другой, то это сигнал для совершенствования теста в целом. Его необходимо дифференцировать, сделать различимым. Иначе подобные задания не помогут отделить тех, кто усвоил материал на необходимом уровне, от тех, кто заданного уровня не достиг. Практически дифференцируют тесты по результатам статистического анализа, сравнивая результаты выполнения теста в целом с результатами выполнения отдельных заданий. Если коэффициент корреляции между ответами на конкретные задания и на тест в целом больше 0,5, то это свидетельствует о достаточной дифференцированности теста.
При подготовке материалов для тестового контроля необходимо придерживаться таких основных правил:
1. Нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися.
2. Неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными.
3. Правильные ответы среди всех предлагаемых ответов должны размещаться в случайном порядке.
4. Вопросы не должны повторять формулировок учебника.
5. Ответы на одни вопросы не должны быть подсказками для ответов на другие.
6. Вопросы не должны содержать «ловушек».
Тесты обученности применяются на всех этапах дидактического процесса. С их помощью обеспечивается предварительный, текущий, тематический и итоговый контроль знаний, умений, учет успеваемости, академических достижений.
Предварительный контроль. Успех изучения любой темы (раздела или курса) зависит от степени усвоения тех понятий, терминов, положений и т. д., которые изучались на предшествующих этапах обучения. Если информации об этом у преподавателя нет, то он лишен возможности проектирования и управления в учебном процессе, выбора оптимального его варианта. Необходимую информацию преподаватель получает, применяя предварительный контроль (учет) знаний. Последний необходим еще и для того, чтобы зафиксировать (сделать срез) исходный уровень обученности. Сравнение исходного начального уровня обученности с конечным (достигнутым) позволяет измерять «прирост» знаний, степень сформированности умений и навыков. Если известны входные и выходные характеристики системы, проблемы ее оптимизации считаются во многом решенными.
Собрать максимальный объем информации о входных характеристиках обученности и оценить их в количественных показателях удается с помощью тестирования, которое осуществляется с помощью специально разработанных для этой цели заданий.
Текущий контроль. Он необходим для диагностирования хода дидактического процесса, выявления динамики последнего, сопоставления реально достигнутых на отдельных этапах результатов с запроектированными. Кроме собственно прогностической функции текущий контроль и учет знаний, умений стимулирует учебный труд учащихся, способствует своевременному определению пробелов в усвоении материала, повышению общей продуктивности учебного труда.
Тематический контроль. Составление тематического тестового задания требует кропотливого и тщательного труда. Ведь речь идет не просто о проверке усвоения отдельных элементов, а о понимании системы, объединяющей эти элементы. Значительную роль при этом играют синтетические, комплексные задания, объединяющие вопросы об отдельных понятиях темы, направленные на выявление информационных связей между ними.
Итоговый контроль. Осуществляется во время заключительного повторения, а также в процессе экзаменов (зачетов). Именно на этом этапе дидактического процесса систематизируется и обобщается учебный материал. С высокой успешностью могут быть применены соответствующим образом составленные тесты обученности.
Естественно, не все необходимые характеристики усвоения можно получить средствами тестирования. Такие, например, показатели, как умение конкретизировать свой ответ примерами, знание фактов, умение связно, логически и доказательно выражать свои мысли, некоторые другие характеристики знаний, умений, навыков диагностировать тестированием невозможно. Это значит, что тестирование должно обязательно сочетаться с другими традиционными формами и методами проверки.
Автор: эксперт Иван Павлович Подласый, профессор, доктор педагогических наук, Челябинский государственный педагогический университет.
Статья «Педагогическое тестирование как форма контроля знаний учащихся»
Педагогическое тестирование как форма контроля знаний учащихся.
1. Современное представление о тестировании
Педагогическое тестирование – это способ измерения знаний учащихся, основанный на использовании педагогических тестов. Включает в себя подготовку качественных тестов, проведение тестирования и обработку результатов, которая даёт оценку обученности тестируемых. (18)
Педагогический тест – это инструмент оценивания обученности учащихся, состоящий из системы тестовых заданий, стандартизованной процедуры проведения, обработки и анализа результатов. (18)
Педагогический тест представляет систему равномерно возрастающих по своей сложности заданий, позволяющую оценить уровень обученности тестируемых.
Задания теста имеют системообразующие свойства: они принадлежат к одной и той же системе знаний, т.е. к одной учебной дисциплине, они связаны и упорядочены.
Задания педагогического теста идут в порядке возрастания их трудности – это является главным формальным системообразующим признаком теста, однако тест не стоит воспринимать только как совокупность заданий с возрастающей трудностью, не учитывая их содержание.
Задания тестов имеют специфическую форму и представляют собой высказывания, истинные или ложные, в зависимости от ответов.
В тесте используется только тот материал, который содержится в учебной дисциплине. Все остальное не может быть включено в педагогический тест, так же, как и оценка интеллектуального уровня ученика, которая является предметом психологического измерения.
Ответ на задание – это краткое суждение, связанное с текстом задания своим содержанием и формой. Критерии правильности ответов определяются самими авторами тестовых заданий. Крайне редко в тестах присутствуют задания, в которых оценка ответов производится по степени их правильности, однако в случае необходимости можно разработать задания, ответы на которые будут верны в разной степени. В таких случаях текст задания может быть таким: «Выберите наиболее правильный ответ…». (13)
Тестовая проверка знаний – это форма закрепления, уточнения, осмысления и систематизации материала. ( 5 )
Следовательно, тест – это:
Форма педагогического контроля работы учащегося (проверяются организация и методика его самостоятельной домашней подготовки, качество знаний и умений по уже пройденному материалу);
Форма воспитания у учащихся умения правильно применять свои знания и умения;
Форма стимуляции к регулярным занятиям;
Форма самоконтроля. ( 5 )
2 Классификация тестов
Все тесты можно разделить на две категории:
Традиционные тесты состоят из списка вопросов и разных вариантов ответов. За ответ на каждый вопрос присваивается установленное количество баллов. Результат такого теста зависит от количества правильных ответов. Аванесов В. С. (15) Дает следующее определение традиционному тесту:
«Традиционный тест – это система заданий, предъявляемая в порядке увеличения сложности в одно и то же время, с одинаковой системой оценивания для всех тестируемых».
Традиционный тест является объединением трех систем:
Системы знаний, описываемой языком проверяемой учебной дисциплины;
Формальной системы заданий возрастающей сложности, описываемой значениями долей неправильных ответов и другими показателями;
Статистических характеристик заданий и результатов испытуемых.
Среди традиционных тестов различают гомогенные и гетерогенные. Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания – система, предназначенная для объективной, качественной, и эффективной оценки структуры и измерения уровня обученности учащихся в рамках одной учебной дисциплины. Определение гомогенного теста практически совпадает с определением традиционного теста.
Гомогенные тесты наиболее распространены. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу. В гомогенном педагогическом тесте недопустимо использование заданий, выявляющих другие свойства. Это нарушает требование дисциплинарной чистоты педагогического теста: каждый тест измеряет что-то заранее определенное.
Адаптивные тесты – это особые тесты, задания которых соответствуют уровню подготовленности испытуемых. (12)
Целесообразность применения такого вида тестов вытекает из необходимости рационализации традиционного тестирования: хорошо подготовленному ученику нет необходимости давать слишком простые задания, потому что слишком велика вероятность правильного ответа. Легкие материалы не имеют развивающего потенциала. Аналогично, также не имеет смысла давать задания высокой трудности слабо подготовленному ученику.
Использование таких заданий существенно повышает точность измерений и уменьшает время индивидуальной проверки примерно до 5-10 минут.
Адаптивный тест представляет собой вариант автоматизированной системы тестирования, в которой заранее известны параметры трудности и дифференцирующей способности каждого задания.
По уровню усвоения знаний, умений и навыков тесты разделены на три уровня:
тесты первого уровня – их рекомендуется проводить для промежуточного контроля знаний студентов в рамках чтения одного определённого курса;
тесты второго уровня – при промежуточном контроле по основным разделам курсов, без знания которых понимание дисциплины либо затруднено, либо вообще непонятно;
тесты третьего уровня – при итоговом контроле за весь курс.
Тесты первого уровня, в свою очередь, подразделяются на:
тесты опознания (предлагают вопросы, требующие альтернативного ответа);
тесты различения (вместе с заданием содержатся ответы, из которых студенты должны выбрать один или несколько);
тесты соотнесения (предлагают найти общности или различия в изученных объектах);
тесты-задачи с выборочными ответами (в задании формулируется условие задачи и все необходимые исходные данные, в ответах представлено несколько вариантов результата решения в числовом или буквенном виде).
Существуют также и другие классификации тестов:
по целям – информационные, диагностические, обучающие, мотивационные, аттестационные;
по процедуре создания – стандартизованные, не стандартизованные;
по способу формирования заданий – детерминированные, стохастические, динамические;
по технологии проведения – бумажные, в том числе бумажные с использованием оптического распознавания, натурные, с использованием специальной аппаратуры, компьютерные;
по форме заданий – закрытого типа, открытого типа, установление соответствия, упорядочивание последовательности
по количеству заданий – короткие (до 20 заданий), средние (20-500 заданий), длинные (более 500 заданий).
3 Виды тестовых заданий
Тестовое задание – это составная единица теста, отвечающая требованиям к заданиям в тестовой форме и, кроме того, математико-статистическим требованиям (известной трудности, дифференцирующей способности, положительной корреляции баллов задания с баллами по всему тесту и др.).
задания закрытой формы (с множественным выбором), в которых учащиеся выбирает правильный ответ из данного;
задания на дополнение (открытые задания), требующие самостоятельного получения ответов;
задания на установление соответствия (с множественным выбором), выполнение которых связано с выявлением соответствия между элементами нескольких множеств;
задание на установление правильной последовательности, в которых от учащегося требует указать порядок действий или процессов, перечисленных педагогами.
Задания закрытой формы.
Тестовое задание закрытой формы – это такое тестовое задание, в котором есть готовые ответы, из которых осуществляется выбор. Среди таких задание можно выделить несколько видов:
1) тестовые задания с выбором одного правильного ответа;
2) тестовые задания с выбором нескольких правильных ответов.
Под тестовым заданием с выбором одного правильного ответа понимают тестовое задание закрытой формы, в котором среди предложенных ответов лишь один правильный.
В заданиях с выбором одного правильного ответа можно выделить несколько подвидов. В.С. Аванесов (3) выделяет следующее:
1) задание с двумя вариантами ответов;
2) задания с тремя вариантами ответов;
3) задания с четырьмя видами ответов;
4) задания с пятью видами ответов.
Задания такой формы чаще других применяются на практике. По мнению некоторых авторов, именно они являются тестами. Причин столь широкого распространения этой формы тестовых заданий несколько:
1) сравнительная простота выполнения;
3) удобство для быстрого и автоматизированного контроля знаний.
При составлении тестовых заданий наиболее существенным является подбор вариантов ответов, называемых неправильными, которые расположены рядом с правильными. Считается, что эти варианты должны быть «правдоподобными». Неправильные, но правдоподобные ответы называется дистракторами (от анг. to distract – отвлекать). Если в задании имеется k ответов, то тогда ответ, доля выбора которого близка к значению 1/k – идеальный дистрактор; доля выбора меньше, чем 1/k – доминирующий дистрактор в задании. Современная практика показывает, что чаще всего можно встретить задания с одним правильным ответом, в которых предлагается 4 или 5 возможных ответов. Например, при использовании четырех вариантов ответов вероятность угадывания правильного ответа составляет 25%, а при пяти ответах – 20%.
Тестовые задания открытой формы.
Задания открытой формы – это задания, составленные без предоставления возможных вариантов ответа. Такие задания называют еще открытыми заданиями или заданиями на дополнение. Их выполнение требует от учащихся самостоятельно сформулировать ответ, а не выбрать готовый. Достоинством этих заданий в том, что они не допускают возможности угадывания.
Рекомендации к разработке заданий открытой формы:
добавляемое слово ставится в конце задания;
добавляемое слово является единственным;
все утверждения, по возможности, короткие.
Ответы учащиеся должны сформулировать сами, поэтому ответы не даются. Основной трудностью при составлении заданий открытого типа является соблюдение основного требования к тестовым заданиям – наличие однозначного правильного ответа.
Тестовые задания на установление соответствия.
Под тестовым заданием на установление соответствия понимают тестовое задание, в котором необходимо установить соответствие элементов одного множества элементами другого. При этом желательно, чтобы количество элементов в этих множествах было неодинаковым.
Тестовые задание на установление соответствия правильной последовательности.
Задание на соответствие требует установить соответствие каждого элемента одного множества элементами другого множества. Наиболее ценным является то, что такие задания позволяет определить среди других ассоциативную составляющую знаний, то есть знания взаимосвязи определений и факторов, авторов и произведений, характеристик и параметров различных приборов и устройств, связей между законами, формулами и т.д. Эти задания разрабатываются для проверки выработанности умений осуществлять последовательность процессов, действий и операций, выявления сформированности конкретных понятий. Вместе с заданием предлагается выбор правильных порядков следования.
Форма тестового задания определяется содержанием учебного материала. Необходимо стремиться к тому, чтобы в тестовом материале присутствовали задания всех форм. Если же одно и то же задание в различных формах выглядит в равной степени эффективным, рекомендуется выбрать форму, которая менее всего представлена в тесте, а также в которой задание формулируется более кратко и понятно, а вероятность угадывания правильных ответов меньше.
Достоверность результатов тестирования значительно зависит от качества составления тестовых заданий: от их содержания, формы представления, корректности формулировок. Существуют специальные требования, которых следует придерживаться авторам тестов:
Задания должны быть включены в одну тему.
Задания должны быть взаимосвязаны между собой.
Задания должны быть упорядоченными либо по трудности, либо по логике.
Форма теста должна быть единообразной, унифицированной, узнаваемой, удобной.
Термины, понятия, употребляемые в тестах, должны быть общеизвестны и строго соответствовать как требованиям программы, так и первоисточникам.
Последовательность тестовых заданий следует по принципу: от простого к более сложному.
Задания должны быть краткими (на обдумывание одного задания должно затрачиваться не более двух минут).
Из тестового задания должны быть исключены слова, не несущие смысловой нагрузки: чем лаконичнее задание теста, тем лучше.
Формулировать задание теста лучше всего в повествовательной форме: такая формулировка получится краткой в отличие от формулировки в вопросительной или повелительной форме.
Повторяющиеся слова и фразы лучше вынести в само задание: лучше длинное задание и короткие ответы, а не наоборот. При этом ключевое слово лучше перенести в начало текста задания.
Части задания должны быть грамматически согласованы, а задания – оформлены в едином стиле.
При каждом предъявлении тестового задания порядок расположения элементов из множества допустимых заключений может изменяться, поэтому элементы группы (т.е. задания и варианты ответов) не нумеруются.
Элементы тестового задания могут содержать текст, формулы, графические изображения, мультимедийные компоненты.
Общее количество заданий в тесте (база теста) должно превышать предполагаемую длину теста (выборку) как минимум в 10 раз. Например, если для прохождения тестирования предлагается 15 заданий, то база теста должна быть не менее 150 заданий. Только в этом случае каждому тестируемому будет предъявлен индивидуальный тест.
Типичные ошибки в формулировке тестовых заданий:
Формулировка задания в вопросительной форме.
Формулировка задания в повелительной форме.
Лишние слова в формулировке задания, громоздкая и трудно воспринимаемая конструкция задания.
Повторяющиеся слова в вариантах ответов.
Грамматическая несогласованность задания и вариантов ответа.
Правильный ответ резко отличается от остальных.
В тексте тестового задания содержится подсказка.
Варианты ответа неравнозначны.
Недостаточное количество дистракторов.
Отсутствие неверных ответов.
Ключевое слово находится не на первом месте в формулировке задания.
Начало формулировки тестового задания с предлога, вводных слов и конструкций.
5 Принципы разработки содержания теста
Содержание теста – это оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. (14)
Содержание школьного образования – это система знаний и опыта человечества, усвоение которой необходимо для повышения качества жизни и для последующего приобретения профессионального образования. Оно задается образовательными программами, которые выбираются добровольно самими учащимися. (14)
Из-за множества причин объем проверяемых знаний оказывается меньше объема знаний, усваиваемых в процессе обучения, хотя, казалось бы, хорошо отлаженная система тестовых заданий должна, в принципе, проверять все знания, которые предлагаются в учебном процессе.
Проверяемые знания – это знания, усвоение которых подлежит обязательному контролю в отдельно взятом образовательном учреждении. (14)
И тут возникает вопрос – какой же тест лучше всего подойдет для измерения интересующих знаний? Ответ таков: лучшим считается тест, содержание которого шире и охватывает более глубокие уровни знаний. Такое содержание опирается на следующие педагогические принципы.
Первый принцип разработки содержания теста – соответствие содержания целям тестирования. Если цель тестирования – отобрать самых подготовленных учеников, то задания должны быть трудные, потому что слабые ученики с такими заданиями не справятся. Если же требуется отсеять самых слабых, то сделать это лучше с помощью сравнительно легких заданий. При необходимости оценить испытуемых во всем диапазоне знаний – от низшего до высшего, в тест придется включать задания легкие, средние и трудные.
Второй принцип – определение значимости проверяемых знаний. В тест включаются только те элементы учебной программы, которые можно считать наиболее важными, без которых знания становятся несущественными. В первую очередь в тест включают ключевые элементы, составляющие основу подлинных знаний.
Третий принцип – взаимосвязь содержания и формы. Для заданий теста должна быть подобрана наиболее подходящая для них форма выполнения. Не всякое содержание может быть выражено в тестовой форме. Например, доказательства и обширные вычисления невозможно представить в форме тестового задания. Из этого можно сделать вывод о том, что тест нельзя рассматривать как универсальную форму проверки знаний.
Четвертый принцип – содержательная правильность тестовых заданий. В содержание тестового контроля включаются только те элементы знаний, которые являются объективно истинными и поддаются рациональной аргументации. Каждое задание текста опирается на факт, правило, теорему и т.д. Спорные точки зрения не рекомендуется включать в содержание тестовых заданий.
Пятый принцип – репрезентативность содержания учебной дисциплины в содержании теста. Необходимо обращать внимание на полноту и достаточность для контроля значимых элементов содержания. По пяти-шести элементам невозможно проверить знания испытуемых. Нельзя быть уверенным в том, что испытуемый знает и другие элементы содержания учебной дисциплины. Поэтому необходимо наиболее полно отображать необходимые знания в заданиях теста. Репрезентативность не означает обязательного включения в тест всех значимых элементов содержания – многие из них связаны между собой в общей структуре знаний, включены один в другой полностью или частично. Кроме того, многие элементы в структуре знаний иерархически соподчинены. Этому принципу соответствуют основные задания, которые лучше называть структурными.
Шестой принцип – соответствие содержания теста уровню современного состояния науки. Существует необходимость проверять знания учащихся на современном учебном и контрольном материале.
Восьмой принцип – системность содержания. Тестовые задания должны отвечать требованиям системности заданий. Кроме подбора заданий с системным содержанием важно иметь задания, связанные общей структурой знаний. Это возможно тогда, когда каждое задание проверяет преимущественно свою часть в общей системе знаний.
Девятый принцип – вариативность содержания. Содержание теста после его первого применения становится известно испытуемым. Информация о содержании заданий почти всегда передается остальным учащимся. Для того, чтобы защитить результаты теста от такого рода искажений, необходимо создать различные вариации заданий одного и того же теста. Варианты теста, состоящие из вариантов заданий, называются параллельными, если при этом выполняются еще и некоторые статистические условия. Они должны быть примерно равны по трудности, иметь сходные показатели вариации тестовых баллов испытуемых. (14)
Существуют два подхода к оценке результатов тестирования. Первый подход заключается в том, что каждое задание должно оцениваться одним баллом в случае правильного выполнения и нулём баллов в случае его неправильного выполнения. Обработка полученных результатов становится достаточно простой, поэтому этот подход рационален и, что самое важное, наиболее объективен. Невозможно корректно оценить другие задания и обеспечить баланс оценок за задания в тесте, если какое-либо количество баллов присваивается за одно задание. Приведены следующие аргументы сторонников присвоения заданиям разного количества баллов: «С помощью подсчёта баллов вы сможете выразить различие между коротким вопросом, ответ на который не займёт много времени (единичным числом или словом), или вопросом, требующим обстоятельного ответа, а также может потребоваться ответ, состоящий из многих частей, каждая из которых должна быть оценена отдельно. Другим преимуществом подсчёта баллов является то, что они отражают более точно значимость вопросов в общем экзамене. Количество баллов, которые можно получить за ответ на вопрос, должно совпадать с количеством значимых элементов в ответе. Например, если в задании теста сказано исправить ошибки в четырех предложениях, то за это задание можно получить максимально 4 балла. На практике количество баллов также зависит от других факторов, таких как: важность вопроса или общий балл за весь экзамен. Для того чтобы облегчить процесс оценивания, лучше всего придерживаться определённого количества элементов/подпунктов или их совокупности».
Из этого следует, что присвоение разного количества баллов за разные задания аргументировано следующим:
во-первых, задания разной трудности должны оцениваться разным количеством баллов;
во-вторых, должно учитываться количество отдельных элементов задания.
Однако подразумевается расположение заданий теста по степени увеличения их трудности, поэтому в тесте уже учитывается трудность задания и то, что получение каждого последующего балла требует больших усилий.
А также следует учитывать, что отдельные элементы задания редко бывают однородны по трудности, как в вышеприведенном примере. Часто встречаются задания, в которых операции или элементы имею разную степень трудности. Например, при решении задач по математике или геометрии первое действие оказывается наиболее значимым и трудным, в то время как остальные – оказываются гораздо легче.
7 Преимущества и недостатки тестирования
Тестовая форма контроля знаний имеет свои недостатки и преимущества, по сравнению с другими формами.
Преимущества тестирования заключаются в следующем:
Тестовая форма контроля знаний является наиболее качественным и объективным способом оценивания. Объективность теста достигается за счет стандартизации процедуры проведения, проверки показателей качества знаний и тестов целиком.
В тест возможно включить задания по всем темам курса, в то время как в устный экзамен включается 2-4 темы, а в письменный – 3-5. Тестирование позволяет в целом оценить знания испытуемого по предмету и по отдельным его разделам. Исключен элемент случайности при вытаскивании билета.
Тест является более точным инструментом оценки знаний, т.к. количество делений шкалы оценки теста соответствуют количеству вопросов, из которых состоит тест, в то время как обычная шкала оценки знаний состоит только из четырех делений.
Тестирование более эффективно с экономической точки зрения. Основные затраты при тестировании приходятся на разработку качественного инструментария, то есть имеют разовый характер. Затраты же на проведение теста значительно ниже, чем при письменном или устном контроле. Проведение тестирования и контроль результатов в группе из 30 человек занимает полтора два часа, устный или письменный экзамен – не менее четырёх часов.
Разработка качественного инструментария – длительный, трудоемкий и дорогостоящий процесс. Стандартные наборы тестов для большинства дисциплин еще не разработаны, а разработанные имеют очень низкое качество.
Данные, получаемые в результате тестирования, помогают обнаружить пробелы в знаниях по конкретным разделам, но не дают информации о причинах этих пробелов.
Тест не позволяет проверять и оценивать высокие, продуктивные уровни знаний, связанные с творчеством, то есть вероятностные, абстрактные и методологические знания.
Широта охвата тем имеет и отрицательную сторону: учащийся при тестировании не имеет достаточно времени для глубокого анализа темы.
Объективность и справедливость теста достигается путем принятия мер по обеспечению конфиденциальности тестовых заданий. При повторном проведении теста необходимо вносить изменения в задания.
В тестировании присутствует элемент случайности, что искажает результаты теста. Например, учащийся может угадать ответ в сложном вопросе или случайно ошибиться в простом.
Тестовая форма контроля знаний оказывает положительное влияние на эффективность профессиональной деятельности педагога путем выявления у учащихся проблемных зон в усвоении материала. Подобная форма способствует воспитанию у учащихся умения правильно применять свои знания и умения, при правильном использовании служит удобным инструментом самодиагностики и самоконтроля. Необходимо отметить однако, что данная форма контроля знаний будет эффективной лишь при использовании вместе с другими формами контроля, а также при соблюдении требований по разработке и содержании заданий педагогического тестирования.
Федеральный государственный образовательный стандарт по специальности среднего профессионального образования: приказ Министерства образования и науки Российской Федерации № 1001 от 13.08. 2014, Минюст № 33795 от 25.08.2014, 09.02.05 Прикладная информатика (по отраслям). – www.edu.ru/db-mon/mo/Data/d_14/m1001.html (17.12.2016).
Федеральный закон «Об образовании в Российской Федерации». – М., 2013.
Аванесов В.С. Научные проблемы тестового контроля знаний. – М.,1994.
Жунусакунова А.Д. Разновидности заданий в тестовой форме// Актуальные вопросы современной педагогики: материалы II междунар. науч. конф. (г. Уфа, июль 2012 г.). — Уфа, 2012.
Казданян С.Ш. О применении тестовой технологии проверки знаний в вузе // Инновации и современные технологии в системе образования: материалы международной научно-практической конференции 20-21 февраля 2011 года 2011 года. – Пенза – Ереван – Шадринск, 2011.
Калдыбаев С.К., Ажыбаев Д.М., Бекежанов М.М. Компьютерная диагностика результатов обучения в общеобразовательной школе:Практико-ориентированная моногорафия. – Бишкек, 2007.
Ларина Л.В. Компьютерные системы тестирования знаний студентов на различных этапах оценки успеваемости // Омский научный вестник. – 2013. – № 1. – С.43-46.
Майоров А.А. Теория и практика создания тестов для системы образования. – М., 2001.
Hot Potatos/ hotpot.uvic.ca. – https://hotpot.uvic.ca/index.php (16.04.2016).
MultiTester System/ ru.romexoft.com. – http://ru.romexoft.com/index.php?multitester (16.04.2016).
MyTest X/ mytest.klyaksa.net. – http://mytest.klyaksa.net/ (16.04.2016).
Аванесов В.С. Определение педагогического теста/ testolog.narod.ru. – http://testolog.narod.ru/Theory2.html (15.04.2016).
Аванесов В.С. Содержание теста и тестовых заданий/ http://testolog.narod.ru. – http://testolog.narod.ru/Theory61.html (15.04.2016).
Аванесов В.С. Традиционные тесты/ testolog.narod.ru. – http://testolog.narod.ru http://testolog.narod.ru/Theory3.html (15.04.2016).
Методические рекомендации по составлению контролирующих тестов и внедрению тестирования в образовательный процесс / spb.hse.ru. – https://spb.hse.ru/data/2014/01/05/1340534257/method-recommendations-tests.pdf (15.04.2016).
Поклад Н.И. Обзор программ для создания компьютерных тестов, предлагаемых как freeware / nsportal.ru – http://nsportal.ru/shkola/inostrannye-yazyki/library/2013/01/28/obzor-programm-dlya-sozdaniya-kompyuternykh-testov (16.04.2016).