Тестовые задания которые относятся к закрытому типу. Тестовое задание или бесплатный труд? D - умение интерпретировать результаты на графиках и схемах

Тестовые задания которые относятся к закрытому типу. Тестовое задание или бесплатный труд? D - умение интерпретировать результаты на графиках и схемах

27.07.2023

Любой тест представляет собой совокупность тестовых заданий . Тестовое задание – основная составляющая часть теста, которая состоит из инструкции для учащихся, текста задания, имеет однозначный правильный ответ и характеризуется набором показателей.

С точки зрения разработчика тестовые задания имеют следующую структуру:

1. Инструкция .

2. Текст задания (в том числе предлагаемые варианты ответов) . 3. Правильный ответ .

Инструкция содержит указания, что надо делать испытуемому, как выполнять задание, где отмечать, как дописывать, сообщается общее время тестирования и т.д. Если тест имеет различные формы заданий, то при смене форм, перед каждым субтестом дается дополнительная инструкция по выполнению новой формы задания. Задания в субтесте рекомендуется располагать по нарастанию трудности.

После инструкции в тесте располагаются пронумерованные тестовые задания. Задания могут формулироваться как в утвердительной, так и в вопросительной форме и содержать или не содержать варианты ответов. Тестовое задание должно иметь однозначный правильный ответ.

Тестовые задания подразделяются по типам, формам и видам. В пользу разнообразия форм тестовых заданий можно привести следующие доводы:

— задания разной формы делают процесс тестирования менее монотонным, отодвигают порог наступления утомления, и в тест можно поместить большее количество заданий, что увеличивает его надежность;

— для разных элементов содержания образования подходят разные по форме задания, поэтому сведение многообразия учебного материала к одной форме заданий заведомо делает подобные тесты не соответствующими содержанию обучения и, тем самым, менее качественными (даже при большом количестве заданий).

Перед рассмотрением различных видов тестовых заданий вспомним 4 уровня усвоения знаний, выделенных В.П.Беспалько .

I. Уровень знакомства с учебным материалом (ведущие познавательные действия – узнавание, распознавание, различение).

II. Уровень репродуктивного воспроизведения (воспроизведение учебной информации по памяти или смыслу в знакомой ситуации, действие по образцу).

III. Уровень воспроизведения в измененной ситуации (собственные примеры, ситуации из жизни) – основной уровень в школе.

IV. Уровень творческого применения знаний с формированием нового знания.

Соответственно четырем уровням усвоения знаний формируются и тестовые задания четырех уровней. Тем самым снимаются возражения некоторых педагогов по поводу примитивности и простоты тестовых заданий.

Тестовые задания I уровня представляют собой задания на опознание, различение или классификацию объектов, явлений, понятий. Учащемуся необходимо определить, относится отдельно взятый объект к данному классу (виду) или нет. Более сложная форма – «выборочный» тест, когда выполнение задания осуществляется в условиях «помехи», создаваемой сходными вариантами ответов. Часто в таких тестовых заданиях используются «неполные» ответы, с пропуском существенных деталей.

Тестовые задания II уровня нередко составляются как «тесты-подстановки», в них учащиеся должны воспроизвести слово, фразу, формулу или другой элемент знания, пропущенный в тексте. Более сложны «конструктивные» тесты, в которых ученик должен воспроизвести (сконструировать) требуемое в полном объеме. Новой информации из теста он не получит.

Тестовые задания III уровня специально разрабатываются для проверки определенных умений и содержат «типовые» вопросы и задачи. Обучающий эффект тестовых заданий третьего уровня состоит в том, что учащийся в ходе выполнения не просто повторяет уже отработанные действия, но преобразует их в связи с ситуацией.

Тестовые задания IV уровня выявляют умение учащихся ориентироваться и принимать решения в проблемных ситуациях. Работая с такими заданиями, школьник приобретает новые знания и умения как следствие расширения и трансформации усвоенного.

По способу формулирования различают 6 основных видов тестовых заданийи 2 дополнительных .

Возможные типы и виды тестовых заданий представлены на рис. 1. За основу взята классификация тестовых заданий А.Н.Майорова .

Рис.1. Типы и виды тестовых заданий.

Помимо этого, любое из представленных на схеме тестовых заданий по форме выражения информации может быть:

вербальным , т.е. информация выражена словами;

невербальным – информация выражена рисунком, схемой, видеофрагментом, слайдом и др. подобными формами.

Выбор типа задания влияет на результаты обучения. Так, задания закрытого типа содержат варианты готовых ответов, из которых учащиеся должны самостоятельно выбрать правильный (правильные). Ответ на такое задание легко фиксировать и однозначно оценивать. В отличие от заданий открытого типа они содержат подсказку, что повышает их обучающую функцию, но снижает объективность контроля. Задания альтернативных ответов несут в себе максимальную подсказку; для повторения материала и для закрепления знаний они наиболее полезны.

Задания открытого типа предполагают самостоятельный ответ учащихся без каких-либо ограничений и подсказок. Это широко известные традиционные вопросы, применяемые при устном и письменном опросе. Они позволяют проверять любые уровни знаний, но их трудно однозначно оценить.

Задания закрытого типа

Тестовые задания закрытого типа имеют варианты готовых ответов на поставленный вопрос, и надо выбрать один (или несколько) правильных ответов из ряда предлагаемых. Все варианты ответов должны быть правдоподобными, но могут содержать типичные ошибки и затруднения.

1. Задания альтернативных ответов (АО).

К каждому заданию дается только два варианта ответов: «Да» или «Нет» («верно» – «неверно»). Испытуемый должен выбрать один из них.

Форма задания:

Утверждение 1 Утверждение 2 Утверждение 3 Утверждение 4 Да Да Да Да Нет Нет Нет Нет

При составлении такого задания формулировать основной текст надо таким образом, чтобы не возникало возможности двусмысленного ответа (и «да», и «нет»).

Инструкция.

Задание. Квадратное уравнение с отрицательным дискриминантом не имеет действительных корней

Варианты ответа:

а) да; б) нет.

В этом задании могут появиться двусмысленные ответы: «да» (не имеет), «нет» (у него нет действительных корней). И теми, и другими испытуемыми подразумевался один и тот же ответ. Задание необходимо переделать. Ниже приводится один из вариантов переделанного задания.

Инструкция. Выберите ответ «да» или «нет».

Задание. Квадратное уравнение с отрицательным дискриминантом имеет действительные корни

Варианты ответа:

а) да; б) нет.

Ответ становится однозначным, но задание все равно составлено неудачно.

У одиночного задания альтернативных ответов (см. пример 2) очень высока вероятность угадывания правильного ответа (50%). Поэтому такие задания лучше использовать длинными сериями к одному элементу знаний (см. пример 3) – шансы дать верные ответы на 10 таких вопросов, уже невелики.

Инструкция. Выберите ответ «да» или «нет». (Если вы согласны с утверждением – «да», а если не согласны – «нет».)

Задание. Биосфера – это часть...

Варианты ответа:

Ответ : да – нет – нет – нет – да – нет.

Задания альтернативных ответов формулируются в форме утверждений, поскольку предполагают согласие или несогласие, которое можно отнести к утверждениям.

Задания АО больше всего подходят для выявления знаний сложных определений, правил, проверки понимания сложных графиков, диаграмм, схем.

2. Задания множественного выбора.

Это самый распространенный вид заданий, применяемый в тестах достижений. Испытуемый должен выбрать один правильный (иногда – несколько правильных) ответ из предложенных вариантов, либо один (несколько) неправильных. Оптимально предлагать в заданиях данного вида 5 вариантов ответов, минимальное количество возможных вариантов ответа – 3, иначе возрастает вероятность простого угадывания.

Остальные варианты ответов – неправильные, но правдоподобные, – называются дистракторами (от англ. Distract –отвлекать). Неправильные ответы рекомендуется составлять на основе типичных ошибок обучаемых. Поиски правдоподобных однородных и оригинальных ответов составляют главную трудность для разработчиков.

Форма задания:

Вопрос (утверждение):

А. Вариант ответа 1

Б. Вариант ответа 2

В. Вариант ответа 3

Г. Вариант ответа 4

Д. Вариант ответа 5

Инструкция. Укажите номер правильного ответа.

Задание. К какой группе веществ относится серная кислота?

Варианты ответа :

1. Не электролит.

2. Слабый электролит.

3. Электролит средней силы.

4. Сильный электролит.

Ответ: 4.

Расположение в ответах характеристик силы электролита по степени возрастания (убывания) не приводит к потере времени при чтении, что более удачно в сравнении с хаотичной по этому признаку расстановкой ответов. Задания лучше формулировать в повествовательной форме.

Пример 5.

Инструкция. Выберите верный ответ.

Задание. Катер плывет по реке, скорость течения равна а , скорость катера в стоячей воде равна b . Какая из формул выражает время, затраченное катером, чтобы спуститься вниз по течению на 30 км и вернуться обратно? (Время стоянки не учитывать).

Варианты ответа :

а) ; б) ; в) ; г) .

Ответ: б).

Это хорошее задание для проверки знания формул и умения выполнять математические и другие познавательные операции. Выбрать верный ответ можно, только совершив определенные действия.

Инструкция. Выберите верный ответ.

Задание. Империя – это …

Варианты ответа .

а) большое государство.

б) государство, управляемое императором.

в) государство, состоящее из метрополий и колоний.

г) сильное государство.

д) недемократическое государство.

Ответ: в).

Строго говоря, согласно словарным определениям верен и ответ б). Но засчитывается только ответ в). Проверяющий получает искаженные данные о знаниях испытуемого. Верный ответ должен быть единственным. В варианте ответа б) слово «императором» можно заменить «царем».

3. Задания на восстановление соответствия.

В заданиях на восстановление соответствия испытуемому необходимо определить соответствия между элементами двух множеств. Элементами множеств могут служить как вербальные, так и невербальные формы выражения знаний (рисунки, графики, условные обозначения и др.)

Поскольку в таких заданиях существуют два ряда объектов, разумно один из них обозначать цифрами, а другой – буквами, что помогает избежать путаницы при выполнении заданий.

Этот тип заданий достаточно разнообразен по форме предъявления материала и может быть успешно использован по всем учебным предметам и предметным областям.

Инструкция. Соотнесите схемы и значения общего сопротивления цепи.

Варианты ответа:

1. 4,4 Ом
2. 4,5 Ом
3.~ 1,9 Ом
4.~ 7,3 Ом
5.~ 1,7 Ом
Ответ: I. II. III. IV. V. 3 1 2 5 4

У задания, приведенного в примере 7, есть существенный недостаток: для того, чтобы дать правильный ответ, совсем необязательно вычислять сопротивления всех 5 схем. Достаточно вычислить 4 сопротивления, а пятой схеме поставить в соответствие оставшееся пятое численное значение.

Инструкция. Соотнесите написанное в столбцах 1 и 2.

Задание. Кто написал?

Варианты ответа:


Это задание неудачное по двум причинам. Слишком короткая и некорректная формулировка вопроса, что требует дополнительных пояснений. Но главное, каждому произведению поставлен один автор, и при 4-х правильных ответах пятый ответ будет неизбежно правильным. Лучше подобное задание предложить в следующем варианте.

Инструкция. Укажите буквой, какому автору принадлежат книги, указанные в списке (оставьте незаполненной графу напротив книги, автор которой не указан в левом списке).

Ответ: Г, А, Б, – , – , В.

Предъявление списков неравной длины уменьшает вероятность угадывания правильного ответа.

Заданиям на соответствие, как и альтернативным заданиям, присущ недостаток – опасность тривиального тестирования. Знание автора произведения является не столь важным (но все-таки необходимым) по сравнению с умениями анализировать произведение или выразить свое отношение к его проблематике.

Поэтому задания на восстановления соответствия используют для быстрой проверки знания фактов, событий, дат, персоналий, формул, наличия умений и навыков в конкретной области. Это могут быть:

— список растений (животных) и таксономический ряд – в биологии;

— слова и соответствующие части речи или орфограммы и пр.– в филологии;

— даты, события, личности и др. – в истории;

— формулы, правила, законы и конкретные случаи их применения – в точных науках;

— причинно-следственные связи, субъект-объектные отношения и т.п. – в психологии, философии, социологии;

Все выше названные вербальные элементы знаний могут быть соотнесены с невербальными (звуковыми и видеофрагментами, рисунками, фотографиями, картами и т.п.).

При составлении заданий на восстановление соответствия необходимо соблюдать также следующие требования:

1) Элементы каждого из двух множеств должны быть выбраны по одному основанию.

2) Число элементов одного списка не должно превышать 10.

3) Оба списка необходимо располагать на одной странице, не допуская переноса отдельных элементов.

4. Задания на восстановления последовательности.

Эти задания можно рассматривать как вариант заданий на восстановление соответствия с одной особенностью: нужно перечислить поданное в списке в правильной последовательности. Тестовые задания на установление правильной последовательности предназначены для оценки уровня владения последовательностью действий, процессов и т.п. Элементы, связанные с определенной задачей, приводятся в заданиях в произвольном порядке, а ученик должен установить правильный порядок предложенных элементов и указать его заданным способом в специально отведенном для этого месте.

Пример 10.

Инструкция. Расположите в правильной последовательности (в столбце ответов поставьте соответствующие буквы).

Задание. Расположите этапы зародышевого развития позвоночных животных в правильном порядке:

Варианты ответа:

Правильный ответ :

1. Б.
2. А.
3. В.
4. Д.
5. Г.

Задания на восстановление последовательности незаслуженно редко используются в тестировании. Это очень качественная форма тестовых заданий, обладающая краткостью и простотой проверки, экономит время работы и составителя, и испытуемого.

Данные тестовые задания подходят для любого предмета, где присутствуют алгоритмическая деятельность, анализируются временные события, логика исследования. Это может быть:

— порядок технологических операций, спортивных действий – в технологических дисциплинах и спорте;

— восстановление временных последовательностей событий;

— этапы словообразования и т.п. для уроков русского (иностранного) языка;

— последовательность анализа художественного произведения для уроков литературы;

— алгоритмы решения задач для точных наук, логика исследования объектов (явлений);

— этапы развития философской мысли в философии и многое др.

Следует отметить очень низкую вероятность угадывания верных ответов.

5. Задания группировки.

Данная форма тестового задания является модификацией заданий на восстановление последовательности. В таком заданиипредлагается составить из фрагментов 2-3 небольших рассказа, в каждом из которых описывается одно понятие (закономерность, событие). Начала рассказов объединены в группу А (в произвольном порядке), следующие фрагменты – в группы Б, В и т.д.

Тестовые задания группировки удобны тем, что позволяют охватить признаки сходства и различия родственных понятий, требуют разнообразной аналитико-синтетической деятельности, связанной с сопоставлением, выделением существенных признаков, анализом.

Принцип группировки оптимален для установления последовательности протекания событий и явлений, описания свойств изучаемого объекта, сопоставления характеристик и условий с последующими выводами и обобщениями.

Можно использовать любой описательный материал, допускающий логическое структурирование. Задания-группировки удобны для проверки знания алгоритма какой-либо деятельности, а также для оценки глубины усвоения при обобщении материала. Следует отметить также низкую вероятность угадывания правильного ответа, свойственную этому виду заданий.

Форма задания:

Инструкция. С оставьте тексты из фрагментов А, Б, В.

Задание.

А. 1) Начало первого текста…

2) Начало второго текста…

3) Начало третьего текста…

Б. 1) продолжение третьего текста…

2) продолжение первого текста…

3) продолжение второго текста…

В . 1) окончание третьего текста.

2) окончание второго текста.

3) окончание первого текста.

Правильный ответ: А1 Б2 В3; А2 Б3 В2; А3 Б1 В1.

Пример 11.

Инструкция. С оставь текст из фрагментов А, Б, В, Г, Д.

Задание.

А. 1) Деление клетки…

2) Обмен веществ в клетке необходим для…

3) Растения называют…

Б. 1) производителями органического вещества потому, что…

2) сложный процесс…

3) снабжения клетки…

В . 1) связанный с ростом и...

2) строительным материалом и энергией...

3) в процессе фотосинтеза создают …

Г . 1) размножением клеток...

2) обеспечивающих рост и жизнедеятельность клетки...

3) из неорганических веществ (углекислого газа, воды) в присутствии света …

Д. 1) продолжается непрерывно, пока клетка жива.

2) органическое вещество крахмал и кислород.

3) двумя способами – бесполым и половым.

Правильный ответ: А1 Б2 В2 Г3 Д2 и т.д.

В заключение обзора заданий закрытого типа отметим их основные преимущества:

— отсутствуют факторы, связанные с субъективными оценками;

— на качество ответа не влияет, умеют ли испытуемые хорошо формулировать ответы, т.к. выбираются готовые ответы.

— возможна машинная обработка ответов и анализ результатов, поэтому тестирование проводится быстро.

Задания открытого типа

Тестовые задания открытого типа рассчитаны на ответ в свободной форме. Обычная алгоритмическая программа, используемая для оценивания результатов закрытых тестов, для тестов открытого типа непригодна. Как правило, открытые тестовые задания используются для выявления эвристических, креативных умений и оцениваются экспертами.

К ним относятся задания двух видов.

1. Задания свободного изложения.

Они предполагают свободные ответы испытуемых по сути задания. На ответы не накладываются ограничения, однако, формулировка заданий должна обеспечивать наличие только одного правильного ответа. Компьютерная проверка таких заданий затруднена, оценивают ответы эксперты.

Пример 12.

Инструкция. Закончи предложение. Вместо многоточия можно вписать словосочетание, фразу, предложение или даже несколько предложений.

Задание. Имя существительное – это …

Ответ. Ответ считается правильным, если содержит следующие ключевые слова или их синонимы: «часть речи», «обозначает предметы», «отвечает на вопросы кто? что?».

2. Задания дополнения (или другое название: задания с ограничением на ответы).

В этих заданиях тестируемые должны также самостоятельно сформулировать ответы на вопросы, но их возможности ограничены (задано количество слов, знаков, символов, которые можно использовать при ответе).

Пример 13.

Инструкция. Впиши пропущенные слова. Одному пропуску соответствует только одно слово.

Задание. Самостоятельная часть речи, обозначающая предмет и отвечающая на вопросы кто? что? – это … …

Ответ. Имя существительное.

Правильный ответ задается достаточно однозначно, поэтому задания дополнения могут включаться в компьютерный тест (правильность ответа может быть проверена при помощи компьютера).

Задания на дополнение имеют ограниченную сферу применения. С помощью таких заданий проверяются остаточные знания, умения воспроизводить и применять знания в знакомой ситуации, ограничена возможность проверки понимания изученного материала, т.е. задание можно отнести к I или II уровню сложности, в то время как задание свободного изложения может иметь от II до IV уровня сложности.

При составлении заданий дополнения следует придерживаться специфических правил:

— использовать не более 3-х пропусков подряд;

— дополнять нужно самое важное, знание чего и необходимо проверить;

— дополнения лучше ставить в конце предложения.

3. Тестовое задание-дискуссия.

Является разновидностью тестового задания свободного изложения. Особенностью тестового задания-дискуссии является формулировка заданий в виде проблемных вопросов, требующих альтернативного выбора ответа с последующим обоснованием своей позиции в свободной форме.

Пример 14.

Инструкция. Будь судьей в споре! Выбери и аргументируй верный ответ.

Варианты ответов:

1. Да, т.к. …

2. Нет, т.к. …

Ответ обосновать в свободной форме.

Верный ответ : нет, если в аргументации содержатся следующие ключевые слова или их синонимы: «млекопитающее», «дышит легкими», «теплокровное».

Иногда возможен и третий вариант ответа:

3. Ни то, ни другое, т.к. …

Основной трудностью при составлении заданий открытого типа является соблюдение главного требования к тестовым заданиям – наличие однозначного правильного ответа.

Существует несколько приемов, позволяющих формализовать свободный ответ, сделать его однозначным. Покажем это на конкретных примерах.

Пример 15.

Инструкция. Закончите предложение.

Задание. Инерция – это …

Ответ. «… явление сохранения равномерного прямолинейного движения при компенсации всех внешних воздействий на тело».

Это пример неудачно сформулированного ответа. Задание с таким вариантом ответа невозможно обработать. Вероятность точного (дословного) совпадения с контрольным образцом ответа мала.

Ответы «явление», «сохранение равномерного прямолинейного движения», «движение при компенсации внешних воздействий» могут считаться частично правильными, что нарушает основное требование к тестовым заданиям (единственности верного ответа) и приводит к субъективным оценкам.

В данном случае возможно несколько вариантов выхода из создавшегося положения.

1. Попытаться переформулировать задание, чтобы ответ стал однозначным, например:

Задание. «Явление сохранения равномерного прямолинейного движения при компенсации всех внешних воздействий на тело называется …».


ВИДЫ ТЕСТОВ И ФОРМЫ ТЕСТОВЫХ ЗАДАНИЙ

1. Основные виды педагогических тестов.

2. Формы тестовых заданий.

3. Эмпирическая проверка и статистическая обработка результатов.

4. Принципы отбора содержания. Критерии оценки содержания теста.

5. Соотношение формы задания и вида проверяемых знаний, умений, навыков.


1. Основные виды педагогических тестов

Существуют два основных вида тестов: традиционные и нетрадиционные.

Тест обладает составом, целостностью и структурой. Он состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов. Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения. Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура, в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.

Традиционный тест представляет собой единство, по меньшей мере, трех систем:

Формальной системы заданий возрастающей трудности;

Статистических характеристик заданий и результатов испытуемых.

Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: - как метод педагогического измерения и как результат применения теста. Удивительно, что тексты на русском языке тяготеют к смыслу метода, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается в смысле результатов. Между тем, оба эти смысла характеризуют тест с разных сторон, потому что тест надо понимать одновременно и как метод, и как результат педагогического измерения. Одно дополняет другое. Тест, как метод, не мыслится без результатов, подтверждающих качество его самого и качество оценок измерения испытуемых различного уровня подготовленности.

В приведенном выше определении традиционного теста получили развитие несколько идей.

Первая идея - тест рассматривается не как обычная совокупность или набор вопросов, задач и т.п., а в виде понятия "система заданий". Такую систему образует не всякая совокупность, а только та, которая обусловливает возникновение нового интегративного качества, отличающего тест от элементарного набора заданий и от других средств педагогического контроля. Из множества возможных систем наилучшую образует та целостная совокупность, в которой качество теста проявляется в сравнительно большей степени. Отсюда вытекает мысль о выделении первого из двух главных системообразующих факторов - наилучшего состава тестовых заданий, образующих целостность. Исходя из этого, можно дать одно из самых коротких определений: тест - это система заданий, образующих наилучшую методическую целостность. Целостность теста - это устойчивое взаимодействие заданий, образующих тест как развивающуюся систему.

Вторая идея состоит в том, что в данном определении теста совершен отход от укоренившейся традиции рассмотрения теста как простого средства проверки, пробы, испытания. Всякий тест включает в себя элемент испытания, он не сводится весь к нему. Ибо тест - это еще и концепция, содержание, форма, результаты и интерпретация - все, требующее обоснования. Этим подразумевается, что тест является качественным средством педагогического измерения. В соответствии с положениями теории, тестовые оценки не являются точными оценками испытуемых. Правильно говорить, что они лишь репрезентируют эти значения с некоторой точностью.

Третья идея, развиваемая в нашем определении традиционного теста - это включение нового понятия - эффективность теста, который ранее в литературе по тестам не рассматривался в качестве критерия анализа и создания тестов. Ведущая идея традиционного теста - минимумом числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.

По существу, этим отражается идея эффективности педагогической деятельности в области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже некому и незачем. Если наш учитель может разъяснить учебный материал не хуже своего зарубежного коллеги, то хорошо проверить требуемые знания, у всех учеников, по всему изученному материалу, он не в состоянии из-за господствующей у нас классно-урочной системы занятий, нехватки компьютерной техники, тестов и программ для организации автоматизированного самоконтроля - самой гуманной формы контроля знаний. Не в состоянии он это делать и физически. В силу, мягко скажем, ошибочной социальной политики зарплата наших учителей уже давно не компенсирует затраты даже физической энергии, необходимой для хорошего преподавания, не говоря уже о повышенных затратах энергии интеллектуальной, что способно совершать только раскованное, а не озабоченное поисками хлеба мышление. Как отмечается в литературе, квалифицированный работник получает у нас в три-четыре раза меньше того уровня зарплаты, за границами которого нарушается нормальная жизнедеятельность и начинается разрушение трудового потенциала.

Хотя в литературе имеются сотни примеров определений теста, с которыми либо трудно, либо вообще нельзя согласиться, это совсем не означает, что данное определение традиционного теста - истина в последней инстанции. Как и все остальные понятия, оно нуждается в постоянном улучшении. Просто оно представляется автору пока более аргументированным, чем некоторые другие известные понятия педагогического теста. Впрочем, стремление к улучшению понятий - явление совершенно нормальное и необходимое для нормально развивающейся практики и науки. Конструктивные попытки дать другие определения теста или оспорить уже имеющиеся всегда полезны, но именно этого нам не достает.

К традиционным тестам относятся тесты гомогенные и гетерогенные. Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине. Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Например, тест по физике измеряет знания, умения, навыки и представления испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике экспертно устанавливается уровень математических знаний, используемых при решении физических заданий. Превышение принятого уровня приводит к смещению результатов; по мере превышения последние все больше начинают зависеть не столько от знания физики, сколько от знания другой науки, математики. Другой важный аспект - стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение подготовленности по физике.

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам. Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Напомним, что традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой. При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а "кто знает больше". Интерпретация результатов тестирования ведется преимущественно на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так называемые процентильные нормы, показывающие - сколько процентов испытуемых имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его тестовым баллом. Такая интерпретация называется нормативно-ориентированной. Здесь вывод достраивается рейтингом: задания ответы выводы о знаниях испытуемого рейтинг, понимаемый как вывод о месте или ранге испытуемого.

Интегративные тесты. Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения. Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.

Интегративному тестированию предшествует организация интегративного обучения. К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), ещё долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности. Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий. Потребность создания интегративных тестов возрастает по мере повышения уровня образования и числа изучаемых учебных дисциплин. Поэтому попытки создания таких тестов отмечаются, в основном, в высшей школе. Особенно полезны интегративные тесты для повышения объективности и эффективности проведения итоговой государственной аттестации учащихся и студентов.

Методика создания интегративных тестов сходна с методикой создания традиционных тестов, за исключением работы по определению содержания заданий. Для отбора содержания интегративных тестов использование экспертных методов является обязательным. Это связано с тем, что только эксперты могут определить адекватность содержания заданий целям теста. Но, прежде всего, самим экспертам важно будет определиться с целями образования и изучения тех или иных образовательных программ, а затем и договориться между собой по принципиальным вопросам, оставив для экспертизы лишь вариации в понимании степени значимости отдельных элементов в общей структуре подготовленности. Согласованный, по принципиальным вопросам, отобранный состав экспертов в зарубежной литературе нередко панелью. Или учитывая различия в смысле последнего слова, в русском языке, такой состав можно назвать представительной экспертной группой. Группа подбирается так, чтобы адекватно представлять подход, используемый при создании соответствующего теста.

Адаптивные тесты. Целесообразность адаптивного контроля вытекает из необходимости рационализации традиционного тестирования. Каждый учитель понимает, что хорошо подготовленному ученику нет необходимости давать легкие и очень легкие задания. Потому что слишком высока вероятность правильного решения. К тому же, легкие материалы не обладают заметным развивающим потенциалом. Симметрично, из-за высокой вероятности неправильного решения нет смысла давать трудные задания слабому ученику. Известно, что трудные и очень трудные задания снижают учебную мотивацию многих учащихся. Нужно было найти сопоставимую, в одной шкале, меру трудности заданий и меру уровня знаний. Эта мера была найдена в теории педагогических измерений. Датский математик Г. Раск назвал эту меру словом "логит". После появления компьютеров эта мера легла в основу методики адаптивного контроля знаний, где используются способы регулирования трудности и числа предъявляемых заданий, в зависимости от ответа учеников. При успешном ответе следующее задание ЭВМ подбирает более трудным, при неуспешном - легким. Естественно, этот алгоритм требует предварительного опробования всех заданий, определения их меры трудности, а также создания банка заданий и специальной программы.

Использование заданий, соответствующих уровню подготовленности, существенно повышает точность измерений и минимизирует время индивидуального тестирования до, примерно, 5 - 10 минут Адаптивное тестирование позволяет обеспечить компьютерную выдачу заданий на оптимальном, примерно 50%-ом уровне вероятности правильного ответа, для каждого ученика.

В западной литературе выделяется три варианта адаптивного тестирования. Первый называется пирамидальным тестированием. При отсутствии предварительных оценок всем испытуемым дается задание средней трудности и уже затем, в зависимости от ответа, каждому испытуемому дается задание легче или труднее; на каждом шаге полезно использовать правило деления шкалы трудности пополам. При втором варианте контроль начинается с любого желаемого, испытуемым, уровня трудности, с постепенным приближением к реальному уровню знаний. Третий вариант - когда тестирование проводится посредством банка заданий, разделенных по уровням трудности.

Таким образом, адаптивный тест представляет собой вариант автоматизированной системы тестирования, в которой заранее известны параметрами трудности и дифференцирующей способности каждого задания. Эта система создана в виде компьютерного банка заданий, упорядоченных в соответствии с интересующими характеристиками заданий. Самая главная характеристика заданий адаптивного теста - это уровень их трудности, полученный опытным путем, что означает: прежде чем попасть в банк, каждое задание проходит эмпирическую апробацию на достаточно большом числе типичных учащихся интересующего контингента. Слова "интересующего контингента" призвано представлять здесь смысл известного в науке понятия более строгого понятия "генеральная совокупность".

Распространенная у нас образовательная модель адаптивной школы Е.А. Ямбурга, исходит, по существу, из общих идей адаптивного обучения и адаптивного контроля знаний. Истоки такого подхода можно проследить с момента возникновения педагогических трудов Коменского, Песталоцци и Дистервега, которых объединяют идеи природосообразности и гуманности обучения. В центре их педагогических систем был Ученик. Например, в малоизвестной у нас работе А. Дистервега "Дидактические правила" можно прочитать такие слова: "Преподавай сообразно природе... Учи без пробелов... Начинай преподавание с того, на чем остановился ученик... Прежде чем приступить к преподаванию, нужно исследовать точку исхода... Без знания того, на чем остановился ученик, невозможно порядочно обучить его". Недостаточная информированность о реальном уровне знаний учеников и естественные различия в их способностях усвоить предлагаемые знания стали главной причиной появления адаптивных систем, основанных на принципе индивидуализации обучения. Этот принцип трудно реализуем в традиционной, классно-урочной форме.

До появления первых компьютеров наиболее известной системой, близкой к адаптивному обучению, была так называемая "Система полного усвоения знаний".

Критериально-ориентированные тесты. При критериально-ориентированном подходе создаются тесты для сопоставления учебных достижений каждого ученика с планируемым к усвоению объемом знаний, умений или навыков. В этом случае в качестве интерпретационной системы отсчета используется конкретная область содержания, а не та или иная выборка учеников. При этом упор делается на то, что может выполнить ученик и что он знает, а не на то, как он выглядит на фоне других.

Есть свои трудности и при критериально-ориентированном подходе. Как правило, они связаны с отбором содержания теста. В рамках критериально-ориентированного подхода в тесте стараются отразить все содержание контролируемого курса или, по крайней мере, то, что можно принять за этот полный объем. Процент правильного выполнения заданий рассматривают как уровень подготовки или как степень овладения общим объемом содержания курса. Конечно, в рамках критериально-ориентированного подхода для последней интерпретации есть все основания, так как тест включает все то, что можно условно принять за 100%.

Критериально-ориентированные тесты закрывают довольно широкий спектр задач. В частности, они помогают собрать полную и объективную информацию об учебных достижениях каждого учащегося в отдельности и группы учеников; сравнить зна­ния, умения и навыки ученика с требованиями, заложенными в государственных образовательных стандартах; отобрать учеников, достигших планируемого уровня подготовленности; оценить эффективность профессиональной деятельности отдельных преподавателей и групп преподавателей; оценить эффективность различных программ обучения.

Акцент на содержательном подходе может оказать благотворное влияние на педагогическое тестирование в целом. От такого подхода выигрывает, например, интерпретация тестовых баллов при текущем контроле. Ученик получает информацию не о том, как он выглядит на фоне других, а о том, что он может делать и что знает по сравнению с заданными требованиями к уровню подготовки по предмету. Разумеется, такая интерпретация не исключает сочетания с отнесением результатов к нормам, что, как правило, происходит при текущем контроле знаний учеников в повседневном учебном процессе. В этом случае тестирование интегрировано с обучением и помогает учащемуся выявить возможные затруднения, а также своевременно исправить ошибки в усвоении содержания учебного материала.



В ходе рассуждения учащегося цепочка прервалась (несоответствие понятия или пояснения), то количество существенных операций определяется до разрыва логической цепочки. Особенность составления тестовых заданий этого уровня усвоения заключается в том, что практически невозможно создать однозначный эталон. Эталон может быть создан в виде схемы решения проблемы. Пример: логическая цепочка. ...

Заданий

Формы представления компьютерных тестовых

Компьютерный тест состоит из инструкций к тесту, параметров и тестовых заданий . Инструкция к тесту должна в краткой и понятной форме содержать информацию, которая поможет испытуемому правильно понять процедуру выполнения тестовых заданий. В инструкции указываются время выполнения каждого теста, последовательность выполнения тестовых заданий, система оценок, правила интерпретации результатов и т.п.

Каждое тестовое задание состоит из задания и вариантов ответов, один из которых является эталоном. Ответы тестируемого сравниваются с эталонами по каждому тестовому заданию, а затем в соответствии с целью тестирования, разработанной шкалой измерения интерпретируется результат тестирования.

По виду представления тестовые задания могут быть словесные и невербальные (графические: статические и мультимедийные).

Анализ педагогической литературы позволил выделить, следующие формы тестовых заданий:

· закрытая форма;

· открытая форма;

· на соответствие;

· на установление правильной последовательности.

Тестовое задание закрытой формы состоит из проблемной части, в которой формулируется задача (проблема), ответов, содержащих правильный ответ (эталон), и дистракторов. Дистрактор – это неверный, неправильный ответ в закрытом тестовом задании с выборочными ответами.

Проблемная часть тестового задания может быть написана как в вопросительной , так и утвердительной формах.

К закрытым тестовым заданиям относятся:

· задания с альтернативным выбором (дихотомические) ;

· задания с множественным выбором : с одним отрицательным или положительным правильным ответом; с множественными ответами (верно/неверно), расширенного выбора.

Закрытая форма тестовых заданий с альтернативным выбором (дихотомические). Тестовое задания с альтернативным выбором обычно содержит некоторое утверждение. Испытуемый должен оценить это утверждение как истинное или ложное и дать ответ: да/нет, верно/неверно, отметить правильное утверждение и т.п. При разработке альтернативных тестовых заданий используют различные виды конструирования ответов : противоречия, противоположности, однородности, кумуляции и т.п.

К недостаткам данной формытестового задания можно отнести высокую степень угадывания (50%); трудность формулировки утверждения, на которое можно дать недвусмысленный ответ. Для уменьшения высокой степени угадывания рекомендуется увеличить количество тестовых заданий в тесте. Примеры альтернативных (дихотомические) тестовых заданий приведены в Приложении А.



· в связи с необходимостью точной формулировки утверждения воздерживаться от использования таких слов, как все , каждый , всегда , никогда , иногда , часто и т.п., в которых обычно может содержаться двусмысленность или противоречие;

· во избежание упрощенных ответов да/нет разрабатывать задания в утвердительной форме;

· формулировать ответы к заданиям кратко и содержательно .

Эту форму тестового задания рекомендуют использовать для детальной проверки знаний и понимания конкретного учебного материала: достоверности/недостоверности фактов, явлений, процессов, определений; умений узнавать ранее усвоенную информацию при повторном ее предъявлении в виде готовых решений соответствующих вопросов и задач при самоконтроле в процессе самостоятельной познавательной деятельности студентов и текущем контроле. Примеры тестовых заданий альтернативной формы приведены в Приложении А.

Задания с множественным выбором. Тестовое задание с множественным выбором состоит из проблемной части, которая содержит утверждение или вопрос, и вариантов выбора, из которых тестируемые должны определить правильный ответ. Варианты выбора содержат несколько правдоподобных ответов (дистракторов ), что сокращает вероятность угадывания правильного ответа. Варианты выбора должны содержать только сравнимые понятия, имеющие в своем содержании общие существенные признаки, по которым их можно сравнивать. Правильный ответ может иметь как положительную, так и отрицательную формы. Рекомендуемое количество дистракторов ‑ не более пяти. Если ни один из тестируемых не выбрал дистрактор, этот дистрактор называется нерабочим. Такой дистрактор заменяют.

Тестовые задания множественного выбора должны оценивать как объем знаний, имеющийся у тестируемого, так и его умение применять эти знания. Следующая пара условий тестовых заданий показывает различие между вопросом, оценивающим опознание отдельного факта, и вопросом, оценивающим применение знаний.

Условие задания на распознание : «Перечислите, какой вид деятельности можно оценить с помощью тестового задания закрытой формы множественного выбора ».

Условие задания на применение знания : «Необходимо разработать тестовые задания для объективной оценки деятельности на различие. Какую форму тестовых заданий эффективнее использовать в данном случае? ».

Тестовые задания с множественным выбором подразделяются на следующие виды:

· тестовые задания с множественным выбором, в котором содержится только один правильный ответ. Расположение правильного ответа в списке вариантов выбора должно определяться случайным образом, чтобы предотвратить случаи угадывания;

· тестовые задания множественного выбора, содержащие несколько вариантов выбора правильных ответов. Вероятность угадывания правильных ответов в таких заданиях уменьшается по сравнению с тестовыми заданиями, содержащими один правильный вариант выбора;

· тестовые задания расширенного выбора – это вопросы множественного выбора, организованные в блоки, которые используют единый список вариантов ответа для всех тестовых заданий в блоке. Задания расширенного выбора включают в себя тему, список вариантов ответа (перечисленных в алфавитном или логическом порядке), вводный вопрос (указывает на отношение между условием задания и вариантами ответа, проясняя вопрос, поставленный перед тестируемым), условие или ситуацию, по меньшей мере, двух тестовых заданий (сходных по структуре), как это показано в заданиях 16, 17 Приложения А . В этой форме тестовых заданий сначала определяются тема (1), вводный вопрос (2), варианты ответов (3), а условие задания (4) определяется в последнюю очередь. Варианты ответов в задании должны быть короткими, не содержать глаголов и быть однородными, в задании обязательно наличие вводного вопроса.

Задания с множественным выбором имеют следующие преимущества : высокая надежность, особенно с вариантом, когда используется один ответ; легкость обработки показателей теста при большом количестве заданий; возможность получения точных показателей теста для определения соответствия теста цели, для которой он был создан.

Простота. Задание должно быть написано настолько просто, насколько это возможно для его точного понимания. Нежелательно, чтобы на результаты оказывали влияние уровень словарного запаса испытуемого или его общие способности.

Все дистракторы должны быть такими, чтобы каждый из них мог привлечь внимание испытуемых (т.е. быть как бы «похожими» на правильный ответ). Дистрактор должен быть содержательным, по возможности правдоподобным, но не абсурдным.

Необходимо подбирать ответы таким образом , чтобы выбор был затруднен простым перебором без привлечения знаний, усвоение которых требуется оценить.

Только один вариант из предложенного набора должен соответствовать правильному ответу. Иногда различные взгляды на одну и ту же проблему могут привести к непредусмотренному ответу, который будет тоже правильным.

Ответ на один вопрос не должен давать ключа к ответам на другие. Не следует использовать дистракторы из одного задания в перечне других.

Избегайте тестировать тривиальное ввиду простоты его обнаружения. Сама проблема должна содержаться в основной части задания, а не выноситься в часть с вариантами выбора, которые должны быть настолько краткими, насколько это возможно.

Не рекомендуется использовать отрицательную форму формулировки проблемы. Ее использование может привести к противоречиям при чтении задания и, за исключением редких случаев, отрицательные значения не настолько важны, как положительные.

Использование выражения «ни один из перечисленных» в качестве дистрактора допустимо только тогда, когда существует недвусмысленный правильный ответ.

Использование выражения «все перечисленные» в качестве дистрактора приводит к допустимости «скользких» мест в формулировке заданий, в которых дистракторы не являются особенно дискриминативными, поскольку автор вопросов знает, что любой из ответов правильный.

Правильные ответы и дистракторы должны иметь одно содержание, одну структуру и общее количество слов. Расположение правильного ответа не должно повторяться от вопроса к вопросу, его место – случайно .

План

1. Основные виды педагогических тестов.

2. Формы тестовых заданий.

3. Эмпирическая проверка и статистическая обработка результатов.

4. Принципы отбора содержания. Критерии оценки содержания теста.

5. Соотношение формы задания и вида проверяемых знаний, умений, навыков.


1. Основные виды педагогических тестов

Существуют два основных вида тестов: традиционные и нетрадиционные.

Тест обладает составом, целостностью и структурой. Он состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов. Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения. Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура, в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.

Традиционный тест представляет собой единство, по меньшей мере, трех систем:

Формальной системы заданий возрастающей трудности;

Статистических характеристик заданий и результатов испытуемых.

Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: - как метод педагогического измерения и как результат применения теста. Удивительно, что тексты на русском языке тяготеют к смыслу метода, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается в смысле результатов. Между тем, оба эти смысла характеризуют тест с разных сторон, потому что тест надо понимать одновременно и как метод, и как результат педагогического измерения. Одно дополняет другое. Тест, как метод, не мыслится без результатов, подтверждающих качество его самого и качество оценок измерения испытуемых различного уровня подготовленности.

В приведенном выше определении традиционного теста получили развитие несколько идей.

Первая идея - тест рассматривается не как обычная совокупность или набор вопросов, задач и т.п., а в виде понятия "система заданий". Такую систему образует не всякая совокупность, а только та, которая обусловливает возникновение нового интегративного качества, отличающего тест от элементарного набора заданий и от других средств педагогического контроля. Из множества возможных систем наилучшую образует та целостная совокупность, в которой качество теста проявляется в сравнительно большей степени. Отсюда вытекает мысль о выделении первого из двух главных системообразующих факторов - наилучшего состава тестовых заданий, образующих целостность. Исходя из этого, можно дать одно из самых коротких определений: тест - это система заданий, образующих наилучшую методическую целостность. Целостность теста - это устойчивое взаимодействие заданий, образующих тест как развивающуюся систему.

Вторая идея состоит в том, что в данном определении теста совершен отход от укоренившейся традиции рассмотрения теста как простого средства проверки, пробы, испытания. Всякий тест включает в себя элемент испытания, он не сводится весь к нему. Ибо тест - это еще и концепция, содержание, форма, результаты и интерпретация - все, требующее обоснования. Этим подразумевается, что тест является качественным средством педагогического измерения. В соответствии с положениями теории, тестовые оценки не являются точными оценками испытуемых. Правильно говорить, что они лишь репрезентируют эти значения с некоторой точностью.

Третья идея, развиваемая в нашем определении традиционного теста - это включение нового понятия - эффективность теста, который ранее в литературе по тестам не рассматривался в качестве критерия анализа и создания тестов. Ведущая идея традиционного теста - минимумом числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.

По существу, этим отражается идея эффективности педагогической деятельности в области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже некому и незачем. Если наш учитель может разъяснить учебный материал не хуже своего зарубежного коллеги, то хорошо проверить требуемые знания, у всех учеников, по всему изученному материалу, он не в состоянии из-за господствующей у нас классно-урочной системы занятий, нехватки компьютерной техники, тестов и программ для организации автоматизированного самоконтроля - самой гуманной формы контроля знаний. Не в состоянии он это делать и физически. В силу, мягко скажем, ошибочной социальной политики зарплата наших учителей уже давно не компенсирует затраты даже физической энергии, необходимой для хорошего преподавания, не говоря уже о повышенных затратах энергии интеллектуальной, что способно совершать только раскованное, а не озабоченное поисками хлеба мышление. Как отмечается в литературе, квалифицированный работник получает у нас в три-четыре раза меньше того уровня зарплаты, за границами которого нарушается нормальная жизнедеятельность и начинается разрушение трудового потенциала.

Хотя в литературе имеются сотни примеров определений теста, с которыми либо трудно, либо вообще нельзя согласиться, это совсем не означает, что данное определение традиционного теста - истина в последней инстанции. Как и все остальные понятия, оно нуждается в постоянном улучшении. Просто оно представляется автору пока более аргументированным, чем некоторые другие известные понятия педагогического теста. Впрочем, стремление к улучшению понятий - явление совершенно нормальное и необходимое для нормально развивающейся практики и науки. Конструктивные попытки дать другие определения теста или оспорить уже имеющиеся всегда полезны, но именно этого нам не достает.

К традиционным тестам относятся тесты гомогенные и гетерогенные. Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине. Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Например, тест по физике измеряет знания, умения, навыки и представления испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике экспертно устанавливается уровень математических знаний, используемых при решении физических заданий. Превышение принятого уровня приводит к смещению результатов; по мере превышения последние все больше начинают зависеть не столько от знания физики, сколько от знания другой науки, математики. Другой важный аспект - стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение подготовленности по физике.

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам. Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Напомним, что традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой. При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а "кто знает больше". Интерпретация результатов тестирования ведется преимущественно на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так называемые процентильные нормы, показывающие - сколько процентов испытуемых имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его тестовым баллом. Такая интерпретация называется нормативно-ориентированной. Здесь вывод достраивается рейтингом: задания ответы выводы о знаниях испытуемого рейтинг, понимаемый как вывод о месте или ранге испытуемого.

Интегративные тесты. Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения. Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.

ВИДЫ ТЕСТОВ И ФОРМЫ ТЕСТОВЫХ ЗАДАНИЙ

План

1. Основные виды педагогических тестов.

2. Формы тестовых заданий.

3. Эмпирическая проверка и статистическая обработка результатов.

4. Принципы отбора содержания. Критерии оценки содержания теста.

5. Соотношение формы задания и вида проверяемых знаний, умений, навыков.

1. Осно вные виды педагогических тестов

Существуют два основных вида тестов: традиционные и нетрадиционные.

Тест обладает составом, целостностью и структурой. Он состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов. Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения. Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура, в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.

Традиционный тест представляет собой единство, по меньшей мере, трех систем:

Формальной системы заданий возрастающей трудности;

Статистических характеристик заданий и результатов испытуемых.

Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: - как метод педагогического измерения и как результат применения теста. Удивительно, что тексты на русском языке тяготеют к смыслу метода, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается в смысле результатов. Между тем, оба эти смысла характеризуют тест с разных сторон, потому что тест надо понимать одновременно и как метод, и как результат педагогического измерения. Одно дополняет другое. Тест, как метод, не мыслится без результатов, подтверждающих качество его самого и качество оценок измерения испытуемых различного уровня подготовленности.

В приведенном выше определении традиционного теста получили развитие несколько идей.

Первая идея - тест рассматривается не как обычная совокупность или набор вопросов, задач и т.п., а в виде понятия "система заданий". Такую систему образует не всякая совокупность, а только та, которая обусловливает возникновение нового интегративного качества, отличающего тест от элементарного набора заданий и от других средств педагогического контроля. Из множества возможных систем наилучшую образует та целостная совокупность, в которой качество теста проявляется в сравнительно большей степени. Отсюда вытекает мысль о выделении первого из двух главных системообразующих факторов - наилучшего состава тестовых заданий, образующих целостность. Исходя из этого, можно дать одно из самых коротких определений: тест - это система заданий, образующих наилучшую методическую целостность. Целостность теста - это устойчивое взаимодействие заданий, образующих тест как развивающуюся систему.

Вторая идея состоит в том, что в данном определении теста совершен отход от укоренившейся традиции рассмотрения теста как простого средства проверки, пробы, испытания. Всякий тест включает в себя элемент испытания, он не сводится весь к нему. Ибо тест - это еще и концепция, содержание, форма, результаты и интерпретация - все, требующее обоснования. Этим подразумевается, что тест является качественным средством педагогического измерения. В соответствии с положениями теории, тестовые оценки не являются точными оценками испытуемых. Правильно говорить, что они лишь репрезентируют эти значения с некоторой точностью.

Третья идея, развиваемая в нашем определении традиционного теста - это включение нового понятия - эффективность теста, который ранее в литературе по тестам не рассматривался в качестве критерия анализа и создания тестов. Ведущая идея традиционного теста - минимумом числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.

По существу, этим отражается идея эффективности педагогической деятельности в области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже некому и незачем. Если наш учитель может разъяснить учебный материал не хуже своего зарубежного коллеги, то хорошо проверить требуемые знания, у всех учеников, по всему изученному материалу, он не в состоянии из-за господствующей у нас классно-урочной системы занятий, нехватки компьютерной техники, тестов и программ для организации автоматизированного самоконтроля - самой гуманной формы контроля знаний. Не в состоянии он это делать и физически. В силу, мягко скажем, ошибочной социальной политики зарплата наших учителей уже давно не компенсирует затраты даже физической энергии, необходимой для хорошего преподавания, не говоря уже о повышенных затратах энергии интеллектуальной, что способно совершать только раскованное, а не озабоченное поисками хлеба мышление. Как отмечается в литературе, квалифицированный работник получает у нас в три-четыре раза меньше того уровня зарплаты, за границами которого нарушается нормальная жизнедеятельность и начинается разрушение трудового потенциала.

Хотя в литературе имеются сотни примеров определений теста, с которыми либо трудно, либо вообще нельзя согласиться, это совсем не означает, что данное определение традиционного теста - истина в последней инстанции. Как и все остальные понятия, оно нуждается в постоянном улучшении. Просто оно представляется автору пока более аргументированным, чем некоторые другие известные понятия педагогического теста. Впрочем, стремление к улучшению понятий - явление совершенно нормальное и необходимое для нормально развивающейся практики и науки. Конструктивные попытки дать другие определения теста или оспорить уже имеющиеся всегда полезны, но именно этого нам не достает.

К традиционным тестам относятся тесты гомогенные и гетерогенные. Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине. Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Например, тест по физике измеряет знания, умения, навыки и представления испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике экспертно устанавливается уровень математических знаний, используемых при решении физических заданий. Превышение принятого уровня приводит к смещению результатов; по мере превышения последние все больше начинают зависеть не столько от знания физики, сколько от знания другой науки, математики. Другой важный аспект - стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение подготовленности по физике.

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам. Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Напомним, что традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой. При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а "кто знает больше". Интерпретация результатов тестирования ведется преимущественно на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так называемые процентильные нормы, показывающие - сколько процентов испытуемых имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его тестовым баллом. Такая интерпретация называется нормативно-ориентированной. Здесь вывод достраивается рейтингом: задания ответы выводы о знаниях испытуемого рейтинг, понимаемый как вывод о месте или ранге испытуемого.

Интегративные тесты. Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения. Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.

Интегративному тестированию предшествует организация интегративного обучения. К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), ещё долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности. Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий. Потребность создания интегративных тестов возрастает по мере повышения уровня образования и числа изучаемых учебных дисциплин. Поэтому попытки создания таких тестов отмечаются, в основном, в высшей школе. Особенно полезны интегративные тесты для повышения объективности и эффективности проведения итоговой государственной аттестации учащихся и студентов.

Методика создания интегративных тестов сходна с методикой создания традиционных тестов, за исключением работы по определению содержания заданий. Для отбора содержания интегративных тестов использование экспертных методов является обязательным. Это связано с тем, что только эксперты могут определить адекватность содержания заданий целям теста. Но, прежде всего, самим экспертам важно будет определиться с целями образования и изучения тех или иных образовательных программ, а затем и договориться между собой по принципиальным вопросам, оставив для экспертизы лишь вариации в понимании степени значимости отдельных элементов в общей структуре подготовленности. Согласованный, по принципиальным вопросам, отобранный состав экспертов в зарубежной литературе нередко панелью. Или учитывая различия в смысле последнего слова, в русском языке, такой состав можно назвать представительной экспертной группой. Группа подбирается так, чтобы адекватно представлять подход, используемый при создании соответствующего теста.

Адаптивные тесты. Целесообразность адаптивного контроля вытекает из необходимости рационализации традиционного тестирования. Каждый учитель понимает, что хорошо подготовленному ученику нет необходимости давать легкие и очень легкие задания. Потому что слишком высока вероятность правильного решения. К тому же, легкие материалы не обладают заметным развивающим потенциалом. Симметрично, из-за высокой вероятности неправильного решения нет смысла давать трудные задания слабому ученику. Известно, что трудные и очень трудные задания снижают учебную мотивацию многих учащихся. Нужно было найти сопоставимую, в одной шкале, меру трудности заданий и меру уровня знаний. Эта мера была найдена в теории педагогических измерений. Датский математик Г. Раск назвал эту меру словом "логит". После появления компьютеров эта мера легла в основу методики адаптивного контроля знаний, где используются способы регулирования трудности и числа предъявляемых заданий, в зависимости от ответа учеников. При успешном ответе следующее задание ЭВМ подбирает более трудным, при неуспешном - легким. Естественно, этот алгоритм требует предварительного опробования всех заданий, определения их меры трудности, а также создания банка заданий и специальной программы.

Использование заданий, соответствующих уровню подготовленности, существенно повышает точность измерений и минимизирует время индивидуального тестирования до, примерно, 5 - 10 минут Адаптивное тестирование позволяет обеспечить компьютерную выдачу заданий на оптимальном, примерно 50%-ом уровне вероятности правильного ответа, для каждого ученика.

В западной литературе выделяется три варианта адаптивного тестирования. Первый называется пирамидальным тестированием. При отсутствии предварительных оценок всем испытуемым дается задание средней трудности и уже затем, в зависимости от ответа, каждому испытуемому дается задание легче или труднее; на каждом шаге полезно использовать правило деления шкалы трудности пополам. При втором варианте контроль начинается с любого желаемого, испытуемым, уровня трудности, с постепенным приближением к реальному уровню знаний. Третий вариант - когда тестирование проводится посредством банка заданий, разделенных по уровням трудности.

Таким образом, адаптивный тест представляет собой вариант автоматизированной системы тестирования, в которой заранее известны параметрами трудности и дифференцирующей способности каждого задания. Эта система создана в виде компьютерного банка заданий, упорядоченных в соответствии с интересующими характеристиками заданий. Самая главная характеристика заданий адаптивного теста - это уровень их трудности, полученный опытным путем, что означает: прежде чем попасть в банк, каждое задание проходит эмпирическую апробацию на достаточно большом числе типичных учащихся интересующего контингента. Слова "интересующего контингента" призвано представлять здесь смысл известного в науке понятия более строгого понятия "генеральная совокупность".

Распространенная у нас образовательная модель адаптивной школы Е.А. Ямбурга, исходит, по существу, из общих идей адаптивного обучения и адаптивного контроля знаний. Истоки такого подхода можно проследить с момента возникновения педагогических трудов Коменского, Песталоцци и Дистервега, которых объединяют идеи природосообразности и гуманности обучения. В центре их педагогических систем был Ученик. Например, в малоизвестной у нас работе А. Дистервега "Дидактические правила" можно прочитать такие слова: "Преподавай сообразно природе... Учи без пробелов... Начинай преподавание с того, на чем остановился ученик... Прежде чем приступить к преподаванию, нужно исследовать точку исхода... Без знания того, на чем остановился ученик, невозможно порядочно обучить его". Недостаточная информированность о реальном уровне знаний учеников и естественные различия в их способностях усвоить предлагаемые знания стали главной причиной появления адаптивных систем, основанных на принципе индивидуализации обучения. Этот принцип трудно реализуем в традиционной, классно-урочной форме.

До появления первых компьютеров наиболее известной системой, близкой к адаптивному обучению, была так называемая "Система полного усвоения знаний".

Критериально-ориентированные тесты. При критериально-ориентированном подходе создаются тесты для сопоставления учебных достижений каждого ученика с планируемым к усвоению объемом знаний, умений или навыков. В этом случае в качестве интерпретационной системы отсчета используется конкретная область содержания, а не та или иная выборка учеников. При этом упор делается на то, что может выполнить ученик и что он знает, а не на то, как он выглядит на фоне других.

Есть свои трудности и при критериально-ориентированном подходе. Как правило, они связаны с отбором содержания теста. В рамках критериально-ориентированного подхода в тесте стараются отразить все содержание контролируемого курса или, по крайней мере, то, что можно принять за этот полный объем. Процент правильного выполнения заданий рассматривают как уровень подготовки или как степень овладения общим объемом содержания курса. Конечно, в рамках критериально-ориентированного подхода для последней интерпретации есть все основания, так как тест включает все то, что можно условно принять за 100%.

Критериально-ориентированные тесты закрывают довольно широкий спектр задач. В частности, они помогают собрать полную и объективную информацию об учебных достижениях каждого учащегося в отдельности и группы учеников; сравнить зна-ния, умения и навыки ученика с требованиями, заложенными в государственных образовательных стандартах; отобрать учеников, достигших планируемого уровня подготовленности; оценить эффективность профессиональной деятельности отдельных преподавателей и групп преподавателей; оценить эффективность различных программ обучения.

Акцент на содержательном подходе может оказать благотворное влияние на педагогическое тестирование в целом. От такого подхода выигрывает, например, интерпретация тестовых баллов при текущем контроле. Ученик получает информацию не о том, как он выглядит на фоне других, а о том, что он может делать и что знает по сравнению с заданными требованиями к уровню подготовки по предмету. Разумеется, такая интерпретация не исключает сочетания с отнесением результатов к нормам, что, как правило, происходит при текущем контроле знаний учеников в повседневном учебном процессе. В этом случае тестирование интегрировано с обучением и помогает учащемуся выявить возможные затруднения, а также своевременно исправить ошибки в усвоении содержания учебного материала.

2. Формы т естовы х заданий

В современной тестологии (Аванесов В.С., Челышкова М.Б., Майоров А.Н. и др.) различают 4 типа заданий в тестовой форме: задания на выбор одного или нескольких правильных ответов, задания в открытой форме или на дополнение, задания на установление правильной последовательности и задания на установление соответствий. Наиболее распространенной является первая форма.

Рассмотрим подробно каждую форму заданий по классификации В.С. Аванесова.

Задания на выбор одного или нескольких правильных ответов для компьютерного контроля знаний подходят больше всего. Такие задания удобно разделить на следующие виды: задания с двумя, тремя, четырьмя пятью и большим числом ответов. Инструкцией для этой формы заданий служит предложение: «Обведите (отметьте, укажите) номер правильного ответа».

Пример 1. Отметьте номер правильного ответа.

Место, которое занимает цифра в записи числа, называют

1) позицией;

2) разрядом;

3) положением;

4) знакоместом.

Задание должно быть сформулировано кратко и четко, так, чтобы его смысл был понятен при первом прочтении.

Содержание задания формулируется как можно яснее и как можно короче. Краткость обеспечивается тщательным подбором слов, символов, графиков, позволяющих минимумом средств добиваться максимума ясности смысла задания. Необходимо полностью исключить повторы слов, использование малопонятных, редко употребляемых, а также неизвестных учащимся символов, иностранных слов, затрудняющих восприятие смысла. Хорошо, когда задание содержит не более одного придаточного предложения.

Для достижения краткости в каждом задании лучше спросить о чем-нибудь одном. Утяжеление заданий требованиями что-то найти, решить и затем еще и объяснить отрицательно сказываются на качестве задания, хотя с педагогической точки зрения легко понять причину такой формулировки.

Еще лучше, когда короткими являются и задание и ответ. Неправильный, но правдоподобный ответ в американской тестовой литературе называется словом дистрактор (от английского глагола tо distract - отвлекать). В общем случае, чем лучше подобраны дистракторы, тем лучше бывает и задание. Талант разработчика проявляется в первую очередь в разработке эффективных дистракторов. Обычно считают, что чем выше доля выбора неправильного ответа, тем он лучше сформулирован. Следует отметить, что это верно только до известного предела; в погоне за привлекательностью дистракторов нередко теряется чувство меры. Привлекательность каждого ответа проверяется эмпирически.

Задания с выбором одного или нескольких ответов являются самой критикуемой формой. Сторонники привычных подходов утверждают, что по-настоящему проверить знания можно только в процессе непосредственного общения с учеником, задавая ему уточняющие вопросы, что помогает лучше прояснить подлинную глубину, прочность и обоснованность знаний. С подобными утверждениями надо согласиться. Однако есть еще вопросы экономии живого труда учителей и учащихся, экономии временных затрат и проблемы повышения эффективности образовательного процесса.

Нередко считается, что найти правильный ответ гораздо легче, чем формулировать его самому. Однако в хорошо сделанных заданиях незнающему ученику неправильные ответы часто кажутся более правдоподобными, чем правильные. Талант разработчика теста раскрывается в процессе создания именно неправильных, но очень правдоподобных ответов. Другое возражение - что тестовое задание с выбором одного или нескольких правильных ответов годится только для оценки знаний так называемого низшего уровня.

Выделяется вариант заданий с выбором одного, наиболее правильного ответа из числа предложенных. Соответственно пишется и инструкция к таким заданиям: «Обвести номер наиболее правильного ответа». Естественно предполагается, что все остальные ответы к заданиям правильные, но в различной мере.

Существует три основания для введения таких заданий в практику.

Первое - это старая идея исключения из заданий неправильных ответов, которые слабые учащиеся могут, якобы, запомнить. Если следовать этому очень спорному тезису, то неправильные ответы при тестировании вообще давать нельзя.

Второе основание для введения таких заданий в практику более реалистично. Оно касается необходимости формировать у учащихся не только умения отличать правильные ответы от неправильных, но и умения дифференцировать меру правильности ответов. Это действительно важно, как в общем среднем, так и в высшем профессиональном образовании.

Третье основание для применения заданий с выбором наиболее правильного ответа - это стремление проверить с их помощью полноту знаний.

Сколь бы ни были убедительны основания для введения таких заданий в практику, последние вряд ли могут найти широкое применение.

В заданиях открытой формы готовые ответы не даются: их должен придумать или получить сам тестирующийся. Иногда вместо термина «задания открытой формы» используют термины: «задания на дополнение» или «задания с конструируемым ответом». Для открытой формы принято использовать инструкцию, состоящую из одного слова: «Дополните».

Пример 2. Дополните.
В двоичной системе счисления 10-1=_________.
Задания на дополнение бывают двух заметно отличающихся видов:
1) с ограничениями, налагаемыми на ответы, возможности получения которых соответствующим образом определены по содержанию и форме представления;
2) задания со свободно конструируемым ответом, в котором необходимо составить развернутый ответ в виде полного решения задачи или дать ответ в виде микросочинения.

В заданиях с ограничениями заранее определяется, что однозначно считать правильным ответом, и задается степень полноты представления ответа. Обычно он бывает достаточно кратким - одно слово, число, символ и т.д. Иногда - более длинным, но не превышающим двух-трех слов. Естественно, что регламентированная краткость ответов выдвигает определенные требования к сфере применения, поэтому задания первого вида в основном используются для оценки достаточно узкого круга умений.

Отличительная особенность заданий с ограничениями на дополняемые ответы заключается в том, что они должны порождать только один, запланированный разработчиком правильный ответ.

Задания второго типа со свободно конструируемым ответом не имеют никаких ограничений на содержание и форму представления ответов. За определенное время учащийся может писать что угодно и как угодно. Однако тщательная формулировка подобных заданий предполагает наличие эталона, в качестве которого обычно выступает наиболее правильный ответ с описывающими его характеристиками и признаками качества.

В заданиях на установление соответствия преподаватель проверяет знание связей между элементами двух множеств. Элементы для сопоставления записываются в два столбца: слева обычно приводятся элементы задающего множества, содержащие постановку проблемы, а справа - элементы, подлежащие выбору.

К заданиям дается стандартная инструкция: «Установите соответствие».

Пример 3. Установите соответствие

а) - _________________, б) - _____________, в) - _____________.

Следует отметить, что желательно, чтобы в правом столбце элементов было больше, чем в левом. В этой ситуации возникают определенные трудности, связанные с подбором правдоподобных избыточных элементов. Иногда на один элемент левого множества необходимо выбрать несколько правильных ответов из правого столбца. Кроме того, соответствия могут быть расширены на три и большее число множеств. Эффективность задания существенно снижается, если неправдоподобные варианты будут легко различаться даже незнающими учащимися.

Эффективность задания также снижается в тех случаях, когда число элементов в левом и правом столбцах одинаково и при установлении соответствия для последнего элемента слева просто не из чего выбирать. Последнее правильное или неправильное соответствие устанавливается автоматически благодаря последовательному исключению элементов для предыдущих соответствий.

Тестовые задания на установление правильной последовательности предназначены для оценки уровня владения последовательностью действий, процессов и т.п. В заданиях приводятся в произвольном, случайном порядке действия, процессы, элементы, связанные с определенной задачей. Стандартная инструкция к этим заданиям имеет вид: «Установите правильную последовательность действий».

Пример 4. Установите правильную последовательность

Команда полного ветвления на УАЯ имеет формат:

Иначе <серия 2>

То <серия 1>

Если <условие>

Задания на установление правильной последовательности получают доброжелательную поддержку у многих преподавателей, что объясняется важной ролью упорядоченного мышления и алгоритмов деятельности.

Цель введения таких заданий в учебный процесс - формирование алгоритмического мышления, алгоритмических знаний, умений и навыков.

Алгоритмическое мышление можно определить как интеллектуальную способность, проявляющуюся в определении наилучшей последовательности действий при решении учебных и практических задач. Характерные примеры проявления такого мышления - успешное выполнение различных заданий за короткое время, разработка самой эффективной программы для ЭВМ и т.п.

Выбор форм заданий определяется многими весьма противоречивыми факторами, в числе которых особенности содержания, цели тестирования, а также - специфика контингента испытуемых. Проверка проще при использовании заданий закрытой формы, однако, такие задания менее информативны. Задания открытой формы более информативны, но сложнее организовать их проверку. Еще более сложной задачей является создание компьютерных программ для проверки правильности ответов на такие задания. Это связано с богатством словарного запаса испытуемых (при ответе могут быть использованы синонимы), внимательностью (опечатки, несоответствие регистров) и т.п.

Для успешной ориентировки в формах заданий можно использовать специальную таблицу (см. таблицу 1) сопоставительного анализа заданий, предложенную М.Б. Челышковой.

По мнению разработчика, настоящая таблица носит сугубо ориентировочный характер, однако, ее использование может облегчить процесс подбора тестовых заданий различной формы для решения тех или иных диагностических задач.

Таблица 1

Сопоставительный анализ характеристик тестовых заданий

Характерист ики

Задания закрытой формы

Задания на дополнение

Задания на установление соответствия

Задания на установление последовательности

Проверка знания фактов

Применение знаний по образцу

Применение знаний в нестандартных ситуациях

Простота конструирования

Исключение угадывания

Не исключено

Исключено

Не исключено

Не исключено

Объективность оценки

Исключение описок

Возможность оригинального ответа

Соответствие заданий в тестовой форме требованиям педагогической корректности содержания и формы являются необходимыми, но недостаточными условиями для того, чтобы называть их тестовыми.

Превращение заданий в тестовой форме в тестовые задания начинается с момента статистической проверки каждого задания на наличие у них тестобразующих свойств.

3. Эмпирическая проверка и статистическая обработка результатов

Наличие достаточного числа тестовых заданий позволяет перейти к разработке теста как системы, обладающей целостностью, составом и структурой. На третьем этапе отбираются задания и создают тесты, повышаются качество и эффективность теста.

Целостность теста образует взаимосвязь ответов испытуемых на задания теста, наличие общего измеряемого фактора, влияющего на качество знаний.

Состав теста образует правильный подбор заданий, позволяющий минимально необходимым числом отобразить существенные элементы языковой компетентности испытуемых.

Уровень и структура знаний выявляются при анализе ответов каждого испытуемого на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Обычно этот тестовый балл ассоциируется с понятием "уровень знаний" и проходит процедуру уточнения на основе той или иной модели педагогического измерения. Один и тот же уровень знаний может быть получен за счет ответов на различные задания. Например, в тесте из тридцати заданий испытуемый получил десять баллов. Эти баллы скорее всего, получены за счет правильных ответов на первые десять, сравнительно легких заданий. Присущую для такого случая последовательность единиц, а затем нулей можно назвать правильной структурой подготовленности испытуемого. Если же обнаруживается противоположная картина, когда испытуемый правильно отвечает на трудные задания и неправильно - на легкие, то это противоречит логике теста и потому такой профиль знаний можно назвать инвертированным. Он встречается редко, и чаще всего, по причине ошибочности теста, в котором задания расположены с нарушениями требования возрастающей трудности. При условии, что тест сделан правильно, каждый профиль свидетельствует о структуре знаний. Эту структуру можно назвать элементарной (поскольку есть еще факторные структуры, которые выявляются с помощью методов факторного анализа).

Для определения уровня структурированности подготовленности можно использовать коэффициент Л.Гутмана, ранее неточно называвшийся мерой «надежности теста».

r g = 1 -

где r g коэффициент структурированности;.

- - сумма ошибочных элементов индивидуальных структур, подсчитываемых в векторах-строках баллов испытуемых;

- N - число испытуемых;

- k - число заданий.

Уровень знаний в значительной степени зависит от личных усилий и способностей, в то время как структура знаний заметно зависит от правильной организации учебного процесса, от индивидуализации обучения, от мастерства педагога, от объективности контроля - в общем, от всего того, чего обычно не хватает. Путь к достижению этого идеала лежит через трудности создания качественных тестов.

Разработка тестов начинается с анализа содержания преподаваемых знаний и овладения принципами формулирования тестовых заданий. К сожалению, на тесты все еще смотрят как на средство, которое легко придумать, в то время как сильная сторона тестов - их эффективность, проистекающая из теоретической и эмпирической обоснованности.

На третьем этапе от разработчиков нового поколения тестов потребуется некоторая математико-статистическая подготовка, знания теории тестов. Теорию тестов можно определить как совокупность непротиворечивых понятий, форм, методов, аксиом, формул и утверждений, способствующих повышению эффективности и качества тестового процесса. Кроме того, может потребоваться и некоторый опыт применения методов многомерного статистического анализа, и опыт правильной интерпретации тестовых результатов.

Часто возникает вопрос: «Как поведут себя удаляемые задания в других группах испытуемых?» Ответ зависит от качества подбора групп, а точнее от статистического плана формирования выборочных совокупностей. Верный ответ на этот вопрос следует искать в смысле понятия «target group»; это множество испытуемых в генеральной совокупности, для которых предназначен разрабатываемый тест.

Соответственно, если задания проектируемого теста ведут себя неодинаково в разных группах, то это является, скорее всего, указанием на ошибки в формировании выборок испытуемых. Последние должны быть такими же однородными, как и испытуемые в целевой группе. На языке статистики это означает, что испытуемые в целевой и в экспериментальных группах должны принадлежать одной генеральной совокупности.

Логарифмические оценки, называемые логитами, таких, казалось бы, реально несопоставимых феноменов как уровень знаний испытуемого с уровнем трудности каждого задания, были использованы для непосредственного сопоставления уровня трудности с уровнем подготовленности испытуемого.

По мнению Беспалько В.П. и Татур Ю.Г., тестирование должно быть измерением качества усвоения знаний, умений и навыков. Сравнение правил выполнения задания (задачи), предложенного в тексте, с эталоном ответа позволяет определить коэффициент усвоения знаний (К us). Следует заметить, что, где А - число правильных ответов, а Р - число заданий в предлагаемых тестах.

Определение К us является операцией измерения качества усвоения знаний. К us поддается нормировке (0 < К us < 1), процедура же контроля усвоения легко автоматизируется. По коэффициенту судят о завершенности процесса обучения: если К us > 0,7, то процесс обучения можно считать завершенным. При усвоении знаний с К us ? 0,7 студент в профессиональной деятельности систематически совершает ошибки и неспособен к их исправлению из-за неумения их находить. Нижнюю допустимую границу окончания процесса обучения повышают до величины, необходимой с точки зрения безопасности деятельности.

4. Принципы отбора содержания. Критерии оценки содержания теста

При создании теста внимание разработчика, прежде всего, привлекают вопросы отбора содержания, которое можно определить как оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. Требование оптимальности предполагает использование определенной методики отбора, включающей вопросы целеполагания, планирования и оценки качества содержания теста.

Этап целеполагания является наиболее трудным и вместе с тем наиболее важным: от результатов его выполнения в первую очередь зависит качество содержания теста. В процессе целеполагания преподавателю необходимо решить вопрос о том, какие результаты учеников он хочет оценить с помощью теста.

Основания для ошибок в выводах педагога далеко не всегда связаны с технологическими недостатками традиционных средств контроля. Иногда они обусловлены недоработками педагога на этапе целеполагания, когда центр тяжести проверки смещается на второстепенные цели обучения, а иногда этап целеполагания отсутствует вовсе, поскольку часть педагогов уверена в непогрешимости своего опыта и интуиции, особенно при условии многолетней работы в школе. Однако никакие даже очень совершенные методы контроля и никакой опыт не дадут оснований для надежных выводов о достижении целей обучения до тех пор, пока нет уверенности в правильной постановке целей контроля и в их правильном, несмещенном отображении в содержании теста.

При создании теста ставится задача отобразить в его содержании то главное, что должны знать ученики в результате обучения, поэтому ограничиться простым перечислением целей обучения нельзя. В тест хотелось бы включить все, но, к сожалению, это невозможно, поэтому часть целей приходится просто отбросить и не проверять степень их достижения учащимися. Для того чтобы не утратить самое главное, необходимо структурировать цели и ввести определенную иерархию в их взаимное расположение. Без сомнения, здесь нет и не может быть готовых общих рецептов, поскольку в каждой дисциплине свои приоритеты. К тому же отдельные цели заметно связаны между собой, и потому простого представления о системе целей как об упорядоченной совокупности без рассмотрения связей между элементами явно недостаточно.

После определения целей тестирования и их конкретизации необходимо разработать план и спецификацию теста.

При разработке плана делается примерная раскладка процентного соотношения содержания разделов и определяется необходимое число заданий, по каждому разделу дисциплины исходя из важности раздела и числа часов, отведенных на его изучение в программе.

Раскладку начинают с подсчета планируемого исходного числа заданий в тесте, которое затем в процессе работы над тестом будет неоднократно меняться в сторону увеличения или уменьшения. Обычно предельное число не превышает 60 - 80 заданий, поскольку время тестирования выбирают в пределах 1,5 - 2 ч., а на выполнение одного задания отводится в среднем не более 2 мин.

После выполнения первого шага по планированию содержания разрабатывается спецификация теста, в которой фиксируется структура, содержание проверки и процентное соотношение заданий в тесте. Иногда спецификацию делают в развернутой форме, содержащей указания на тип заданий, который будет использоваться для оценки достижений учащихся в соответствии с намеченными целями создания теста, время выполнения теста, число заданий, особенности проведения тестирования, которые могут повлиять на характеристики теста и т.д.

Спецификация в развернутой форме включает:

1) цель создания теста, обоснование выбора подхода к его созданию, описание возможных сфер применения теста;

2) перечень нормативных документов, используемых при планировании содержания теста;

3) описание общей структуры теста, включающее перечень субтестов (если они есть) с указанием подходов к их разработке;

4) количество заданий различной формы с указанием числа ответов к закрытым заданиям, общее число заданий в тесте;

5) число параллельных вариантов теста либо ссылку на кластер, содержащую число и номера заданий кластера;

7) рекомендуемое время выполнения теста, в том числе на каждый субтест, среднее время выполнения одного задания с учетом специфики формы;

8) соотношение заданий по различным разделам и видам учебной деятельности школьников;

10) охват требований стандартов (для аттестационных тестов);

11) перечень требований, не вошедших в тест (для аттестационных тестов);

12) рекомендуемую автором стратегию расположения заданий в тесте.

Знания и умения делятся таким образом:

А - знания понятий, определений, терминов;

В - знание законов и формул;

С - умение применять законы и формулы для решения задач;

D - умение интерпретировать результаты на графиках и схемах;

Е - умение проводить оценочные суждения.

Нередко устанавливаются следующие пропорции:

А - 10%, В - 20%, С - 30%, D - 30%, Е - 10%.

Помимо критериев, есть общие принципы, способствующие в определенной степени правильному отбору содержания тестов.

Принцип репрезентативности регламентирует не только полноту отображения, но и значимость содержательных элементов теста. Содержание заданий должно быть таким, чтобы по ответам на них можно было сделать вывод о знании или незнании всей программы проверяемого раздела или курса.

Принцип системности предполагает подбор содержательных элементов, отвечающих требованиям системности и связанных между собой обшей структурой знаний. При соблюдении принципа системности тест можно использовать для выявления не только объема знаний, но и для оценки качества структуры знаний учеников.

После отбора содержания теста начинается наиболее ответственный этап создания предтестовых заданий. Эта работа поручается обычно самым опытным преподавателям с большим стажем работы в школе. Однако для создания заданий одного опыта недостаточно. Необходимы также специальные знания по теории и методике разработки педагогических тестов, обеспечивающие профессиональный подход к созданию предтестовых заданий.

В.С. Аванесов выделил 3 критерия отбора содержания тестовых заданий:

1) определенность содержания теста;

2) непротиворечивость содержания заданий;

3) обоснованность содержания тестовых заданий.

1. Определенность содержания теста образует предмет педагогического измерения. В случае гомогенного теста возникает вопрос об уверенности в том, что все задания теста проверяют знания именно по определенной учебной дисциплине, а не по какой-то другой. Довольно часто случается так, что правильные ответы на некоторые задания требуют знаний не только интересующей дисциплины, но и ряда других, обычно смежных и предшествовавших учебных дисциплин. Близость и связанность которых затрудняет точное определение предметной принадлежности измеряемых знаний.

Например, в физических расчетах используется немало математических знаний и потому в систему физического знания обычно включается та математика, которая используется при решении физических задач. Неудача в математических расчетах порождает неудачу при ответах на задания физического теста. Отрицательный балл ставится, соответственно, за незнание физики, хотя испытуемый допустил ошибки математического толка. Если в такой тест включено много таких заданий, которые для правильного решения требуют не столько физических знаний, сколько умений выполнять усложненные расчеты, то это может быть примером неточно определенного содержания теста по физике. Чем меньше пересечение знаний одной учебной дисциплины со знаниями другой, тем определеннее выражается в тесте содержание учебной дисциплины. Определенность содержания требуется и во всех других тестах. В гетерогенном тесте это достигается посредством явного выделения заданий одной учебной дисциплины в отдельную шкалу. При этом нередко встречаются задания, хорошо работающие не только на одну, но и на две, три и даже большее число шкал.

Во всяком тестовом задании заранее определяется, что однозначно считается ответом на задание, с какой степенью полноты должен быть правильный ответ. Не допускается определение понятия через перечисление элементов, не входящих в него.

© 2024 educent.ru - Портал полезных знаний для школьников и их родителей