Требования к инструкции по выполнению теста ее структуре

Руководство к тесту
составляется для его пользователей —
организаций, специ­альных психологических
служб, профес­сиональных психологов,
педагогов, психи­атров и некоторых
других специалистов. В руководстве,
как правило, излагаются следующие
сведения о тесте:

  1. сведения о процедуре
    разработки (теоретическое и операционное
    определение, сфера применения, данные
    о выборке, на которой проводилась
    стандартизация, анализ пунктов теста,
    валидности и надежности);

  2. требования к применению
    (область распространения теста,
    требования к пользователям, описание
    процедуры проведения, стандарт тестового
    материала);

  3. данные по обработке и
    интерпретации результатов (образцы
    регистрационного бланка и ключей,
    процедура обработки таблицы для
    перевода «сырых» баллов в стандартные
    шкалы (нормы), примеры интерпретации
    результатов).

А. Общие требования к информа­ции,
содержащейся в руководстве.

Пользователи тестов
нуждаются в ин­формации, которая
помогла бы применить тест стандартным
образом и оценить его в сравнении с
другими тестами, которые можно выбрать
для данной цели. Автор теста должен
представить хотя бы частич­ную
информацию, в которой нуждается
пользователь при выборе теста или при
его использовании. Практика авторов и
издателей в представлении информации
разнообразна. По некоторым тестам
пользователю представляются только
нечеткие указания к тестированию и
нормы для оценивания результатов, да
и те неизвестного происхождения.
Наоборот, другие тесты имеют руководства,
в кото­рых представлена обширная и
детальная информация о разработке
теста, его валидности и надежности, а
также нормах, ви­дах интерпретации
результатов и возмож­ных областях
его применения.

А.1.
Когда тест становится доступным для
операционного использования, он дол­жен
сопровождаться руководством, для того
чтобы сделать реальными требова­ния,
которые предъявляются к его приме­нению.
(Существенно.)

Комментарий.
Под термином «операционное пользование»
подразуме­вается принятие практических
решений относительно оценивания
индивидов, групп, учебных предметов,
терапевтичес­кой интерпретации и т.
д.

В зависимости от объема
сообщаемой информации, разнообразия
областей при­менения и пользователей,
термин руко­водство» может означать
документы мо­нографического характера
или серию от­дельных публикаций.
Данный термин мо­жет также
распространяться на процедур­ное
руководство по использованию тестов
или их батарей, например в ситуации
от­бора; словесная формулировка и
значение данных о стандартных требованиях
могут быть иными для процедурных
руководств, однако принципы составления
руковод­ства к тестам аналогичны.

А.1.1.
Если некоторая информация, необходимая
для подтверждения интер­претации
результатов, предложенных в руководстве,
не может быть представлена ко времени
публикации руководства, тре­бование
А.1 может быть удовлетворено подчеркиванием
отсутствия и важности такой информации.
(Существенно.)

А.1.2.
Если информация слишком об­ширна для
сообщения в руководстве, она должна
быть обобщена и сопровождена ссылками
на другие соответствующие ис­точники,
статьи или книги. (Очень
жела­тельно.)

Комментарий.
Некоторые тесты имеют или объемные
технические руко­водства, или включают
соответствующую информацию в справочники
для пользова­телей, которые рекомендуются
для кон­сультации. В других случаях
в руковод­стве дается только
существенная инфор­мация и ссылка
на другие полезные источ­ники.

Публикации других лиц, не
связанных с автором теста, часто
выполняют многие функции руководства
к тесту. Если подоб­ная публикация о
тесте предназначена в качестве
руководства, ее автор и издате­ли
отвечают за тест в той же степени, как
и авторы теста.

А.1.2.1.
Когда информация представ­лена
автором или издателем в отдельной
публикации, эта публикация должна
соот­ветствовать тем же требованиям,
что и руководство, и не содержать
моментов, ве­дущих к ошибкам, так же,
как это требу­ется от руководства.
(Существенно.)

А.1.2.2.
Дополнительный материал к тесту должен
быть точным и полным и не должен давать
повода для ошибочного по­нимания.
(Существенно.)

Комментарий.
В случае, когда публикатор приводит
обширную и исчер­пывающую библиографию
исследований, касающихся теста,
желательно снабдить ее комментариями
аннотациями.

А.1.2.3.
Информационный материал, предназначенный
для пользователя, не являющегося
специалистом в данной об­ласти, должен
быть точным, полностью соответствовать
целям его обращения к данному материалу
и написан языком, не допускающим
ошибочного понимания у читателя.
(Существенно.)

Комментарий.
Такая информа­ция часто дается в виде
краткой памятки. При подготовке такого
краткого сообщения может учитываться
психологическая подготовленность
читателя, но это не по­зволяет
пропускать или искажать суще­ственную
информацию. Если можно наде­яться,
что читатель постоянно имеет дело с
такими сообщениями, необходимо при­ложить
усилия к повышению его способ­ности
понимать детали.

А.2. Тест
и руководство к нему долж­ны периодически
пересматриваться. Вре­мя пересмотра
зависит от изменения условий применения
или от исследова­тельских данных,
ввиду которых некото­рые утверждения
в руководстве к тесту оказываются
неправильными или ведущи­ми к ошибкам.
(Очень желательно.)

Комментарий.
Технические ха­рактеристики и
полезность теста изменя­ются с
изменением социальных условий и
установок, определенных видов труда,
ус­ловий и содержания обучения и
состава соответствующей популяции.

А.2.1.
Перепроверки теста, проведен­ные
после его публикации, вне зависимо­сти
от благоприятности или неблагопри­ятности
для теста, должны быть учтены в
пересмотренных изданиях руководства
или в дополняющих сообщениях. В
руко­водство должны также включаться
данные не только авторов и публикаторов,
но и других исследователей. (Очень
жела­тельно.)

А.2.2.
Когда тест пересмотрен или из­дана
его новая форма, руководство к нему
должно быть соответственно пересмотре­но
с учетом изменений теста. Кроме того,
должны быть ясно указаны природа и
сте­пень пересмотра, сравнимость
данных, полученных по старому и по
пересмотрен­ному тестам. (Существенно.)

Комментарий.
Целесообразно, чтобы издатели указывали
на пересмотры руководств к тесту в
каталогах и прини­мали другие меры
для увеличения вероят­ности того,
что пользователь теста полу­чит
текущую информацию.

А.2.2.1.
Когда на основе хорошо прове­ренного
теста разработана укороченная форма,
в руководстве должны быть пред­ставлены
данные о том, что задания в уко­роченной
форме адекватны заданиям в полной форме
или что укороченная фор­ма измеряет
те же самые характеристики, что и полная
форма. (Очень
желатель­но.)

Комментарий.
Если короткая форма теста не была
разработана, но есть основание полагать,
что обычно тест ис­пользуется в
укороченной форме, в руко­водстве
должно быть напоминание для читателя,
что данные, отраженные в руко­водстве,
не могут быть приложим к ре­зультатам
использования укороченной формы.

А.2.2.2.
Если укороченная форма раз­работана
путем сокращения числа зада­ний или
преобразованием части теста в от­дельную
форму, то укороченный тест дол­жен
пройти психометрическую проверку и ее
данные должны быть приведены в
ру­ководстве. (Существенно.)

Комментарий.
В руководстве к тесту, имеющему две
альтернативные формы, необходимо
представить независи­мые данные для
каждой формы.

А.2.3.
При переводе теста с другого языка и
их адаптации в руководстве еле дует
указать все внесенные в тест изменения
и данные новой психометрической
проверки. (Существенно.)

А.3.
Наименования для публикуемых тестов
и для отдельных частей тестов должны
выбираться так, чтобы обеспечить
минимальный риск ошибок интерпретации
пользователями. (Существенно.)

Комментарий.
Желательно, чтобы наименования не
содержали многозначных терминов в
качестве измерительных характеристик.
Такие наименования как «свободный от
влияния культуры» «интеллект»,
«креативность», «интроверсия», «первичные
умственные способности», «показатель
продуктивности», сомни­тельны для
опубликованных тестов, не со­держащих
необходимых свидетельств их продуктивной
валидности, так как могут предполагать
интерпретации, не вытекаю­щие из
демонстрируемого смысла тесто­вых
оценок.

А.3.1.
Средства идентификации инте­ресов
и свойств личности путем самоотче­та
следует называть не «тесты», а
«опрос­ники», «вопросники», «оценочные
листы», «оценочные шкалы». (Очень
желатель­но.)

Комментарий.
Когда о таких ин­струментах говорится
в руководстве, сло­во «тест» может
использоваться для упро­щения языка
даже в том случае, если оно отсутствует
в наименовании.

А.4. Если
тест предназначен только для
исследовательского пользования и не
может быть распространен для широкого
применения, это должно быть ясно
выра­жено в сопровождающих материалах.
(Существенно.)

Комментарий.
Если психолог, разрабатывающий новый
диагностичес­кий тест, например, для
изучения личнос­ти, передает свой
инструмент для иссле­дований другим
научным работникам до того, как сочтет
тест готовым для опера­ционного
пользования, на обложке руко­водства,
а также в каталоге, где он заре­гистрирован,
следует печатать «Распрос­транение
только для исследовательского
пользования». Это служит предупрежде­нием
против поспешного использования
инструмента.

А.5. В
руководстве должна быть ука­зана
квалификация пользователя. (Суще­ственно.)

Комментарий.
Обычно на об­ложке руководства
ставится обозначение, соответствующее
уровню квалификации пользователя: (А)
— тестом может пользоваться любой
человек; (Б) — пользователь должен
пройти полный курс обучения психодиагностике
и иметь за­конченное высшее гуманитарное
образо­вание; (В) — пользователь
должен иметь опыт в тестировании,
подтвержденный со­ответствующими
документами, и иметь как минимум
законченное высшее психо­логическое
образование или быть членом психологической
ассоциации. При покуп­ке тестов группы
(В) обязательно предос­тавление
квалификационного документа.

Б. Сведения о процедуре разработ­ки
теста.

Ответственность за заключение
о смысле и ограничениях в использовании
тестовых результатов ложится в первую
очередь на пользователя. Однако в этом
случае он частично зависит от доступной
информации о тесте, приводимой его
со­ставителем.

Руководство к тесту не
может полнос­тью подготовить
пользователя к интерпре­тации данного
теста. Ему приходится делать выводы,
не подтвержденные опуб­ликованными
свидетельствами. Так, профориентатор
не может надеяться на на­личие данных
о валидности теста для каж­дого вида
труда, относительно которых он на основе
тестовых оценок делает наибо­лее
надежные предсказания. Специалист по
профконсультации или трудоустрой­ству
может иметь дело с испытуемыми, ко­торые
не могут быть отнесены ни к одной из
групп, для которых имеются норматив­ные
или валидационные данные. Учитель может
оценивать содержание теста дости­жений
соответственно принятым целям и
особенностям обучения, клиницист
дол­жен соотнести общие данные теории
с соб­ственной интерпретацией данных
по оп­роснику личности. Степень, с
которой ру­ководство подготовит
пользователя к точ­ной интерпретации
и эффективному ис­пользованию теста,
зависит от типа теста и способов его
применения. На составите­ля теста
возлагается ответственность за
представление информации, необходимой
для правильных суждений. Он должен
приложить все возможные усилия, чтобы
тест не был неправильно употреблен или
неправильно интерпретирован.

Б.1. В
руководстве к тесту должна быть полностью
описана процедура созда­ния теста:
его концептуальная основа, детали
разработки заданий теста и их от­бора,
психометрическая проверка надеж­ности
и валидности и другие исследова­ния.
(Существенно.)

Б.2. В
руководстве к тесту должны быть ясно
отражены теоретические поло­жения,
на которых основан тест, и подроб­но
раскрыта природа характеристик, для
измерения которых тест предназначен.
(Существенно.)

Комментарий.
Ясное описание диагностируемых
переменных, а также характер измерения
позволяют пользова­телю судить,
насколько тест соответству­ет его
собственному пониманию, а также насколько
статистические данные харак­теризуют
его действенность.

Б.2.1.
Диагностический конструкт (концепт)
должен быть сформулирован в теоретических
понятиях и соотнесен на теоретическом
уровне с системой реле­вантных
конструктов (теоретическое оп­ределение).
(Существенно.)

Б.2.2.
Особое внимание должно быть обращено
на операциональное опреде­ление
диагностического конструкта.
Опе­рациональное определение — это
опре­деление конструкта в эмпирических
кате­гориях, отражающих ситуацию, в
которых он актуализируется, а также
реакции (по­ведение, переживания,
представления), в которых данный
конструкт проявляется. (Существенно.)

Комментарий.
Пользователь те­ста нуждается в
информации, которая по­зволила бы
ему сравнивать собственную концепцию
конструкта с концепцией авто­ра
теста.

Б.3.
Руководство теста должно указать
диагностические цели и сферы приложе­ния,
для которых тест рекомендован.
(Су­щественно.)

Комментарий. Ясное указание
целей теста содействует предупреждению
ошибочного истолкования тестовых
оце­нок. Надо обратить внимание
пользовате­ля на содержание в
руководстве доказа­тельства
предложений, принятых авто­ром.
Например, если тест достижений
рекомендован как тест обследования
зна­ний учащихся, важно точное описание
его содержания. Если, с другой стороны,
он рекомендован как диагностический
тест или тест для выбора вида деятельности,
требуются данные об его связи с одним
или несколькими критериями.

Б.3.1.
Должна быть четко выделена об­ласть
применения, под которой подразу­мевается
особая социальная среда или сфера
общественной практики (производ­ство,
медицина, семейная жизнь и т. п.),
контингент испытуемых (пол, возраст,
об­разование, профессиональный опыт,
на производстве, в обществе). (Сущест­венно.)

Б.3.2. В
руководстве должны быть конкретизированы
цели использования результатов: для
прогноза успешности профессиональной
деятельности, психо­логического
вмешательства, принятия правовых,
судебно-административных ре­шений,
прогноза стабильности коллекти­ва
и т. п. (Очень желательно.)

Б.4.
Руководство к тесту должно отразить
репрезентативность выборки заданий,
процедуру их отбора и психоме­трические
характеристики заданий. (Су­щественно.)

Комментарий.
Для тестов, пред­ставляющих собой
гомогенную, дискриминативную шкалу
или набор таких шкал, процедура отбора
заданий проводится сле­дующим образом:
каждое задание прохо­дит проверку
на трудность и дискриминативность, на
соответствие заданий нор­мальному
распределению и их степень отношения
к одному фактору. Выборка для анализа
должна отражать популяцию и в общем
случае для проверки одной формы теста
состоять как минимум из 100 человек.

Б.4.1.
Данные, собранные в ходе раз­работки
теста (до получения конечной формы),
должны быть отделены от дан­ных,
относящихся к тесту в его конечной
форме. (Существенно.)

Б.5. В
случае если тест не разрабаты­вается
вновь, а переводится с другого язы­ка,
он должен пройти полную психомет­рическую
проверку, так же как вновь раз­рабатываемый
тест. (Существенно.)

Б.5.1.
При переводе руководства к тесту
проверяется эквивалентность
диагностических конструктов и концептов,
лежащих в основе тестовых задач.
(Суще­ственно.)

Стандартные требования
к надеж­ности и валидности.
Составитель
теста должен привести в руководстве
сведения о надежности и валидности
теста. Многие пользователи тестов также
выполняют подобные исследования,
опираясь на соб­ственное применение
тестов. Их научные сообщения часто
отличаются от приведен­ных в руководстве
к тесту как более де­тальные и более
специфические, описыва­ющие более
узкие сферы использования теста.
Несмотря на эти различия, в обоих случаях
стандартные требования для ис­следований
и сообщений по ним должны быть в общем
сходными.

В. Надежность и ошибка измере­ния.

Надежность — характеристика
мето­дики, отражающая точность
психодиаг­ностических измерений, а
также устой­чивость результатов
теста к действию по­сторонних случайных
факторов.

В основе анализа надежности
теста лежит представление об истинных
оценках и ошибках измерения. Распределение
оценок, полученных на генеральной
сово­купности при выполнении теста,
изме­ряющего одну характеристику,
теорети­чески должно подчиняться
нормальному закону. Поэтому при
разработке теста ис­следователю
необходимо отбирать зада­ния таким
образом, чтобы распределение реальных
тестовых оценок было по воз­можности
близко к нормальному.

Для определения ошибки
измерения используются на практике
корреляцион­ные методы, позволяющие
определить надежность через устойчивость
и согла­сованность результатов.
Классические методы оценки коэффициентов
надежно­сти требуют корреляции по
меньшей мере двух совокупностей сходных
изме­рений.

Один из методов получения
двух сово­купностей измерений — это
ретестирование (повторное обследование
одной и той же выборки испытуемых).
Несмотря на простоту и возможность
определения ус­тойчивости результатов
теста в течение времени, дефект метода
в том, что субъект помнит свои ответы,
и в случае тестов спо­собностей это
может существенно влиять на повторные
ответы.

Если мы желаем исключить
влияние запоминания на результаты
ответов как систематический источник
ошибки и учесть влияние временного
интервала на ответы, то можем использовать
две сово­купности заданий, разработанных
или ото­бранных по одной системе. Это
— парал­лельные тесты. Недостатком
в данном слу­чае является то, что
очень трудно постро­ить на практике
параллельные формы од­ного и того же
теста.

Если желательно изучить
только вли­яние содержания выборки
без влияния запоминания или вариативности
ответов во времени или если практически
нецеле­сообразно проводить две
параллельные формы в разное время,
надежность может быть оценена проведением
одного теста без ограничения во времени.
В данном случае тест может быть разделен
на две равные части. Полученные показатели
по двум частям теста коррелируются
обыч­ным методом. Но эта корреляция
отража­ет лишь надежность половины
теста. Для вычисления надежности всего
теста по методу расщепления используют
формулу Спирмена-Брауна.

Оценка надежности на основе одно­кратного
тестирования может быть полу­чена
путем использования формулы, изве­стной
как коэффициент альфа.

Рекомендуется также оценить
надеж­ность теста относительно
эксперимента­тора как оценщика и как
эксперимента­тора.

Из предыдущего видно, что
различные методы оценивания надежности
исходят из различных источников ошибок.
Так, на результаты ретестирования
влияет не только случайная вариативность
ответов или изменение субъектов во
времени, но также различия в поведении
(особенно если ретестирует другое
лицо). Коэффи­циенты надежности,
основанные на одно­кратном тестировании,
исключают вариа­тивность ответов во
времени, т. е. влияние ответов на баллы
не проявляется как ошибка измерения.
Следовательно, «коэф­фициент
надежности» — обобщенный тер­мин.
Он может основываться на разных типах
свидетельств — каждый тип пред­полагает
иной смысл. Очень важно, что­бы метод,
использованный для получения коэффициента
надежности, был четко описан.

Автору теста рекомендуется
в руко­водстве описать значение
любого коэффи­циента насколько
возможно точно. Напри­мер, высказывание:
«Этот коэффициент показывает стабильность
измерения экви­валентных баллов,
основанных на парал­лельных формах
тестов, проведенных с промежутком в 7
дней, при этом научение испытуемых
исключается» хотя и длин­ное, но
свободно от двусмысленности.

Коэффициенты надежности
имеют ог­раниченную практическую
ценность для пользователей теста.
Стандартная ошиб­ка измерения обычно
более полезна, т. к. обладает относительной
независимостью и может быть использована
для установ­ления пределов определенной
вероятнос­ти балла. Пользователи
теста могут упот­ребить коэффициент
надежности для срав­нения тестов, но
для интерпретации тес­товых баллов
используется стандартная ошибка
измерения.

В.1. В
руководстве к тесту должны быть
достаточно подробно описаны проце­дуры
и выборки, использованные для оп­ределения
коэффициентов надежности, сами
коэффициенты и ошибки измерения, что
позволит пользователю судить о том, в
какой степени эти параметры приложимы
к лицам или группам, с которыми он имеет
дело. Если некоторые из необходи­мых
данных не были получены, то отсут­ствие
такой информации должно быть от­мечено.
(Существенно.)

Комментарий.
Для пользователя важно получить
несколько типов оценки надежности.
Полезным является сообще­ние
стандартных ошибок измерения, по­лученных
в разных группах. Следует при­вести
среднее значение и дисперсию вы­борки
и информацию о ее составе. Надеж­ность
теста, предназначенного для отбора
работников, проверяется при тестирова­нии
кандидатов на должность, а не школь­ников
или уже работающих. Если указыва­ется,
что тест пригоден для различных
воз­растных групп, следует привести
данные о надежности для каждого класса
или возра­ста. Авторы и публикаторы
тестов должны избегать необщепринятых
статистических процедур, если применимы
традиционные. Если представлен
необщепринятый статистический анализ,
он должен быть объяс­нен так, чтобы
свести к минимуму вероят­ность
ошибочной интерпретации.

В.1.1. В
руководстве к тесту следует представить,
насколько это возможно, количественный
анализ всех факторов, снижающих
надежность измерения: не­согласованность
ответов субъекта; несог­ласованность
или неоднородность внутри выборки
содержания теста (стимульные задания,
вопросы, ситуации и др.); несогласованность
в проведении теста; несогласованность
между оценщиками, экспертами или
единицами математического ап­парата;
механические ошибки при выстав­лении
баллов. (Желательно.)

Комментарий.
Подобный анализ может быть неосуществим,
если результаты теста выражены не в
количественной форме, а в категориальной
или непарамет­рической.

Для группы тестов школьных
дости­жений основными источниками
ошибок, подлежащих оценке, являются:
а) несог­ласованность в содержании
теста; б) не­согласованность в
проведении теста; в) не­стабильность
ответов испытуемых. Сбор данных
производится для оценки этих трех
факторов. Колебания или несогласо­ванность
ответов субъекта сами по себе могут
быть важной переменной. Они час­то
бывают главными источниками подле­жащей
оцениванию случайной ошибки. Также
должна быть оценена несогласо­ванность
между оценщиками.

В.1.2.
Стандартные ошибки измерений и
коэффициенты надежности должны
при­водиться как для итогового балла,
так и для его частей, комбинаций баллов
(сумм, разниц, производных показателей),
если они рекомендованы в руководстве
к тесту (явно или неявно) для практического
ис­пользования, за исключением опытных
и экспериментальных. (Существенно.)

В.1.3. В
руководстве должно быть ука­зано
минимальное различие между двумя
баллами, обычно требуемое для
статис­тической значимости на
определенном уровне. (Очень
желательно.)

В.1.4. В
руководстве должны быть опи­саны все
характеристики выборки, кото­рые
могут оказывать влияние на надеж­ность
оценивания. (Существенно.)

Комментарий.
В руководстве следует отразить такую
демографическую информацию, как
распределение субъек­тов по возрасту,
полу, экономическому и интеллектуальному
уровню, трудовому статусу или прошлой
трудовой деятель­ности, месту
жительства. Для стандар­тизированных
тестов при вычислении коэффициентов
надежности выборку сле­дует формировать
случайным образом из генеральной
совокупности.

В.1.5.
Если тест рекомендован или обычно
используется в однородных под­группах,
для каждой из них независимо должна
быть исследована надежность и ошибка
измерений, и это должно быть со­общено
в руководстве к тесту. (Суще­ственно.)

В.1.6. В
руководстве к тесту должна быть сообщена
стандартная ошибка изме­рения для
разных уровней баллов. (Жела­тельно.)

Комментарий.
В руководстве к одному тесту способностей
сообщаются стандартные ошибки для трех
уровней баллов: на уровне среднего
балла, на уров­не одного стандартного
отклонения выше среднего и на уровне
одного стандартного отклонения ниже
среднего. Так как наибо­лее существенные
вариации ошибок изме­рения связаны
с крайними баллами, луч­ше опираться,
если позволяет количество доступных
случаев, на более широкий ди­апазон
уровней баллов.

В.1.7.
Неизвестные статистические характеристики
данных должны быть опи­саны со ссылками
на литературные источ­ники, отражающие
разработку. (Суще­ственно.)

Внутренняя согласованность.

В.2. В
руководстве должны быть пред­ставлены
данные о внутренней согласо­ванности
(гомогенности, консистентности тест).
(Очень желательно.)

Комментарий.
Внутренняя со­гласованность важна,
если задания рас­сматриваются как
выборка из относи­тельно однородного
общего множества (например, тест сложения
целых чисел, словарный тест для средней
школы, тест, предположительно измеряющий
интроверсию и т. п.). Меры внутренней
согла­сованности не заменяют иных
мер.

В.2.1.
Оценки внутренней согласован­ности
определяются соответствующими методами
расщепления пополам, при по­мощи
коэффициента альфа или других процедур,
которые должны быть адекват­ны
анализируемым данным. Любая другая
мера внутренней согласованности,
кото­рую автор дополнительно сообщает,
в ру­ководстве к тесту должна быть
подробно объяснена. (Очень
желательно.)

Комментарий.
Коэффициенты парного расщепления
отражают суждения экспертов и обнаруживают
тенденцию быть выше, чем коэффициенты
случайно­го расщепления. Дисперсионный
анализ обычно дает более низкие оценки
по срав­нению с приемами парного
расщепления. Могут быть полезными
специальные ко­эффициенты: они должны
быть описаны так, чтобы читатель мог
понять их соотно­шение с общепризнанными
оценками.

В.2.2.
Оценки внутренней согласованности не
следует вычислять для скоростных
тестов. (Существенно.)

В.2.3. Если
тест состоит из отдельно оцениваемых
частей или разделов, в руководстве к
тесту следует сообщить кор­реляцию
между частями или разделами вместе с
соответствующими оценками на­дежности,
а также с соответствующими средними и
стандартными отклонениями. (Очень
желательно.)

В.2.3.1.
Если в руководстве сообщает­ся
корреляция между баллом по отдельно­му
субтесту и общим тестовым баллом,
необходимо подчеркнуть, что коэффици­ент
неоправданно высок, так как он ос­нован
на совпадении ошибок измерения субтестом
и общим тестовым баллом. (Существенно.)

В.2.4.
Если несколько вопросов внут­ри теста
экспериментально связаны так, что ответ
на один вопрос влияет на другой вопрос,
предпочтительно относить целую группу
вопросов к одной из двух половин теста,
когда применяются методы случай­ного
или парного распределения пополам. Тот
факт, что число заданий в этих поло­винах
не равно, не вызывает затруднений при
соответствующей процедуре анализа.
(Очень желательно.)

Ретестирование.

В.3. В
руководстве к тесту должны быть
представлены результаты ретестиро-вания,
т. е. пользователь должен знать, насколько
оценки стабильны. (Сущест­венно.)

Комментарий.
Ретестовая на­дежность показывает,
в какой степени ре­зультаты теста
можно распространить на различные
случаи его применения. Приво­дя в
руководстве ретестовую надежность,
всегда необходимо указывать, в каком
ин­тервале времени она измерялась и
какие влияния на испытуемых имели место
в этот период. На практике ретестовая
на­дежность в ряде случаев бывает
важнее, чем надежность по однородности.
Если нет ретестовой надежности, тест
не может быть валидным. Исключение
составляют тесты, для которых
ретестирование не применяется (тесты
оценки состояний, эмоций).

Считается обоснованным
требовать оценивания стабильности для
проектив­ных техник и других средств
оценки лич­ности, даже если в некоторых
случаях известно, что низкая стабильность
ретестирования за существенный период
отражает только истинное изменение
свойства. Клиническая практика редко
до­пускает, что выводы из проективных
тес­тов приложимы к дню исследования.
Ре­ально считается, что на основе
тестовых данных принимаются прагматические
ре­шения, имеющие смысл в течение как
минимум нескольких дней, а обычно —
недель или месяцев терапии. Если
обнаруживается, что результаты некоторого
те­ста очень нестабильны при интервале
в не­сколько дней, это свидетельство
вызывает сомнения в пригодности теста
для боль­шинства целей, даже если эта
изменчи­вость может быть объяснена
гипотезой об изменчивости свойства.
Исследователь может столкнуться с
психологической ха­рактеристикой
или результатом обучения, который за
короткое время изменяется. В этом случае
важно не смешивать неус­тойчивость
свойства с нестабильностью измерения.

В.3.1.
При определении стабильности баллов
повторным тестированием целесообразно
использовать параллельные формы теста,
чтобы свести к минимуму при­поминание
отдельных ответов, особенно при небольшом
интервале между тестированиями. (Очень
желательно.)

В.3.2.
При описании исследования согласованности
баллов во времени в руководстве к тесту
необходимо указать, какой промежуток
времени прошел между тестированиями,
и привести средние стандартные отклонения
баллов для каждого тестирования, а
также коэффициент корреляции.
(Существенно.)

В.3.3. Если
есть основание ожидать, что тестовые
баллы за некоторый период существенно
изменяются в соответствии с образовательными
или развивающими воздействиями, в
руководстве следует предупредить
пользователей об этой возможности.
(Очень желательно.)

В.3.4.
При сообщении о стабильности тестовых
баллов в руководстве к тесту необходимо
описать накопление соответ­ствующего
опыта, обучение или лечение испытуемого
за период между тестирова­ниями.
(Существенно.)

Сравнимость форм.

В.4. Если
опубликованы две формы те­ста,
предназначенные для возможного
применения к тем же испытуемым, в
ру­ководстве к тесту должны быть
сообщены средние и дисперсии двух форм
вместе с коэффициентами корреляции
двух сово­купностей баллов. Если в
руководстве не представлены необходимые
данные, пользователь должен быть об
этом предуп­режден. (Существенно.)

Комментарий.
Для каждой фор­мы следует представить
обзор таких ха­рактеристик заданий,
как частотные рас­пределения
показателей трудности и дискриминативности
заданий. Следует пред­ставить также
содержательный анализ каждой формы.
Следовательно, необходи­мо отразить
как частотные распределения статистических
характеристик заданий, так и таблицы
заданий по группам их со­держания,
характеристик поведения и учебных
целей.

Формы должны включать
различные выборки заданий из каждой
категории со­держания. Искусственно
близкое сход­ство между формами может
быть вызва­но совпадением заданий
или разработкой второй формы простой
перефразировкой заданий первой формы.
Коэффициент на­дежности будет
чрезмерно высоким, т. к. не учитывается
ошибка выборки из обще­го множества
заданий.

Г. Валидность (обоснованность) теста.

Вопросы валидности — это
вопросы о том, какие и насколько
обоснованные выводы могут быть сделаны
на основе те­стовых оценок. Вопросы,
относящиеся к валидности, могут быть
сведены к двум: 1) какие выводы можно
сделать о том, что измерялось тестом;
2) какие выводы могут быть сделаны о
реальном поведении чело­века,
отличающемся от наблюдаемого при
тестировании.

1-й вопрос выясняет внутреннюю
при­роду самого измерения. Тест, как
измери­тельный инструмент, является
операционализацией психического
свойства или специфической области
умения или зна­ния. В этом плане
существенной пробле­мой является
получение заключений о полноте отражения
тестовыми баллами этой области, и в
этом смысле следует го­ворить о
внутренней (конструктной) ва­лидности.

2-м вопросом выясняется
полезность тестового измерения в
качестве предска­зателя поведения.
В этом плане суще­ственной проблемой
является получение заключения о том,
насколько тестовые баллы связаны с
некоторой другой дея­тельностью, и
в этом смысле следует го­ворить о
внешней (критериальной) валид­ности.

Важно отметить, что валидность
не измеряется, о ней только судят. В
руковод­стве могут быть приведены
коэффициен­ты валидности, но о
валидности теста для конкретного его
использования судят по набору
коэффициентов. Следовательно, валидность
есть нечто такое, о чем судят как об
удовлетворительном или неудов­летворительном
для вынесения соответ­ствующего
суждения.

Виды валидности зависят
от видов зак­лючений, которые желательно
извлечь из тестовых оценок. Традиционно
описывают три взаимозависимых типа
интерпретации заключений, обобщающих
подавляющее большинство возможностей
применения тестов: валидность по
критерию, содержа­тельная и конструктная.
Валидность по критерию может быть
предсказательной и конкурентной.

Эти аспекты могут
рассматриваться независимо друг от
друга, однако незави­симость эта
условна. Они связаны операционально и
логически, в конкретной си­туации
редко бывает, чтобы лишь один из них
был важен. Полное исследование те­ста
часто включает информацию обо всех
видах валидности.

Валидность по критерию
и ее виды.
Данная
форма валидности исполь­зуется, когда
хотят сделать вывод о связи тестовой
оценки индивида с независимы­ми от
теста внешними параметрами, назы­ваемыми
критерием. Предсказательная валидность
отражает степень, с которой будущий
уровень по критерию может быть предсказан
предшествующей деятельнос­тью по
тесту. Конкурентная валидность отражает
степень, с которой тест может быть
использован для оценки у индивида
актуального уровня по критерию. Это
раз­личие важно. Предсказательная
валид­ность включает отрезок времени,
в те­чение которого может нечто
случиться (например, люди обучаются,
приобретают опыт, подвергаются лечению).
Конкурен­тная валидность отражает
только статус индивида в фиксированное
время. При со­ответствующих условиях
данные о конку­рентной валидности
могут быть исполь­зованы для оценки
предсказательной ва­лидности теста.
Однако конкурентная ва­лидность не
может использоваться взамен
предсказательной без соответствующего
логического обоснования. Для многих
применений тестов (решение по отбору,
назначению лечения и др.) предсказатель­ная
валидность дает возможность опреде­лить
целесообразность использования те­ста
или батареи тестов в каждом отдель­ном
случае. Другие формы валидности не
заменяют валидность по критерию. В
ру­ководствах к тестам, разработанным
в предсказательных целях, а также
предназ­наченным для диагноза, должны
быть от­ражены исследования валидности
по критерию. В противоположном случае
такие тесты могут рассматриваться
только как исследовательские версии.

О сомнительности отдельного
вычис­лительного коэффициента
валидности говорят многие факторы.
Условия иссле­дования валидности
никогда точно не по­вторяются. Быстрое
изменение условий может ограничить
точность и полезность предсказательного
исследования. Логика предсказательной
валидизации предпола­гает, что
условия, существующие в нача­ле
испытаний, будут существовать и пос­ле
завершения исследования.

Логика валидности по
критерию пред­полагает валидность
самого критерия. Очень часто тесты
валидизируются отно­сительно
доступного критерия вне соот­ветствующего
исследования самого крите­рия.
Ценность исследования валидности по
критерию зависит от пригодности и
ка­чества измерения по данному
критерию. В прикладных исследованиях
критерий дол­жен выбираться в
соответствии с изучае­мой проблемой,
а тест или другое средство оценивания
должны выбираться относи­тельно
данного критерия. Если исследова­ние
предназначено в первую очередь для
улучшения представлений о том, что
из­меряется тестом, критерии должны
изби­раться на основе заключений о
природе конструкта, отражаемого
тестовыми оцен­ками. В любом случае
адекватность иссле­дования зависит
от адекватности крите­рия.

Логика валидности по
критерию пред­полагает, что выборка
полностью репре­зентативна для
популяции, для которой позднее будут
делаться заключения. На практике выборки
часто не являются реп­резентативными,
например, из-за ограни­ченного объема,
предвзятого отбора или утомления
испытуемых до завершения валидизационного
исследования.

Во многих практических
ситуациях валидизационные исследования
не могут охватить адекватного числа
случаев, и ис­следователи вынуждены
публиковать луч­шее из того, что они
могут при имеющих­ся данных. Видимо,
лучше попытаться ис­следовать
валидность по критерию хотя бы каким-то
образом, чем принять совер­шенно
непроверенную гипотезу — резуль­таты
неадекватного исследования могут
ввести в заблуждение. Особенно
сомни­тельны результаты валидизационных
ис­следований при резко ограниченном
ран­ге или малом количестве испытуемых.

Содержательная валидность.
Сви­детельства о
ней требуются, когда пользо­ватель
теста желает оценить, как индивид будет
действовать в ситуации, которую по
предположению будет представлять тест.
Содержательной валидностью обычно
ха­рактеризуются тесты умений и
знаний, оп­росники личности,
поведенческие опрос­ники или средства
измерений различных способностей.
Данное обсуждение отно­сится к
наиболее типичному случаю — те­стам
достижения.

Чтобы выразить содержательную
ва­лидность совокупности тестовых
баллов, необходимо показать, что
поведение испы­туемых при тестировании
является репре­зентативной выборкой
многих видов пове­дения в желаемой
области деятельности. Любое исследование
содержательной ва­лидности требует,
чтобы составитель или пользователь
теста определил свои цели и исчерпывающе
определил область дея­тельности в
свете этих целей. Определе­ние обычно
относится к результатам уче­ния, а
не к процессу, в ходе которого дос­тигается
или обнаруживается научение. Оно должно
быть достаточно детальным и четким,
чтобы отразить степень, с которой
компоненты деятельности образуют
цело­стную область.

Конструктная валидность.
Психо­логический
конструкт является теорети­ческой
идеей, разработанной для объясне­ния
и организации некоторых аспектов
существующего знания. Такие термины,
как «тревожность», «способность к
канцеляр­скому труду» или
«подготовленность по чтению», отражают
конструкт, но конст­рукт может
обозначать больше, чем его название.
Иногда необходимо постулиро­вать
несколько различных конструктов, чтобы
объяснить дисперсию данной сово­купности
тестовых баллов. Более того, могут
потребоваться различные конструк­ты
для объяснения дисперсии различных
тестов того же типа, или отдельный тест
может отразить данные о нескольких
кон­структах. Конструктная валидность
име­ет место при оценивании теста
или другой совокупности операций в
свете рассматри­ваемого конструкта.
Суждения по конструктной валидности
полезны, когда соста­витель или
пользователь теста желает знать об
измеренном психологическом свойстве
больше, чем позволяет отдель­ный
коэффициент валидности по крите­рию,
и особенно когда необходимо
усовер­шенствовать измерение для
научного изу­чения конструкта.

Свидетельства о конструктной
валид­ности нельзя получить в одном
отдельном исследовании — суждения о
ней основа­ны на совокупности
исследовательских результатов. Вначале
исследователь фор­мулирует гипотезы
о различии между ли­цами с высокими
и низкими результатами по тесту. Такие
гипотезы в совокупности образуют
предварительную теорию конст­рукта.
При полном изучении тест высту­пает
в качестве зависимой переменной в одних
исследованиях и в качестве незави­симой
— в других. Некоторые гипотезы могут
быть «контргипотезами» конкуриру­ющих
теорий или интерпретаций.

Гипотезы и теоретические
формули­ровки ведут к некоторым
предсказаниям о том, как люди с различными
баллами по тесту будут выполнять тест
или проявлять себя в некоторых
определенных ситуаци­ях. Если теория
исследователя верна, большинство
предсказаний должно под­твердиться.
Если этого не случится, ис­следователь
может пересмотреть опреде­ление
конструкта или перестроить тест так,
чтобы он стал лучшей мерой подразу­меваемого
конструкта. Путем последова­тельной
верификации, модификации или отклонения
гипотез исследователь все глубже
проникает в сущность измеряемо­го
тестом свойства.

Доказательства конструктной
валид­ности можно получить в ходе
разработки самого теста. Хотя
доказательства конст­руктной
валидности могут быть получены на
основе серии исследований по внешним
критериям, важно отметить, что они
не­адекватны доказательствам
пригодности конструкта для других
гипотез.

Составитель теста или любое
лицо, исследующее валидность, должны
пред­ставить по мере возможности
максимум информации о валидности, чтобы
пользо­ватель мог оценить тест по
отношению к собственным целям. В
руководстве к тес­ту необходимо
отразить данные, позволя­ющие
пользователю оценить пригодность
содержания заданий, установить, явля­ется
ли тест приемлемой мерой рассмат­риваемого
конструкта, и решить, характе­ризуется
ли тест предсказательной валид­ностью
в других подобных ситуациях.

Г.1. В
руководстве должна быть указа­на
валидность теста для всех видов
заклю­чений, для которых он рекомендуется.
Если его валидность для некоторой
пред­полагаемой интерпретации не
была изуче­на, этот факт должен быть
указан. (Суще­ственно.)

Комментарий.
Исследование ва­лидности является
частью разработки те­ста; пользователь
нуждается в том, чтобы составитель
сообщил об этом подробно в руководстве
к тесту. По меньшей мере, в руководстве
должны быть отражены ис­следования
самого составителя или дру­гих
исследователей, опубликованные в других
изданиях. Предпочтительно, чтобы в
руководстве были отражены отдельные
исследования и представлены обобщен­ные
данные о валидности для различных видов
интерпретаций или выводов.

Г.1.1.
Данные о валидности должны быть сделаны
на основании всех типов те­стовой
валидности. (Существенно.)

Комментарий.
Неправильно ис­пользовать выражение
«валидность тес­та», не указывая вид
валидности. Не суще­ствует тестов,
валидных для всех целей или во всех
ситуациях, а также для всех групп
индивидов. Любое исследование ва­лидности
относится к некоторым из воз­можных
применений или видов теста, по­лучаемых
на основе баллов.

Если тест может быть неправильно
ис­пользован в некоторых областях
примене­ния, в руководстве должны
быть специаль­ные предостережения.

Г.1.2.
Если предполагается интерпре­тация
не только баллов субтеста, но и раз­личных
индексов, в руководстве должны быть
помещены свидетельства, подтверж­дающие
правомерность такой интерпрета­ции.
(Существенно.)

Г.1.2.1.
Разработчик должен предупре­дить
пользователя о невозможности
рас­сматривать ответы на отдельные
задания теста в качестве основы для
составления заключений об испытуемом.
Если подоб­ная оценка заложена в
структуре теста, то в руководстве должно
быть приведено под­робное обоснование
такого применения.

Г.1.3.
Чтобы обеспечить правильную интерпретацию
баллов в течение длитель­ного времени,
валидность предполагаемых интерпретаций
должна периодически пе­репроверяться
и результаты сообщаться в последующем
руководстве. (Очень
жела­тельно.)

Комментарий.
Требования к тру­ду, условиям работы
и людям, работаю­щим по данной
профессии, с течением вре­мени часто
существенно изменяются. Подобным
образом изменяется смысл клини­ческих
категорий, типы медикаментозно­го
лечения, цели и содержание обучения.
Следовательно, пользователь должен
быть в состоянии судить о том, устарел
тест или нет.

Г.1.3.1.
При изменении факторов, ко­торые
могли повлиять на результаты вы­полнения
или на валидность предполага­емой
интерпретации теста, в случае если для
изменившихся условий не произве­дена
ревалидизация, тест должен быть исключен
из общего употребления и рас­пространяться
среди лиц, которые будут производить
изучение его валидности. (Очень
желательно.)

Г.1.4.
Корреляции баллов заданий с общим
тестовым баллом могут рассматри­ваться
только как показатели дискриминативности
заданий, не могут рассматри­ваться
или использоваться в качестве
ко­эффициентов их валидности.
(Сущест­венно.)

Комментарий.
Коэффициенты дискриминативности
заданий полезны при суждении о
конструктной валидности, и эту информацию
следует включать в ру­ководство к
тесту. Однако такие коэффи­циенты
являются не показателями валид­ности
теста, а только мерой внутренней
согласованности.

Г.2.
Выборка, использованная в иссле­довании
валидности, и условия, при кото­рых
проводилось тестирование, должны быть
подробно описаны, чтобы пользова­тель
мог судить, распространима ли сооб­щенная
валидность на его ситуацию. (Су­щественно.)

Г.2.1. В
руководстве к тесту следует указать
все параметры, определяющие со­став
валидационной выборки. Выборка должна
быть описана по тем переменным, о которых
известно, что они влияют на ва­лидность:
возраст, пол, социоэкономический статус,
национальное происхож­дение, также
другие демографические и психологические
характеристики. (Суще­ственно.)

Комментарий.
Если валидационные исследования
используют пациентов в качестве
испытуемых, то важно указать диагнозы.
Если возможно, то необходимо показать
обоснованность диагностики (строгость
условий диагностики). Для те­стов,
используемых в индустрии, должен быть
описан трудовой статус, профессио­нальный
опыт, пол и национальный состав выборки.
Для школьных тестов уместной является
информация о характеристиках популяции
или принципах отбора.

Г.2.2.
Доказательства валидности тес­тов
должны быть получены для субъектов,
которые по возрасту, образованию или
профессиональной подготовленности
со­ответствуют лицам, для которых
тест ре­комендуется. В руководстве
должны быть отражены отклонения от
этого требова­ния. (Существенно.)

Комментарий.
Информация о валидности тестов,
предназначенных для профориентации,
должна в общем определяться на субъектах,
тестирован­ных незадолго до
образовательного или профессионального
выбора или сразу после него.

Вопросник интересов,
стандартизиро­ванный на мужчинах,
работающих по ис­следуемой профессии,
не обеспечивает использование вопросника
в профориен­тации учащихся средней
школы, посколь­ку полученные шкалы
не дифференциру­ют группы учащихся.
Лучшее доказатель­ство было получено
после проверки воп­росника на учащихся
с определением ха­рактера из последующей
работы и уста­новлением связи между
данными вопрос­ника и последующей
профессией.

Если вопросник интересов
использует критерий приобретения или
неприобрете­ния некоторой профессии,
в выборке, ис­пользованной для его
валидизации, долж­ны быть только лица
со способностями, соответствующими
данной группе профес­сий.

Г.2.3.
При описании выборки должны быть
приведены основные статистические
данные, включая число наблюдений (и
обоснование наблюдений), меры цент­ральной
тенденции вариативности. Следу­ет
также отразить особенности распреде­ления,
возможно, с мерами асимметрии и эксцесса.
(Очень желательно.)

Комментарий.
Чем меньше объем валидационной выборки,
тем менее на­дежны статистические
данные. Когда чис­ло наблюдений очень
мало, нулевой коэф­фициент корреляции
может привести к ошибочному отклонению
валидного теста.

Г.2.4. Если
тестовые баллы в валида­ционной
выборке имеют распределение, существенно
отличающееся от распреде­ления баллов
в группе, для которой он бу­дет обычно
использоваться, то данные, основанные
на этих баллах, включая оцен­ки
параметров популяции, следует
интер­претировать с большой
осторожностью. При сообщении оценок
параметра необхо­димо привести
исходные статистические данные, а также
характеристики распре­деления,
использованные при введении новой
оценки, и использованные статисти­ческие
процедуры. (Существенно.)

Комментарий.
Пользователю ру­ководства следует
предоставить возмож­ность оценить
любое искажение, возника­ющее
вследствие нетипичности характера
выборки. Предположения, обусловливаю­щие
причины такого искажения, часто
иг­норируются, вследствие этого
невозмож­но определить степень и
направление оши­бок. Несмотря на эти
трудности, часто не­обходима оценка
подходящей статистики. Например,
коэффициент валидности дол­жен
отразить предсказательную способ­ность
в группе, к которой тест будет при­меняться.

Г.2.5.
Если тест способностей предназ­начен
для учебного или профессионального
отбора, его валидность должна
устанав­ливаться на субъектах,
заинтересованных в хорошем выполнении
заданий. Если же они являются добровольцами
или пришли к выводу, что результаты
выполнения те­ста не будут использованы
в принятии решений о них, этот факт
должен быть ясно указан (экологическая
валидность). (Очень
желательно.)

Комментарий.
В промышленном отборе для валидности
широко использу­ется метод «наличных
кандидатов на рабо­ту». Обычно он
включает тестирование реальных
кандидатов, которым указывает­ся,
что выполнение теста не влияет на их
прием на работу. Мотивационные разли­чия
могут повлиять на характер выборки,
так как вводят в ситуацию тестирования
новую переменную.

Г.2.6.
Если валидационная выборка образована
на случайно полученных или произвольно
присланных пользователями результатах
тестирования, этот факт дол­жен быть
отражен в руководстве к тесту. Пользователь
должен быть предупрежден, что группа
не является систематической или
случайной выборкой из определенной
популяции. Должны быть также указаны
возможные отборочные факторы и их
предполагаемое влияние на переменные
места. (Существенно.)

Комментарий.
Хотя вполне це­лесообразно включать
в руководство та­кие фразы, как «автор
и издатель теста будут приветствовать
дополнительные данные, полученные при
его использова­нии», крайне трудно
адекватно судить о качестве и
представительности большин­ства
сообщений о результатах валидизации,
основанной на подобных данных.

Г.2.7.
Пользователю теста должна быть известна
возможность смещения оценок в тестах
или тестовых заданиях. По возможности
следует изучить вероят­ные различия
валидности по критерию для частных
выборок, различающихся по полу,
этническому составу или другим признакам,
которые могут быть выявлены при
тестировании. В руководстве следует
сообщить результаты для каждой частной
выборки в отдельности или о том, что
раз­личия не обнаружены. (Существенно.)

Комментарий.
Во многих случа­ях опубликованные
правила требуют, ког­да это возможно,
проводить определение валидности для
выборок, отличающихся по национальности,
полу и другим демо­графическим
показателям.

Возможны и другие источники
разли­чий оценок теста в разных
валидационных выборках. Например,
расположение теста по изучению ловкости
рук на низком сто­ле может вызвать
смещение результатов у высоких людей.

Необходимы и другие
предосторожно­сти при оценке
возможности смещения. Простые различия
групповых средних сами по себе не
указывают на контамина­цию теста.
Доказательство дифференциа­ции
смещённости тестовых оценок осно­вывается
на сравнении коэффициентов корреляции,
уравнений регрессий, сред­них значений
и дисперсий каждой пере­менной.

Пригодными статистическими
кри­териями таких различий являются
для любого параметра проверки гипотез
об от­сутствии различий между группами,
на­пример отсутствие различий между
коэф­фициентами корреляций, показателями
наклона или пересечения. Другими
спосо­бами — тем, что один коэффициент
кор­реляции значимо отличается от
нуля, а другой не отличается, невозможно
дока­зать предполагаемые различия.

Необходимо учесть, что
существуют различные определения
чистоты и от при­нятого определения
может зависеть, явля­ется ли данная
процедура чистой. Более того, имеются
статистические и психоло­гические
неопределенности относительно некоторых
источников наблюдаемых различий в
валидности или регрессии. До тех пор
пока различия не наблюдаются в достаточно
больших выборках и пока от­сутствует
достаточное теоретическое (психологическое
или социологическое) объяснение
наблюдаемых различий, лю­бое различие
принимается осторожно. Смещение
обнаруживается не обязатель­но для
валидности по критерию.

Г.3.
Пользователь теста ответственен за
изучение данных, подтверждающих его
валидность и надежность. Применение
тестовых баллов при принятии решений
должно опираться на достаточные
доказа­тельства. (Существенно.)

Комментарий.
Пользователь те­ста ответственен за
понимание и оценива­ние возможности
применения теста в сво­ем исследовании.
В случае, если условия стандартизации
и проверки на валидность и надежность
теста отличаются от тех ус­ловий, в
которых работает пользователь, на
пользователя ложится обязанность
провести дополнительные исследования
валидности теста для собственного
иссле­дования. Свидетельства о
валидности не­обходимы для любого
обоснованного при­нятия решений, а
не только тогда, когда их легко получить.

Г.3.1.
Пользователи теста ответствен­ны за
сбор данных о валидности и надеж­ности
используемых методик. (Очень
же­лательно.)

Г.3.2.
Если пользователь желает при­менить
тест в ситуации, для которой такое
применение ранее не проверено на
валид­ность или для которой не
существует подтвержденных доказательств
валиднос­ти, он несет полную
ответственность за валидизацию.
(Существенно.)

Комментарий.
Тот, кто публику­ет данные о валидности,
должен обеспе­чить ее доказательства.
Зачастую данные о валидности, достаточные
для примене­ния тестов, имеются в
руководстве к тес­ту. Если пользователь
желает заявить, что валидность является
более общей, чем это отражено в
руководстве, он несет ответ­ственность
за доказательность своего ут­верждения.

Если пользователь теста
существенно изменяет инструкцию, язык,
на котором тест написан, или содержание,
он должен провести повторную валидизацию
приме­нения теста в измененных
условиях.

Валидность по критерию.

Г.4. Все
меры валидизации по крите­рию должны
быть описаны полно и точ­но. Критерии
должны быть оценены с то­чки зрения
их адекватности, надежности и
загрязненности (контаминированности),
что следует убедительно подтвер­дить.
Необходимо обратить внимание на значимые
аспекты деятельности, кото­рые
критериальные меры не отражают, и на
посторонние факторы, которые могут
оказывать влияние на эти меры.
(Суще­ственно.)

Комментарий.
Критерии явля­ются формами оценивания
и должны со­ответствовать тем же
требованиям, что и разработка любой
оценочной техники. При диагностике в
области труда и образо­вания критерием
может быть тест дости­жений или
перечень трудовых действий, достаточно
валидных по содержанию. Оценочные
суждения руководителей и пе­дагогов
являются критерием более об­щим, но
и более сомнительным по конструктной
валидности. Выводы о конструктной
валидности оценочных суждений мо­гут
быть основаны на высокой их корре­ляции
с результатами деятельности и мак­симально
не зависеть от трудового стажа. При
изучении интересов иногда не выяс­няется,
что показывает критерий: удовлет­воренность,
успешность или длительность изучаемой
деятельности. Когда группы по критерию
включают лиц данной профес­сии и
когда эти группы сравниваются с людьми
вообще, в руководстве должно быть
подчеркнуто различие между работой по
профессии и успехом или удовлет­воренностью
ею.

Г.4.1.
Особое внимание должно быть обращено
на потенциальные источники контаминации
критерия; необходимо со­общить о
результатах исследования кон­таминации.
(Существенно.)

Комментарий.
Результаты таких исследований могут
быть неоднозначны, и пользователя надо
об этом предупредить. Например, при
изучении влияния половых различий на
оценку по критерию может обнаруживаться
существенная разница между мужчинами
и женщинами. Однако этот факт сам по
себе не является доста­точным
свидетельством контаминации критерия:
он может отразить фактические половые
различия деятельности.

Г.4.2.
Когда сообщается валидность теста для
предсказаний в сфере професси­ональной
деятельности, в руководстве должны
быть описаны служебные обязан­ности
работников наряду с наименовани­ем
выполняемых ими действий. (Очень
желательно.)

Комментарий.
Принцип заклю­чается в том, что должна
даваться инфор­мация, на основе
которой пользователь мог бы судить о
состоятельности крите­рия. При
отсутствии такой информации описание
критерия часто является непол­ным.

Г.4.3.
При валидизации по критерию обычно
следует рассматривать не один, более
общий критерий, а несколько част­ных,
составляющих общий.

Комментарий.
В большинстве видов деятельности по
выполнению теста деятельность выражается
во многих пара­метрах, которые могут
быть независимы. При объединении
несвязанных аспектов поведения в единый
сложный критерий возможно игнорирование
важных зависи­мостей и тем самым
уменьшение способно­стей пользователей
идентифицировать и понимать валидные
интерпретации теста.

Отдельные решения часто
должны быть приняты на многомерной
основе. Тем не менее предпочтительнее
найти прави­ло принятия решений для
объединенных предсказаний.

Г.4.4.
Если валидность теста оценива­ется
по его соответствию психиатричес­ким
суждениям, следует указать квалифи­кацию,
опыт и профессиональный статус экспертов,
также природу и степень их контактов
с пациентами и другие потенци­ально
влияющие факторы. (Очень
жела­тельно.)

Комментарий.
Например, «пара­ноидная шизофрения,
хроническая» луч­ше, чем просто
«шизофрения». Так как типы пациентов,
подвергаемых специаль­но диагностической
классификации, в не­которой степени
зависят от выбора психи­атра, должно
быть предоставлено развер­нутое
описание каждой диагностической
категории, использованной в исследова­нии
валидности.

Г.4.6.
Коэффициенты валидности спе­цифичны
для ситуаций, в которых они получены.
Если в руководстве дано сооб­щение
о валидности для предсказания данного
вида конструкта (критерия), необ­ходимо
представить материалы, предпола­гающие
границы этого обобщения относи­тельно
характеристик популяции или вы­борки,
ситуационных переменных или ва­риации
изменения по критерию. (Очень
желательно.)

Г.4.7.
Так как критерий является вы­борочным
из всевозможных критериев того же
конструкта, валидность должна быть по
возможности определена как со­ответствие
этой выборки другим похо­жим выборкам.
Если доказательства по этому вопросу
представлены быть не мо­гут, автор
на основе суждения по кос­венным
данным должен это указать и об­судить
вероятную степень соответствия выборки
другим выборкам. (Очень
же­лательно.)

Комментарий. Если валидность
измерена, например, по соответствию
те­ста суждениям психиатров, то должна
быть описана степень согласованности
между экспертами. Если в качестве
кри­терия использован опубликованный
тест достижений, то его соответствие
па­раллельным формам или надежность,
со­общенные автором теста, могут быть
ис­пользованы как основа для оценивания
критерия при учете влияния различия
между взятой выборкой лиц и исходной
выборкой.

Г.4.8. В
руководстве должны быть от­ражены
данные о степени полноты и обоб­щенности
информации о валидности. (Очень
желательно.)

Г.4.8.1.
В руководстве к тесту должны быть
сообщены данные о валидности тес­та
относительно каждого критерия, для
которого даются рекомендации. Если для
некоторой интерпретации валидность
не выявлялась, этот факт должен быть
ясно указан. (Существенно.)

Комментарий.
Если с данным наименованием профессии
соотнесен ши­рокий круг обязанностей,
пользователей теста следует предупредить
о несостоя­тельности предположения,
что только одно сочетание интересов и
способностей соотносимо с данной
профессией.

Г.4.9.
Локальный сбор доказательств валидности
по критерию часто более по­лезен, чем
опубликованные данные. В та­ких
случаях в руководстве должен де­латься
упор на локальные исследования
валидности, а пользователи теста должны
по возможности проводить такие
исследо­вания. (Желательно.)

Г.5. В
валидизационном исследовании при сборе
данных необходимо использо­вать
процедуры, соответствующие целям
исследования. (Существенно.)

Г.5.1.
При сборе данных для валидиза­ции
исследователь, интерпретирующий
результаты теста, должен располагать
только той информацией об испытуемых,
которая обычно будет доступна при
прак­тическом использовании тестов.
Если существует некоторая возможная
конта­минация, связанная с априорным
пред­ставлением об испытуемых, в
руководстве должно быть обсуждено
влияние этого фактора на результаты
исследования. (Существенно.)

Г.6.
Любой статистический анализ ва­лидности
по критерию в руководстве дол­жен
даваться в форме, по которой поль­зователь
мог бы определить, с какой сте­пенью
доверительности можно принять утверждения
или предсказания относи­тельно
индивида. (Существенно.)

Г.6.1. В
докладе о валидности по кри­терию
должна быть отражена полная ин­формация
о выполненном статистическом анализе.
Следует включить, кроме основ­ных
описательных статистик (средних и
стандартных отклонений), еще один или
несколько показателей: а) один или более
коэффициент корреляции известного
вида; б) описание эффективности, с
кото­рой тест различает группы по
критерию; в) таблицы ожиданий; г) графики
зависи­мости между тестом и критерием.
(Суще­ственно.)

Комментарий.
Полная информа­ция включает данные
о надежности, тес­ноте и характере
зависимости. В корреля­ционное понятие
включается информация о статистической
значимости и величине коэффициента
корреляции, а также о рег­рессионном
уравнении.

Сообщение о различии между
средни­ми групп само по себе не дает
адекватной информации о валидности:
если дисперсия большая, классификация
может быть не­точной, даже если средние
различаются существенно. Теснота связи
может быть представлена описанием
количества оши­бочной классификации
или совмещений групп. Таблицы ожиданий
могут дать информацию о характере
предсказания.

В общем, так как руководство
часто пред­назначено для пользователей,
имеющих слабую статистическую подготовку,
дол­жны быть приняты все меры для
ясного со­общения валидности.

Г.6.1.1.
Коэффициент валидности дол­жен быть
дополнен сообщением о пара­метрах
уравнения регрессий и стандарт­ной
ошибкой оценки. (Очень
желатель­но.)

Комментарий.
Необходимая ин­формация может быть
представлена в таб­лице ожиданий,
показывающей величину возможных оценок
по критерию для каж­дого балла (или
группы баллов) по тестам. Очень полезна
стандартная ошибка оцен­ки для
различных точек шкалы предсказа­ний.

Г.6.2.
Если валидность теста выявляет­ся
сравнением групп, различающихся по
критерию, то в руководстве к тесту
необ­ходимо сообщить, различаются
ли группы, и насколько различаются, по
другим пере­менным. (Очень
желательно.)

Комментарий.
Так как группы, различающиеся по
критерию, могут также резко различаться
и в других отношениях, то тест может
различать качества, от­личающиеся
от подразумеваемых. Напри­мер, типы
умственного расстройства связаны с
возрастом, образованием и дли­тельностью
госпитализации. Это всегда должно быть
учтено при оценке полезно­сти теста
для диагностики.

Г.6.2.1.
Если тест предназначен для дифференциального
анализа, то в руко­водстве должны
быть приведены доказа­тельства
способности теста отнести ин­дивидов
в диагностические группы, а не только
отделять диагностируемые груп­пы от
популяции нормальных. (Суще­ственно.)

Комментарий.
Когда тест реко­мендован для отнесения
индивидов в дис­кретные категории,
то φ-коэффициенты или дискриминативные
функции должны быть дополнены таблицами
оценок оши­бочных решений. Например,
для каждой категории должен быть
определен про­цент лиц, ошибочно
исключаемых из нее. Такие проценты
должны сравниваться с базовыми оценками,
т. е. с процентами правильной классификации,
установлен­ными при максимальном
знании объема диагностируемых категорий.

Г.6.3.
Метод статистического анализа должен
выбираться с учетом характерис­тик
полученных данных и выдвинутых ги­потез.
(Существенно.)

Комментарий.
Полученные дан­ные могут очень
незначительно отличать­ся от
первоначально предполагаемых
ха­рактеристик. Однако даже небольшие
от­клонения от выдвинутых гипотез
могут приводить к серьезным ошибкам.
Напри­мер, при использовании
предсказаний, ос­нованных на
предположении о двумерном нормальном
распределении, возможна се­рьезная
переоценка средней деятельности
кандидатов с высокими баллами, если
дан­ные заметно несимметричны.

В подобных случаях валидность более
точно определяется методом, не основан­ным
на предположении о двумерном
рас­пределении.

Г.6.4.
Если коэффициенты корреляции
скорректированы с учетом ограниченнос­ти
в ранге или ослабления, то должна быть
представлена полная информация о таких
поправках. При этом проверка значимос­ти
должна быть проведена для коэффици­ентов
корреляции без поправок. (Суще­ственно.)

Комментарий.
Поправки долж­ны вноситься только к
вычисленным ко­эффициентам. Обычно
не следует делать последовательных
поправок, например по­правки на
ослабление к коэффициенту, уже
скорректированному с учетом ограни­чения
в ранге. Цепочки поправок могут быть
полезны при рассмотрении возмож­ностей
дальнейших исследований, но эти
результаты не должны представляться
как оценки корреляций в популяции.

Г.6.5.
Если валидизации подвергается батарея
тестов, в руководстве необходимо
отразить валидность суммарной оценки,
а также следует вычислить «вес» каждого
теста в итоговой оценке. (Существенно.)

Г.6.6.
Если весовое объединение тес­тов в
батареи основано на регрессионных
коэффициентах, отрицательные веса
сле­дует использовать только после
проверки на перекрестную валидность
в больших выборках и только в том случае,
когда их использование не скажется
отрицательно (и, следовательно, не будет
несправедли­вым) на одной или нескольких
подгруппах тестируемой популяции.
(Существен­но.)

Г.6.7.
Если предположено, что реше­ние должно
быть основано на сложном не­линейном
объединении баллов, необходи­мо
показать, что такое объединение име­ет
большую валидность, чем простое ли­нейное
объединение, что уравнения могут быть
логически объяснены и процедуры
объединения баллов подвергались
пере­крестной валидизации. (Существенно.)

Г.6.8. По
мере возможности пользова­телю теста,
продолжительное время рабо­тающему
с ним, следует разработать про­цедуры
отбора данных для дальнейшего
исследования. (Желательно.)

Комментарий.
Данные о валид­ности могут устареть,
на зависимость между выполнением теста
и реальной де­ятельностью могут
повлиять многие фак­торы: изменение
характеристик популя­ции, источники
ее пополнения, экономи­ческие и
организационные характеристи­ки.
Более того, исследования валидности
часто основаны на относительном малом
количестве случаев. План систематичес­кого
сбора данных уже после передачи те­ста
в пользование может быть полезным как
для разработки более надежной
стати­стической основы, так и для
информации об изменениях тенденций
зависимости с течением времени.
Продолжение исследо­вания менее
необходимо, если исходные данные
получены в относительно большой выборке,
если хорошо определена основа обобщающей
валидности. В этом случае возможно
планировать время от времени небольшие
повторные исследования вме­сто
продолжительной исследовательской
программы.

Г.7. В
руководстве должна быть указа­на
разница во времени между проведени­ем
теста и сбором данных по критерию. Если
данные по критерию собирались в те­чение
некоторого времени, должны указы­ваться
даты начала и окончания. (Суще­ственно.)

Комментарий.
Валидность мо­жет со временем
уменьшаться. В профо-риентационном
тестировании изменения содержания и
средств труда, уровня спо­собностей
популяции ориентируемых мо­гут
изменять показатели, для которых
по­лучена информация о валидности.

Г.7.1.
Пользователя теста следует пре­дупредить
о необоснованности составле­ния
долговременных прогнозов. (Суще­ственно.)

Комментарий.
Кратковременные прогнозы намного более
валидны, так как менее подвержены
влиянию разных фак­торов.

Г.7.2.
Если тест предназначен для дол­говременных,
отстоящих во времени прогнозов, но
представлены сравнения только по
конкурентному критерию, в ру­ководстве
должно быть подчеркнуто, что валидность
долговременных предсказаний осталась
неопределенной. (Существен­но.)

Г.7.3.
Если сообщается валидность те­ста
для предсказания оценки по учебному
предмету, то должна быть достаточно
яс­ная информация о видах деятельности,
необходимой при изучении данных
пред­метов, характере метода обучения
и способе измерения деятельности. Если
тест был проведен после начала изучения
пред­мета, этот факт должен быть
отмечен. (Очень
желательно.)

Содержательная валидность.

Г.8. Если
деятельность по выполнению теста
интерпретируется как репрезента­тивная
выборка из видов деятельности в общем
множестве ситуаций, в руковод­стве
необходимо дать четкое определение
учитываемого общего множества и опи­сать
критерии отбора выборки из него.
(Существенно.)

Комментарий.
В определение не должны включаться
предположения о де­терминирующих
деятельность психичес­ких процессах,
т. к. это объект не содер­жательной,
а конструктной валидности.

Г.8.1.
Если вопрос о соответствии вы­борки
заданий их общему множеству или о
точности выставления оценок решали
эксперты, в руководстве должен быть
опи­сан соответствующий профессиональный
опыт и квалификация экспертов, а также
инструкции, на основании которых
прово­дилась экспертная оценка.
(Очень жела­тельно.)

Г.8.1.1.
Если задания отобраны экспер­тами,
то должна быть обобщена степень
согласованности между их суждениями.
(Желательно.)

Г.8.1.2.
Содержание теста должно быть проверено
относительно возможно­сти смещения.
(Желательно.)

Комментарий.
Смещение может иметь место, если задания
не представля­ют сравнимых видов
деятельности и по­этому не являются
выборкой из области деятельности, общей
для различных под­групп. Такое смещение
следует выявлять с помощью достаточно
полных суждений экспертов. Изучение
установок или интер­претаций заданий
в различных подгруппах также дает
полезную информацию. Суж­дения о
смещении могут быть сами смеще­ны —
следует придерживаться принципа, что
по возможности суждения должны
подтверждаться статистическими
дан­ными.

Г.8.2. В
руководствах к тестам дости­жений
учебных результатов должна быть сообщена
система классификации, ис­пользованная
для отбора заданий. (Жела­тельно.)

Г.8.2.1.
Если тест достижений был разработан в
соответствии с двумерной схемой
«темы—процессы», в руководстве должна
быть представлена эта схема с
пе­речислением заданий, относимых к
каж­дой клетке схемы. (Очень
желательно.)

Г.8.3.
Для любого утверждения о свя­зи
заданий с изучаемым предметом (или
другими источниками содержания) в
руко­водстве должна быть указана
дата, когда изучаемый предмет был
разработан. (Су­щественно.)

Г.8.4.
Если тест описан как валидный по
содержанию труда или видов трудовой
деятельности, в свидетельствах о
валидно­сти должно быть полное
описание трудо­вых обязанностей,
относительная частота, важность, а
также уровень умений, тре­бующихся
при их выполнении. (Суще­ственно.)

Конструктная валидность.

Г.9. Если
автор интерпретирует тест как меру
диагностируемого конструкта (способности,
черты установки), то долж­на быть
полностью изложена предпола­гаемая
интерпретация. Этот конструкт должен
быть полностью ограничен от ин­терпретаций,
вытекающих из других тео­рий.
(Существенно.)

Комментарий.
Например, если тест предназначен для
измерения конст­рукта «тревожность»,
автор теста должен отразить отличия
самого определения дан­ного конструкта
от некоторого другого возможного
значения термина, которое подразумевается,
и должен соотнести свою концепцию с
мерами тревожности, рассмотренными в
литературе.

Описание конструкта может
быть простым, например определение
«креатив­ности» как «совершения
многих ориги­нальных действий». Все
подобные харак­теристики или гипотезы
являются частью авторской концепции.

Г.9.1. В
руководстве должна быть от­ражена
степень случайности предложен­ной
интерпретации и обобщены исследо­вания
гипотез, вытекающих из данной те­ории.
(Существенно.)

Г.9.1.1.
Каждое исследование, содер­жащее
теоретические выводы о тесте, дол­жно
быть отражено так, чтобы были рас­крыты
и операциональные процедуры ис­следования,
и соотнесение результатов с теорией.
(Очень желательно.)

Г.9.1.2.
В руководстве должны быть сообщены
корреляции между тестом и другими
тестами, для которых интерпре­тация
относительно ясна. (Очень
жела­тельно.)

Г.9.2. В
руководстве необходимо приве­сти
доказательства степени, с которой
дру­гие конструкты, отличающиеся от
пред­полагаемого автором, объясняют
диспер­сию баллов теста. (Очень
желательно.)

Комментарий.
Хотя неразумно требовать от автора
теста предвосхище­ния или включения
в руководство каждой противоположной
интерпретации, он все же должен
представить достаточные дан­ные о
противоположных гипотезах, наибо­лее
вероятно объясняющих дисперсию те­стовых
баллов.

Г.9.2.1.
В руководстве к любому специ­ализированному
тесту или вопроснику, используемому в
образовательном отборе, профориентации,
необходимо приводить корреляцию его
баллов с общепринятыми мерами вербальной
и вычислительной спо­собности в
соответствующей популяции. (Очень
желательно.)

Г.9.2.2.
В руководстве должна быть представлена
информация о факторных исследованиях
(если тест подвергался им), показывающих
процент тестовой дис­персии, выявляемой
хорошо известными факторами. (Желательно.)

Г.9.2.3.
Для опросников, являющихся мерами
личности, интересов или устано­вок,
должны быть представлены дока­зательства
степени, с которой оценки чувствительны
к попыткам испытуемых представить
социально желаемую (кон­формную)
картину своей личности или с которой
баллы могут отражать другие ис­кажающие
особенности ответов. Такие виды ответов
должны изучаться в первую очередь для
определенных выборок, а не для более
общей генеральной выборки. Могут быть
представлены корреляцион­ные или
экспериментальные исследова­ния.
(Очень желательно.)

Г.9.2.4.
Если тест, проводимый с огра­ничением
во времени, интерпретируется в качестве
измеряющего гипотетическое психологическое
свойство, не связанное специально с
быстротой выполнения тес­та, то должны
быть представлены свиде­тельства о
влиянии скорости на тестовые баллы и
об их корреляции с другими пере­менными.
(Существенно.)

Комментарий.
Наиболее полным доказательством влияния
скорости выпол­нения может быть
сравнение баллов по двум формам с
обычным ограничением при неограниченном
времени. Корреляция баллов этих вариантов
имеет ограничен­ный смысл, т. к. эти
два балла не являют­ся независимыми.
Менее исчерпывающим доказательством
является процент испы­туемых,
ответивших на последнее задание или
некоторое задание, близкое к концу
теста, за время, отведенное на выполне­ние
теста. Если этот процент ниже 90,
не­обходимо более глубокое исследование,
чтобы показать, что индивидуальные
раз­личия по тесту существенно не
отражают скорости.

Г.9.2.5.
Если различия в стратегии вы­полнения
теста влияют на интерпретацию баллов,
связанных с определенными ха­рактеристиками
подгрупп, об этом долж­на быть дана
ясная информация или ясно указано на
отсутствие ее. (Очень
жела­тельно.)

Г.9.2.6.
Если свидетельство против противоположной
интерпретации основа­но на низкой
корреляции при малом раз­личии между
группами, в руководстве не­обходимо
сообщить доверительность по­правки
или обсудить ошибки измерения, которые
могли снизить соответствующую
зависимость. (Желательно.)

Д. Сведения о процедуре примене­ния
теста.

Интерпретация тестов и
средств изме­рения, так же как и
результатов экспери­мента, наиболее
надежна, когда измере­ния ведутся в
стандартизированных и кон­тролируемых
условиях. Конечно, в тести­ровании
существуют ситуации, когда важ­но
систематически менять обстоятельства
для максимального понимания деятельно­сти
индивида. Например, исследователь может
систематически менять процедуры в
последовательных повторениях теста,
чтобы выяснить пределы умения ребенка
в определенной содержательной области.
Тем не менее, составитель теста должен
сам предусмотреть стандартные процеду­ры,
в которых возможна подобная модифи­кация.
Вне стандартизации качество ин­терпретации
может ухудшиться в степени, с которой
различия в процедуре влияют на результаты
тестирования.

Для большинства целей
наибольший упор делается на строгую
стандартизацию процедур проведения
тестов и инструкций к нему. Если тест
предназначен для раз­нообразных
популяций, эти процедуры должны быть
полностью доступны для всех испытуемых
из каждой популяции.

Д.1. В
руководстве к тесту должна быть указана
квалификация и специализация, необходимая
для проведения теста и его интерпретации.
(Существенно.)

Комментарий.
Однако из руко­водств в определении
квалификации, не­обходимой для
индивидуального тестиро­вания детей
данным тестом, различают психологов,
которые работают с детьми, и тех, кто
работает только со взрослыми. Другое
руководство указывает на специ­фичность
тестирования учащихся, родной язык
которых отличается от языка теста.
Квалификация пользователя может быть
описана путем указания на профиль
специального обучения, которое в общем
считается необходимым для достижения
компетентности. В некоторых руковод­ствах
к тестам могут выделяться наиболее
частые источники ошибок применения
те­ста и указываться виды обучения
пользо­вателей, дающие возможность
устранить эти ошибки.

Д.1.1.
Если тест рекомендован для не­скольких
целей и типов заключений, в ру­ководстве
следует указать степень обученности
пользователей, необходимую для каждого
применения. (Существенно.)

Д.1.2.
Если авторы предполагают, что тест
может использоваться неспециалис­тами,
то руководство должно быть напи­сано
в форме, доступной их пониманию.
(Существенно.)

Комментарий.
С тестом могут иметь дело не только
лица, специально обученные этому.
Испытуемые, члены пе­дагогических и
общественных комиссий, родители имеют
также основание для суж­дений по
тесту. Это их право не вступит в
противоречие с необходимостью сохра­нять
тайну, если им доступны описатель­ные
и объясняющие материалы.

Д.1.3.
Руководство не должно допус­тить,
чтобы тест понимался как
«самоин­терпретирующийся». В нем
должно быть указано, какую информацию
о результа­тах тестирования возможно
представить лицам, не имеющим необходимой
для ин­терпретации подготовки.
(Существен­но.)

Комментарий.
Обычно жела­тельно получать
интерпретацию оценок подготовленным
лицам. Конечно, суще­ствуют тесты,
результаты которых могут быть оценены
испытуемыми; часто полез­но сообщать
тестовые баллы учащимся и родителям.
Если это практикуется, смысл данного
требования в том, что должны да­ваться
необходимые сведения по интер­претации
этих баллов.

В руководстве должно быть
указано, что может выполняться необученным
ли­цом и что не может выполняться.
Напри­мер, в одном руководстве к
широко извест­ному тесту интересов
указывается, что ис­пытуемые могут
усвоить способы оценива­ния результатов
собственных ответов, но подчеркивается,
что они нуждаются в по­мощи
квалифицированного учителя или
консультанта при интерпретации
резуль­татов и построении планов на
будущее.

Д.2. В
руководстве к тесту следует ука­зать
степень необходимого для теста
со­хранения тайны его содержания в
ходе предварительной тренировки. (Очень
же­лательно.)

Комментарий.
Тест числового ряда предполагает
тренировочную практи­ку, для того
чтобы испытуемые лучше по­няли
инструкцию. Данная тренировочная
практика не дублирует заданий теста
и, следовательно, сохраняет содержание
са­мого теста в тайне.

Д.2.1. В
руководстве должны быть опи­саны
примеры неприемлемой практики. (Очень
желательно.)

Д.3. В
руководстве к тесту необходи­мо
отразить основные этапы процедуры его
проведения. (Существенно.)

Комментарий. Обычно последо­вательность
проведения теста такова:

1) объяснить испытуемым цель проведе­ния
теста;

  1. гарантировать сохранение тайны
    индивидуальных ответов;

  2. в соответствии с требованиями
    руководства прочитать инструкцию и
    про­вести тренировку;

  3. попросить испытуемого или
    самому за­полнить (если требуется)
    паспортные и биографические данные в
    регистра­ционных бланках;

  4. ответить на имеющиеся вопросы;

  5. обработать результаты
    теста в соответствии с требованиями
    руководства.

Д.4.
Инструкции по проведению должны быть
отражены в руководстве к тесту максимально
подробно, с подчеркивани­ем, что
пользователь теста может и должен
воспроизвести те условия тестирования,
при которых разработаны нормы и по­лучены
данные о надежности и валидности.
(Существенно.)

Комментарий.
Так как лица, про­водящие тесты в
школах и на производ­стве, иногда
могут не поступать строго по инструкциям
и не понимать необходи­мости их
соблюдения, важно, чтобы руко­водство
в этом отношении было очень убе­дительным.
Для обеспечения стандартно­сти
процедуры некоторые тесты проводят­ся
полностью механизированным спосо­бом.

Д.4.1.
Инструкции, опубликованные в руководстве
к тесту, должны быть доста­точно
полными, чтобы тестируемые пони­мали
необходимость действовать так, как
подразумевал автор теста. (Существен­но.)

Комментарий.
Например, при за­полнении опросника
личности субъект иногда может давать
первый встретив­шийся ему ответ.
Следовательно, подоб­ная возможность
должна быть указана в инструкции,
которую субъект читает или которая ему
зачитывается. Инструкция для вопросников
интересов должна опре­делить, следует
ли испытуемому отмечать то, что ему
нравится в идеале, или также следует
предусмотреть возможность того, что
ему необходимо иметь благоприятные
условия и способности этого достигнуть.
Подобным образом в инструкции необхо­димо
определить, следует ли испытуемо­му
отмечать то, что ему нравится, но
встречается иногда, или только то, что
ему нравится и встречается постоянно.

Д.4.1.1.
Инструкция должна четко под­черкнуть
такие критические моменты, как указания
об угадывании, лимиты времени и способ
ответов. (Существенно.)

Д.4.1.2.
Инструкция для тестирующе­го должна
содержать указания по поводу вопросов
со стороны испытуемых. (Очень
желательно.)

Д.4.2.
Если предусматривается воз­можность
изменения и совершенствова­ния
инструкций, описанных в руководстве к
тесту, то должны быть ясно указаны
ус­ловия, при которых позволительно
это де­лать; эти условия приводятся
или в фор­ме общих правил, или на
основе значи­тельного числа примеров,
или тем и дру­гим способом. (Существенно.)

Д.5.
Инструктаж должен подготовить испытуемого
к обследованию: необходимо предусмотреть
подборки необходимых ви­дов стимульного
материала, листы отве­тов, карандаши,
ручки и т. п. (Желатель­но.)

Д.6.
Процедуры выставления баллов по тестовым
заданиям должны быть изло­жены в
руководстве с максимальной дета­лизацией
и ясностью, чтобы уменьшить вероятность
ошибки при оценивании. (Существенно.)

Д.6.1. В
руководстве к тесту должны быть
представлены инструкции по оцени­ванию
результатов выполнения задания и
указаны процедуры предотвращения
оши­бок подсчета и вычисления. (Очень
жела­тельно.)

Д.6.2.
Если оценивание результатов теста
содержит субъективные процедуры, в
руководстве должны быть представлены
данные степени согласованности
незави­симых оценщиков в операциональных
ус­ловиях. Если таких свидетельств
не име­ется, в руководстве должно
быть обраще­но внимание на вариации
оценивания как возможный значимый
источник ошибок измерения. (Очень
желательно.)

Д.6.3.
Если в тесте используется более чем
один метод выражения ответов испы­туемыми,
руководство к тесту должно со­общить
данные о степени, с которой ре­зультаты,
полученные при использовании различных
методов, взаимозаменяемы. (Существенно.)

Комментарий.
Разное количе­ство времени, необходимого
для ответа на задания в формах,
приспособленных к раз­ным методам
выставления баллов, может влиять на
надежность или валидность те­ста, на
применимость тестовых норм.

Д.6.4.
Если использована необычная или сложная
система выставления балов, в руководстве
к тесту необходимо указать приблизительное
количество времени, необходимое для
выставления баллов по заданиям теста.
(Желательно.)

Д.6.5.
«Формулы поправки на угадыва­ние»
должны использоваться при задани­ях
с множественным выбором или при от­ветах
вида «истинно – ложно» теста на скорость
выполнения заданий. (Жела­тельно.)

Е.
Сведения о
процедуре обработ­ки и интерпретации
тестовых резуль­татов.

По традиции интерпретация
тестовых баллов является
нормированно-референ-тной, т. е.
индивидуальная оценка интер­претируется
в сравнении с оценками дру­гих
индивидов. Однако возможны и другие
интерпретации. Содержательно-референ­тная
интерпретация имеет место, если балл
интерпретируется непосредственно,
соответственно деятельности на каждой
точке измеренного континуума достижений.
Критериально-референтная интер­претация
отражает непосредственно ин­терпретацию
баллов в соответствии с де­ятельностью
в любой данной точке кон­тинуума
внешней переменной. Перемен­ной
внешнего критерия могут быть сред­ние
оценки или уровни трудовой деятель­ности.
Стандартные требования парагра­фа
в принципе относятся больше к
нормированно-референтным интерпретациям
тестов и в меньшей степени к
содержа­тельно-референтным.

Е.1.
Нормы должны публиковаться в руководстве
к тесту одновременно с пуб­ликацией
теста (для операционального использования).
(Существенно.)

Е.1.1.
Нормы должны быть определе­ны также
к тесту, разработанному только для
локального применения или только для
целей предсказания. (Желательно.)
Комментарий. Иногда
забывают, что таблицы норм дают
информацию, по­лезную не только для
сравнения индивида с групповыми данными.
Например, поль­зователь теста из
таблицы норм может из­влечь информацию
относительно уровня баллов, на котором
различительная сила измерения хороша
или плоха.

Е.1.2.
Даже если предполагается, что тест в
первую очередь будет использовать­ся
с локальными нормами, в руководстве к
тесту следует предусмотреть нормиро­вочные
данные, чтобы помочь интерпре­татору,
не имеющему локальных норм. (Очень
желательно.)

Е.2.
Нормы, представленные в руко­водстве
к тесту, должны относиться к определенным
и ясно описанным популя­циям. Этими
популяциями должны быть группы, с
которыми пользователи теста обычно
желают сравнивать тестируемых лиц.
(Существенно.)

Комментарий.
Почти во всех случаях, когда тесты
разработаны не толь­ко для локальных
целей, пользователь хо­чет знать,
насколько они применимы для различных
групп. Для тестов, разработан­ных с
целью широкого использования в школах
или в промышленности, необходи­ма
информация о различиях и сходствах
нормативных данных для таких групп,
как группы по полу, национальности,
образо­ванию или возрасту. В руководстве
долж­ны быть описаны случаи, когда
нормы для одних групп также подходят
и для других групп.

Например, руководство к
вопроснику профессиональных интересов
или к тес­там способностей, важных
для некоторых профессий, должно
подчеркивать, что лицо, получающее
высокую оценку инте­ресов или
способностей к учебному пред­мету
или профессии при сравнении со «средним»
человеком, получает более низ­кую
оценку интересов при сравнении с
ли­цами, фактически занимающимися в
этой области. Так, высокий процентильный
балл по шкале музыкальных интересов,
в которой испытуемый сравнивается со
«средним» человеком, может быть
эквива­лентен низкому процентильному
баллу при сравнении испытуемого с
профессио­нальным музыкантом.

Е.2.1.
Необходимо предотвращение ошибочного
впечатления о генерализованности
нормативных данных. (Существен­но.)

Комментарий.
Нормативные данные, полученные для
выборки людей или школ со специфическими
чертами, часто используются так, как
будто они получены по репрезентативным
общего­сударственным группам. Так,
имеются пользователи тестов, которые
могут ска­зать, что испытуемый читает
на уровне де­сятиклассника, вне учета
того, что нормы фактически получены на
основе лучших школ, добровольно принявших
участие в исследовании по разработке
теста. Ошиб­кой интерпретации является
предположе­ние, что нормы добровольных
групп уча­щихся приложимы к школам
вообще. Сфера действия таких ошибок
может быть со­кращена, если в руководстве
к тесту чет­ко определены характеристики
норматив­ной популяции.

Е.2.1.1.
В руководстве к тесту необхо­димо
сообщить метод отбора выборки из
популяции испытуемых и обсудить
веро­ятное смещение в выборочной
процедуре. (Существенно.)

Е.2.1.2.
Нормы, сообщенные в руко­водстве к
тесту, должны быть основаны на хорошо
спланированной выборке, а не на данных,
собранных в основном из-за их относительной
доступности. Любое откло­нение от
намеченного плана должно быть отражено
одновременно с описанием дей­ствий,
предпринятых или не предприня­тых в
связи с этим. (Существенно.)

Комментарий.
Нормы професси­ональных и педагогических
тестов иногда основаны на разрозненных
выборках тес­тируемых, так как авторы
иногда просят пользователей тестов
прислать результа­ты тестирования
для использования их в последующих
сообщениях о тестовых нор­мах.
Полученные таким образом распреде­ления
подвержены смещениям неизвест­ного
типа и степени. Следовательно, ме­тоды
получения выборок должны быть ясно
описаны.

Е.2.1.3.
Наряду с сообщением числа индивидов,
результаты тестирования ко­торых
были использованы при разработке
нормативных данных, руководство долж­но
также сообщить число выборочных еди­ниц
(например, классов), из которых были
взяты эти индивиды, а также число
инди­видов в каждой единице.
(Существенно.)

Е.2.2. В
руководстве к тесту описание нормативной
группы должно быть доста­точно полным,
чтобы пользователь мог судить о
пригодности для собственного применения.
В описании должно быть ука­зано число
случаев, классифицированных по одной
или более таких переменных, как возраст,
пол, социоэкономический статус,
образовательный уровень. Если взята
обобщенная выборка, в описании
норма­тивной группы должно быть
указано чис­ло отдельных тестированных
групп. (Су­щественно.)

Комментарий.
Для описания нормативных данных в
руководствах час­то используются
классификационные си­стемы в целом.
Например, в руководстве к одной методике
даны сведения для мно­гих профессиональных
и образовательных групп. Однако
отсутствие информации о таких признаках,
как пол, возраст, обра­зование и
уровень опыта, внутри этих групп
существенно уменьшает полезность норм.

Е.2.2.1.
В руководстве должны быть ясно и рельефно
описаны популяции, на основе которых
определены психометри­ческие свойства
теста и для которых при­менимы
нормативные данные. В любом сообщении
о доработке теста должны от­разиться
характеристики нормативных групп,
использованных в интерпретации
результатов. (Существенно.)

Комментарий.
Назначение этого стандартного требования
— предупредить пользователей и
испытуемых относитель­но необоснованных
интерпретаций. Если сообщение о
стандартизации представля­ет
результаты в интерпретации процен-тильных
рангов или стандартных баллов при
последовательном использовании той
же нормативной популяции, будет
доста­точным определение этой
популяции с указанием времени сбора
данных.

Е.2.3.
Если выборка, на основе которой
установлены нормы, мала или, по другим
причинам, ненадежна, в руководстве к
те­сту необходимо ясно предупредить
пользователя относительно возможности
величины ошибок при интерпретации
бал­лов. (Существенно.)

Е.2.4. В
руководстве к тесту нормы по субтестам
или группам заданий сообща­ются
только в том случае, если указана
валидность и надежность таких субтестов
или групп заданий. (Существенно.)

Комментарий.
Пользователь те­ста уверен, что, когда
даны нормы для ча­сти теста, автор
считает их пригодными для интерпретации.
Должна сообщаться также надежность и
валидность таких бал­лов.

Е.2.5. В
руководстве к тесту должны быть описаны
условия, при которых по­лучены
нормативные данные. (Сущест­венно.)

Комментарий.
В случае, когда некоторые аспекты
стандартизированы на группах кандидатов
на работу, другие — на группах,
обратившихся за профконсультацией, а
третьи — на группах, осоз­нающих себя
как испытуемые, то между такими группами
и внутри них индивиды часто различаются
по мотивации выполне­ния теста,
установке к его выполнению, способностям
и личностным характерис­тикам, хотя
точное описание этих разли­чий не
всегда возможно.

Е.3. При
сообщении норм в руковод­стве к тесту
следует пользоваться процен-тилями
для одной или нескольких подхо­дящих
референтных групп или стандарт­ными
баллами, для которых ясно опреде­лено
основание. В руководстве к тесту должны
быть даны меры центральной тен­денции
и рассеивания. (Существенно.)

Е.3.1.
Если тест используется для предсказания,
должны быть приведены, насколько это
возможно, таблицы ожида­ний или
эмпирические таблицы перевода баллов
в уровни вероятности успеха или умения.
(Желательно.)

Е.4.
Для многих применений
теста ло­кальные нормы более важны,
чем опубли­кованные. В таких случаях
руководство к тесту должно давать
возможность исполь­зования локальных
норм. (Очень жела­тельно.)

Е.5. В
руководстве к тесту должны быть полностью
описаны производные шкал, использованные
для стандартизиро­ванных баллов,
чтобы увеличить вероят­ность точной
интерпретации и понимания баллов
интерпретатором теста и испыту­емым.
(Существенно.)

Комментарий.
Целесообразно сократить число производных
шкал до не­скольких, с которыми
пользователи были бы знакомы. Существующее
разнообразие ведет к необходимости
описания таких шкал в каждом руководстве.
Проблема, в частности, в том, что теперь
используют­ся многие различные
системы, не имею­щие логических
преимуществ по сравне­нию друг с
другом. Для преодоления недо­статков
старых методов шкалирования могут быть
предложены новые. Разнооб­разие шкал
для окончательных тестовых оценок
может привести к недоразумениям и
ошибочным интерпретациям, если шка­лы,
рекомендованные для данного теста, не
описаны в руководстве ясно и полно.

Е.5.1.
Построение шкалы на основе нормативных
данных должно быть ясно и недвусмысленно
описано в терминах, пре­дотвращающих
нарушения и интерпрета­ции или
неправильные обобщения. (Су­щественно.)

Комментарий.
Производные оценки могут быть очень
полезны для вы­водов. Однако очень
часто они рассматри­ваются как имеющие
абсолютный смысл независимо от отдельного
теста и норма­тивной популяции.
Примером является коэффициент интеллекта,
который зачас­тую понимается как
просто стандартный балл, который часто
видоизменяется и ин­терпретируется
так, словно он отражает неизменную и
независимую характеристи­ку
испытуемого. Оценки эквивалентности
классу обучения или даже процентильные
ранги также могут интерпретироваться
неправильно, как некие абсолютные
вели­чины, если в руководстве к тесту
не при­ведены характеристики групп,
на которых эти оценки построены.

Е.5.2. В
руководстве необходимо ука­зать,
являются ли стандартные баллы ре­зультатом
линейной или нелинейной трансформации
суммарных баллов. (Су­щественно.)

Е.5.2.1.
Интерпретационных баллов, которые сами
по себе включают суще­ственную
ошибочность интерпретации (оценки
умственного возраста, эквивален­тности
классу обучения и др.) надо избе­гать.
(Очень желательно.)

Комментарий.
Если, несмотря на эту рекомендацию, в
руководство вклю­чены подобные
оценки, необходимо пре­дусматривать
в табличной форме также их связь со
стандартными баллами или процентильными
рангами внутри каждой ка­тегории и
внутри соответствующей нор­мировочной
группы. Например, таблица может отразить
вдобавок к баллу экви­валентности
классу обучения соответ­ствующий
процентильный ранг внутри собственного
возраста или класса испыту­емых для
каждого суммарного балла. Для старших
классов больше подходят нормы внутри
предметов, чем внутри классов.

Е.5.3.
Если в руководстве к тесту пред­полагается,
что процентильные ранги бу­дут
выражаться графически профильной
звездочкой, график должен основываться
на нормальной вероятностной шкале или
на некоторой другой приемлемой
нелиней­ной трансформации. (Очень
желатель­но.)

Е.6. Если
шкалы пересмотрены, добав­лены новые
формы или сделаны другие изменения, в
пересмотренном руковод­стве к тесту
должны быть помещены таб­лицы
эквивалентности старой и новой форм.
(Желательно.)

Комментарий.
Новые формы те­ста должны быть
приравнены к недавно определенным
шкалам стандартных бал­лов других
форм, чтобы пользователь мог быть
уверен, что баллы, предложенные по новым
формам, сравнимы с баллами пре­дыдущих
форм.

Е.6.1.
Если новая форма теста прирав­нена
к старой, в пересмотренном руковод­стве
должно быть описано содержание и старой
и новой форм, а также характер нормативных
групп для них. (Сущест­венно.)

Комментарий.
Изменения в зна­ниях, технологии или
учебном материале могут потребовать,
чтобы новое издание тестов существенно
отличалось от пре­жних, а потребность
преемственности требует приравнивания
окончательных шкал друг к другу.
Пользователь должен иметь возможность
оценить эквивалент­ность в соответствии
с изменениями со­держания, поскольку
у него возникают сомнения, возможно ли
значимое сравне­ние баллов при
изменении содержания.

Е.6.2. В
руководстве должен быть опи­сан метод
установления эквивалентности или
сравнимости оценок и должна быть дана
оценка точности процедуры прирав­нивания.
(Очень желательно.)

Е.7. Если
предполагается, что тест бу­дет
использоваться не столько для оцен­ки
индивидов, сколько групп (например, для
школ или программ), должны быть
представлены нормативные данные,
осно­ванные на суммарных групповых
статис­тиках. (Существенно.)

Комментарий.
Например, неце­лесообразно оценивать
школы применени­ем норм, разработанных
для оценки инди­видов. Также нельзя
вычислять групповые средние по нелинейным
шкалам, напри­мер по процентильным
рангам, выведен­ным для индивидуальных
норм.

Е.8.
Тест, руководство, формы записи ответов
и другие сопровождающие мате­риалы
должны помогать пользователю правильно
интерпретировать результаты теста и
предупреждать неправильное его
употребление. (Существенно.)

Комментарий.
Многие руковод­ства к тестам
подчеркивают переменные, которые
следует учитывать при интерпре­тации
тестовых оценок. Это может быть информация
об учебных достижениях, ре­комендации
или соответствующие анамне­стические
данные.

Е.8.1.
Руководство к средству оценивания
личности может включать данные,
пока­зывающие, что психолог должен
учиты­вать такие факторы, как пол и
возраст субъекта, женаты или разведены
его роди­тели, возраст и пол его детей,
его профес­сиональный и супружеский
статус и т. д.

Е.8.2.
Руководство к тесту должно под­черкнуть
те существенные влияния на тестовую
оценку, которые связаны с реги­оном,
социоэкономическим статусом,
на­циональностью или полом.
(Существен­но.)

Е.9.
Руководство должно обратить вни­мание
пользователя на публикации, с ко­торыми
он должен ознакомиться до тести­рования
для более точной интерпретации
результатов теста. (Очень
желательно.)

Комментарий.
Публикациями могут быть книги или
статьи, относящие­ся к смежным
психологическим теориям или к самому
тесту, о котором идет речь.

Е.10.
Изложение описываемых в руко­водстве
зависимостей по смыслу являет­ся
количественным и должно быть приве­дено
с точностью, которую позволяют дан­ные.
Если данные в поддержку таких ут­верждений
не были собраны, этот факт должен быть
ясно указан. (Существен­но.)

Комментарий.
Авторы, напри­мер, иногда пишут: «Для
инженера-архи­тектора требуется
способность простран­ственного
мышления» или «Необычные ответы могут
указывать на наличие ши­зофрении».
Такие утверждения сами по себе
количественно неадекватны. Какая
частота эксцентрических ответов
указы­вает на уже развившуюся
шизофрению? Насколько успех в архитектуре
зависит от пространственной способности?
Количе­ственные данные, связывающие
тестовые оценки с определенными
критериями, дол­жны помочь получить
ответы.

Е.10.1.
Для сообщения количествен­ной
информации предпочитаются хорошо
известные и легко интерпретируемые
ста­тистические процедуры. Любая
необще­принятая статистическая
техника должна быть объяснена, и должны
быть приведены ссылки на источники.
(Существенно.)

Комментарий.
Издатели не обя­зательно должны
однообразно придержи­ваться процедур,
широко используемых для сообщения
данных, но технологии и процедуры должны
быть довольно извес­тными на практике,
чтобы компетентные пользователи могли
адекватно судить о ре­зультатах.

Это стандартное требование
является конкретизацией принципа, что
представ­ленные в руководстве данные
не должны вводить в заблуждение.
Например, оши­бочно показывать
ценность объединенных в батарею тестов
в уравнении регрессии путем использования
данных с интеркор­реляцией более
низкой, чем о ней сообща­лось в другом
месте руководства.

Е.10.2.
Когда сообщается статистичес­кая
значимость, сообщение должно быть в
форме, которая делает ясным чувстви­тельность
или мощность критерия значи­мости.
(Существенно.)

Комментарий.
Статистическая значимость, не имеющая
практической полезности, часто может
быть получена использованием очень
большого числа случаев. Наоборот, тот,
кто использует не­чувствительный
статистический крите­рий, может
сделать ошибочный вывод об отсутствии
важного в практическом смыс­ле
различия. В общем, при сообщении тестовых
данных более приемлемо опре­делить
доверительный интервал или фун­кцию
правдоподобия интересующего параметра,
а не просто сообщить, что нулевая
гипотеза может или не может быть
откло­нена.

Е.10.3. В
руководстве должны ясно различаться
интерпретация, которая приложима только
к средней тенденции груп­пы, и
интерпретация, приложимая к любо­му
индивиду внутри группы. (Сущест­венно.)

Комментарий.
Некоторые тесты достаточно надежны
для обеспечения от­носительно
стабильного среднего балла группы, но
недостаточно надежны, чтобы обеспечить
использование индивидуаль­ных баллов
или позволить сравнение ин­дивидов.

Е.10.4. В
руководстве должно быть ясно указано,
какая интерпретация отно­сится к
каждому баллу субтеста в той же степени,
как и для всего теста. (Суще­ственно.)

Комментарий.
В руководстве должно быть четко указано,
когда баллы субтестов получены только
для простоты вычисления балла всего
теста и не пред­лагают самостоятельного
использования, когда они могут иметь
исследовательское применение, и
предусматривается ли при этом их
интерпретация.

Е.11.
Составители тестов или другие лица,
использующие ЭВМ для интерпре­тации
тестов, должны предусмотреть ру­ководство,
отражающее алгоритм и свиде­тельства
в поддержку интерпретации бал­лов
на основе ЭВМ. (Существенно.)

Комментарий.
Вычислительная машина позволяет
накопить и воспроизве­сти большое
количество данных. Интер­претация
теста может быть очень об­легчена
использованием банка данных, на­копленных
в ЭВМ на основе совокупнос­ти
индивидуальных оценок по батарее
те­стов или вопроснику личности.

Пользователь таких массивов
должен знать обоснование и свидетельства
в пользу предполагаемой интерпретации,
так как она подвержена ошибкам в той
же степени, как и другие субъективные
ин­терпретации.

Данный пункт относится только к хра­нению
и обработке информации, введен­ной
в ЭВМ.

Проведение тестов
неавтоматизирова­но и осуществляется
обычным способом. В том случае, когда
пользователь хочет автоматизировать
и проведение теста, тест должен пройти
полную психометри­ческую проверку.

Наверняка вы сами хоть раз в жизни составляли тесты и уж точно неоднократно проходили разнообразное тестирование – от серьезного до совсем шуточного из серии «Какой ты овощ во время карантина?».

Очень часто, за неимением нужных знаний и подготовки, разработчики придумывают тесты, опираясь исключительно на свой опыт, интуицию и здравый смысл (за исключением «овоща на карантине»). Многие, приступая к разработке собственных тестов, поначалу думают: что тут может быть сложного? Составить вопросы, придумать к ним ответы — вот и вся недолга! Это очень глубокое заблуждение. Создание хорошего задания в тестовой форме – настоящее искусство. 

Существуют разработанные учеными методики составления тестовых заданий. В этой статье я хочу рассказать об одной из таких методик, которую используют в системе общего и профессионального образования. В частности, ее нередко применяем и мы в учебном центре «Сетевая Академия ЛАНИТ» для разработки проверочных тестов и систем аттестации сотрудников.

Источник

Вместо предисловия

Почему я решила, что вам это может пригодиться? Во-первых, потому что многим из вас – людям, совсем далеким от педагогики, приходится проводить разнообразные обучающие мероприятия, разрабатывать учебные курсы и т.п., а все это требует проверки усвоения учебного материала. А какой еще способ, кроме тестирования, способен проверить знания быстро, надежно и объективно?

Во-вторых, потому что использование педагогических тестов актуально не только для образования, но и для областей, весьма далеких от него. Тесты – очень полезный инструмент для решения многих задач: и для аттестации сотрудников, и для первичной проверки соответствия знаний и навыков соискателей вакансии, и для оценки степени информированности аудитории о какой-либо проблеме, и много для чего еще. 

Сразу оговорюсь, что эта статья в первую очередь рассчитана на людей, не имеющих большого опыта в составлении тестовых заданий. Ее цель – предоставить новичкам достаточный объем материала, который помог бы им научиться составлять качественные педагогические тесты разных видов.

Да простят меня «продвинутые» в вопросах тестовой теории читатели, речь пойдет о базовых сведениях. Хотя, как показывает практика, вспомнить основы тоже никогда не вредно. 

Методику, о которой пойдет речь, разработали ведущие отечественные специалисты в области тестологии: В. С. Аванесов, М. Б. Челышкова, А.Н. Майоров и другие. 

В качестве примеров приводятся тестовые задания из открытого банка заданий ЕГЭ, размещенного на официальном сайте ФГБНУ «Федеральный институт педагогических измерений», из книги М. Б. Челышковой «Теория и практика конструирования педагогических тестов», из книги В. С. Аванесова «Композиция тестовых заданий», а также задания, составленные автором статьи и преподавателями разных образовательных организаций.

Сначала немного теории

Говоря о тестах в разных сферах деятельности, подразумевают разное. Например, в вычислительной технике тест – это задача с известным решением, с помощью которой проверяется правильность работы системы, а в медицине тестом будет называться метод исследования, заключающийся в пробном воздействии на организм. В общем понимании, тест – это объективное и стандартизированное измерение, которое легко поддается количественной оценке, статистической обработке и анализу. 

В рамках наших целей нас интересует педагогический тест со своей спецификой. Это система тестовых заданий различной трудности, созданная для качественного и эффективного измерения структуры и качества подготовленности испытуемых. Тестовое задание является одним из элементов педагогического теста, включает в себя инструкцию, тестовую задачу и эталон ответа.

Преподаватели используют тесты, чтобы:

  1. оценить исходные знания учащихся перед началом обучения и скорректировать план и содержание занятия; 
  2. сделать срез знаний во время курса, чтобы вовремя внести изменения в процесс обучения, если слушатели недостаточно хорошо усваивают учебный материал;
  3. проверить финальный результат обучения.

Наиболее часто используются закрытые тесты, в которых ответы уже есть, как в игре «Кто хочет стать миллионером?». Но встречаются и открытые тестовые задания, требующие самостоятельно сконструировать или дополнить ответ.

Итак, выполняя закрытые тесты, обычно надо:

  • выбрать один или несколько ответов среди заданных вариантов;
  • установить соответствие между элементами двух множеств; 
  • установить правильный порядок действий или процессов, перечисленных автором теста.

Открытые тесты требуют:

  • дополнить имеющийся ответ;
  • полностью сконструировать ответ самостоятельно.

Какой материал следует включить в тест

Содержание теста зависит от того, какие цели вы перед собой ставите и зачем вам вообще нужен этот тест. Прежде всего, нужно самому себе ответить на вопрос, можно ли с помощью составленных вами заданий проверить подготовленность аудитории. 

Вот такое тестовое задание предложил своим ученикам преподаватель анатомии по теме «Скелет грудной клетки». Одна из целей занятия – знать количество ребер у человека. 

Инструкция

: Выберите один правильный ответ.
Количество ребер 

  1. у мужчин больше, чем у женщин
  2. у женщин больше, чем у мужчин
  3. индивидуально у каждого человека
  4. зависит от жизненных обстоятельств

Как вы понимаете, при помощи этого задания невозможно проверить, знают испытуемые, сколько у человека ребер или нет. Поэтому, строго говоря, нет смысла включать такой тест в материалы контроля. Отдельный разговор о качестве подобранных автором вариантов ответа. Особенно интересно влияние жизненных обстоятельств на количество ребер. Но правила подбора неправильных ответов (дистракторов) к тестовым заданиям мы рассмотрим позже.

Основные правила подбора материала для теста следующие:

  1. Материал, заложенный в тест, должен соответствовать содержанию темы тестирования и программы учебного курса.
  2. В тест включается только то содержание темы, которое является признанным, объективно истинным и поддается рациональной аргументации. Спорные точки зрения в тестовые задания включать не рекомендуется. Суть тестовых заданий заключается как раз в том, что они требуют четкого, заранее известного преподавателям ответа, признанного ими в процессе разработки заданий объективно истинным.
  3. Уровень детализации содержания теста зависит от целей тестирования. Если вы планируете использовать тесты для сравнения уровня подготовки тестируемых в какой-то области (например, для конкурсного отбора соискателей вакансии или кандидатов на обучение), то уровень детализации материала должен быть низким. В заданиях такого теста достаточно отобразить только наиболее значимые элементы содержания.
  4. Если же тесты предназначены для выяснения, насколько успешно испытуемый освоил учебный материал (курс, раздел, тему) и освоил ли он его вообще, то уровень детализации области содержания должен быть довольно подробным. Это позволит сделать вывод о знаниях каждого испытуемого, при необходимости аттестовать его, а также проанализировать, какой материал лучше или хуже освоили испытуемые.
  5. Вместе с тем в тест необходимо включать те элементы содержания, которые можно отнести к наиболее важным, без которых знания по заявленной теме становятся несущественными. Нет смысла перегружать тест второстепенными деталями, не имеющими большого значения. 
  6. Если с помощью тестовых заданий планируется оценивать знания по всему учебному курсу, следует равномерно включить в итоговый тест задания по всем изучаемым темам курса, убедившись в том, что они охватывают все самые важные аспекты предметной области и в правильной пропорции.

    Например, если вы составляете тесты по курсу «Microsoft Excel» и включаете в него задания, посвященные исключительно созданию сводных таблиц и диаграмм, то при помощи этих тестов вы явно не сможете полноценно оценить уровень знаний по всему курсу в целом. 

  7. Не всякое содержание можно выразить в форме тестового задания, то есть тесты – не универсальная форма для проверки знаний. 

Сколько времени нужно выделить для тестирования

Сидеть над тестом невозможно бесконечно долго: начало и завершение тестирования должны быть фиксированными. К сожалению, довольно часто временной интервал для этого процесса выбирается спонтанно. И если ошибиться – дать слишком мало времени или слишком много, эффективность теста снизится.

Тестирование в спешке приведет к тому, что как «слабые», так и «сильные» испытуемые не успеют выполнить все задания, и мы не поймем – тестируемый не выполнил задание, поскольку не знал ответа, или вообще не успел к нему обратиться.

Если времени вагон и маленькая тележка, «сильные» испытуемые, успевшие быстро пройти тестирование, начинают отвлекать других, подсказывать ответы, что нарушает процедуру тестирования (мы не соблюдаем правило равных условий для всех испытуемых). 

Если человек проходит тестирование в одиночестве или тестируется онлайн, при избытке времени он будет долго сидеть над заданиями, не решаясь выбрать ответ. Это вызовет утомление, снижение концентрации внимания, расслабление, что также снижает точность тестирования.

Всегда нужно иметь в виду, что испытуемые устают. А значит, тестирование не должно занимать слишком много времени, что напрямую связано с объемом самого теста. Практика показывает, что объем осознанно воспринимаемой информации начинает существенно снижаться примерно через 40-45 минут с начала тестирования (Ким В. С. Тестирование учебных достижений. – Уссурийск, 2007, стр. 29-35). 

Общее время тестирования определяется количеством и сложностью заданий. Некоторые преподаватели используют, например, такие методики расчета времени тестирования: 

  1. Время, затраченное преподавателем на выполнение составленного им теста, умножить на 3.
  2. Суммировать время, необходимое для выполнения каждого задания:

    • задание закрытой формы с выбором одного правильного ответа – примерно 10 секунд;
    • задание более сложных форм – в среднем от 30 секунд до 1 минуты.

Однако бывает, что теоретически рассчитать время тестирования невозможно, поэтому рекомендуется использовать эмпирические данные по результатам первичной апробации теста.

Составление тестовых заданий закрытой формы 

А теперь давайте рассмотрим конкретные примеры и поймем, как составлять свои тесты. В фокусе нашего внимания – тестовые задания закрытой формы.

В таких тестовых заданиях выделяют следующие элементы:

  • инструкцию (содержит общие требования к выполнению задания – рис. 1);
  • основную часть (задание, постановка проблемы – рис. 2);
  • варианты ответа (верный ответ(ы) и ответы-обманки – рис. 3).

Рекомендуется, чтобы задания в тесте представляли собой не вопросы, а утверждения, которые в зависимости от ответов могут превращаться в истинные или ложные высказывания. 

Среди готовых ответов правильным чаще всего бывает только один, хотя не исключаются и варианты с выбором нескольких правильных ответов.

Неправильные, но похожие на правильные (и поэтому правдоподобные) ответы называются дистракторами (от англ. distract – отвлекать). Они используются для отвлечения внимания от правильного ответа тех, кто либо совсем не знает правильный ответ, либо пытается угадать его во время тестирования. Сделать неправильные ответы правдоподобными – одна из самых сложных задач разработчика теста.

Отдельно от тестовых заданий в программу тестирования вводится эталон выполнения заданий и разрабатываются критерии оценки.

Если вы проводите тестирование по старинке, в письменном виде, то вам потребуется ответник, трафарет для проверки ответника и эталон выполнения тестового задания. 

Как оформить тестовые задания

Тестовое задание должно быть оформлено таким образом, чтобы облегчить тестируемому работу над ним. 

Существует несколько вариантов дизайна тестовых заданий закрытой формы, но все сходятся в одном: все элементы тестового задания тем или иным образом должны быть графически выделены.

Подробнее о том, как принято оформлять задания

Рекомендован следующий вариант оформления.

  1. Инструкция не является частью задания. Она пишется отдельно от текста задания и выделяется графически, например, курсивом (пример выше – рис. 1). 
  2. Инструкция может быть записана однократно, если в тесте используются задания одной формы. Каждая новая форма тестового задания требует своей инструкции.

Рекомендуется менять инструкцию как можно реже  – ровно столько раз, сколько это оправдано стратегией тестирования. Слишком частая смена инструкции путает испытуемых.

  1. Текст задания выделяется полужирным шрифтом (рис. 2). Иногда текст задания пишут прописными буквами, но это too much выглядит слишком громоздко и сильно снижает скорость чтения.
  2. Задания нумеруются арабскими цифрами.
  3. Во избежание путаницы варианты ответов рекомендуется индексировать буквами кириллического или латинского алфавитов (рис. 3). 
  4. Варианты ответа пишутся с маленькой буквы (если не представляют собой имена собственные), поскольку являются продолжением тестового задания, сформулированного в виде утверждения. Если задание сформулировано в вопросительной форме, варианты ответа пишутся так же.  
  5. Варианты ответа располагают в столбик, причем желательно, чтобы все они были немного сдвинуты вправо относительно текста задания.
  6. Между вариантами ответа и по завершении задания знаки препинания, как правило, не ставятся. Это нарушает правила русской пунктуации, если рассматривать задание как текст, но тестологи мотивируют отсутствие знаков препинания тем, что и без них все части тестового задания графически выделены. Обилие запятых или точек с запятой между вариантами ответов способны помешать восприятию текста задания.
  7. Не рекомендуется перегружать задания вспомогательными словами: «Вопрос», «Варианты ответов» и пр.
  8. В печатном варианте теста каждое задание должно быть расположено целиком на одной странице.
  9. И, конечно же, стиль оформления заданий должен быть единым по всему тесту.

Как написать инструкцию к тестам 

Инструкция – это общие требования к выполнению тестового задания. Она должна устранить все вопросы испытуемых об оформлении своих ответов. Кроме того, в тексте инструкции оговаривают специфику задания, например, указывают количество правильных ответов в тесте (один/несколько).

При написании инструкции используют стандартные формулировки. Формулировка инструкции зависит от формы тестового задания, количества правильных ответов и пр.

Для тестовых заданий с выбором одного правильного ответа в зависимости от способа проведения тестирования можно предложить следующие варианты инструкций.

  • Выберите один правильный ответ.
  • Внимательно прочитайте текст задания и выберите верный ответ из списка.
  • Выпишите номер тестового задания и индекс правильного ответа. 
  • Обведите кружком букву (номер) правильного ответа.
  • Для ответа нажмите клавишу с буквой (номером) правильного ответа.

Иногда, по замыслу автора, при разработке задания закладываются несколько правильных ответов, среди которых есть более и менее предпочтительные. В этом случае задание может сопровождаться следующей инструкцией: «Выберите наиболее правильный ответ».

Для тестовых заданий с выбором нескольких правильных ответов в зависимости от способа проведения тестирования можно предложить следующие варианты инструкций.

  • Выберите несколько правильных ответов.
  • Выберите все правильные ответы.
  • Отвечая на задание теста, нажимайте на клавиши с буквами (номерами) всех правильных ответов.

Для тестовых заданий на выбор неправильного ответа инструкция может быть такой: «Выберите неправильный ответ».

Для группы однотипных заданий допускается делать одну инструкцию, которая помещается в начале теста или данной группы заданий в тесте.

Как правильно сформулировать основную часть задания 

Эффективность и технологичность теста во многом зависят от того, насколько грамотно сформулированы задания. Если тестируемый не поймет смысл вопроса, ему придется отвечать наугад. А это уже минус к объективности конечного результата. Потому важно тщательно проработать каждое задание. Вот несколько рекомендаций.

1. Рекомендуется, чтобы задания в тесте были формулированы в форме утверждений, которые после ответов испытуемых естественным образом превратятся в истинные или ложные высказывания (рис. 1).

Если продолжить утверждение из основной части этого задания правильным ответом (в данном случае это вариант Б), получится истинное высказывание: Признаком протекания химической реакции между оксидом меди и водородом является изменение цвета. При «подстановке» неправильного ответа высказывание получится ложным. 

По мнению многих отечественных тестологов (В.С. Аванесова, М.Б. Челышковой, В.С. Кима и др.), смысл тестового утверждения улавливается всегда лучше, чем смысл вопроса, потому что в тестовых утверждениях нет ни одного лишнего слова и даже знака, в то время как вопрос требует ряда дополнительных слов и знаков для выражения требуемого смысла, значения и интонации. Вопросы и ответы на них иногда бывают столь неопределенными и многословными, что для выявления их истинности требуются большие затраты времени и сил, в то время как технологичная методика тестирования предполагает четкую и быструю дифференцируемость ответов.

Действительно, если трансформировать задание, составленное в форме вопроса, в логическое утверждение, мы увидим, что задание уж точно не стало хуже, а даже выиграло – стало более кратким, понятным, лаконичным. После выбора ответа такое утверждение превратится в законченное высказывание, истинность или ложность которого легко поддается пониманию и оценке. 

Пример 1. Задание в вопросительной форме:

Инструкция

: Выберите один правильный ответ.
С каким из названных событий связано окончание периода разрядки международной напряженности в 1970-е гг.?

  1. начало Корейской войны
  2. разрыв отношений с Югославией
  3. конфликт с Китаем
  4. ввод советских войск в Афганистан

То же задание в виде логического утверждения:

Окончание периода разрядки международной напряженности в 1970-е гг. связано c

  1. началом Корейской войны
  2. разрывом отношений с Югославией
  3. конфликтом с Китаем
  4. вводом советских войск в Афганистан

Пример 2. Задание в вопросительной форме:

Инструкция

: Выберите несколько правильных ответов.
Какие из перечисленных примеров относят к ароморфозам?

  1. возникновение теплокровности у позвоночных
  2. развитие трехкамерного сердца у земноводных
  3. формирование торпедообразного тела у акул
  4. развитие зародыша внутри матки
  5. появление рогов у копытных
  6. формирование крыльев у летучих мышей

То же задание в виде логического утверждения:

К ароморфозам относят

  1. возникновение теплокровности у позвоночных
  2. развитие трехкамерного сердца у земноводных
  3. формирование торпедообразного тела у акул
  4. развитие зародыша внутри матки
  5. появление рогов у копытных
  6. формирование крыльев у летучих мышей

Подобной трансформации легко поддается большинство заданий, сформулированных в вопросительной форме. Иногда возникают ситуации, когда, казалось бы, задание формулируется только в виде вопроса. Однако после тщательного анализа цели задания и его содержания все же удается подобрать утвердительную форму задания.

Конечно, утверждение об использовании в заданиях исключительно утвердительной формы не категорично. К тому же иногда встречаются задания, в которых вопросительная форма выглядит удобнее и короче. 

Вопросительная форма заданий по-прежнему используется при составлении тестов и в России, и за рубежом, и имеет много сторонников. Выбор остается за вами. Главное – не забывать, что выбранная вами форма задания должна быть максимально понятна для испытуемых.

Лично я являюсь сторонником формулировки заданий в виде утверждений, считаю эту форму наиболее удачной, использую только ее и ничего с собой поделать не могу.   

2. Текст задания должен содержать достаточную, недвусмысленную и релевантную информацию для ответа. 

3. Формулировка задания должна быть грамотной, согласованной с формой вариантов ответа (простите за капитанство).

4. Формулировка задания должна быть предельно лаконичной, но не в ущерб пониманию сути задания. Необходимо исключить повторы слов и, тем более, целых фраз. Чем лаконичнее задание, тем лучше оно воспринимается. 

5. Рекомендуется, чтобы основная часть задания состояла из одного предложения (не более 7-8 слов), а во всем задании было не более одного придаточного предложения. Эта рекомендация подходит, конечно, не ко всем случаям. Например, тестовое задание может представлять собой кейс/ситуационную задачу, тогда одним предложением точно не обойтись.

6. Если задание сформулировано в вопросительной форме, предпочтительнее применять прямые вопросы, представляющие собой полное предложение с вопросительным знаком в конце.

7. В основной части задания не должна присутствовать дополнительная информация, не существенная для поставленной проблемы.

8. Из текста задания нужно исключить все вербальные ассоциации, по которым можно догадаться о правильном ответе.

9. Стоит исключить из формулировки задания частицу «не». А если НЕ получается, ее надо выделить прописными буквами (как в этом предложении).

10. Исключаются задания, содержащие оценочные суждения тестируемого: «на ваш взгляд», «по вашему мнению», «что вы думаете…», «согласны ли вы с …», «как бы вы сформулировали…» и т.п. 

11. Рисунки, графики, схемы, используемые в задании, должны соответствовать тексту (рис. 2). И, конечно же, присутствие графических объектов в задании должно быть оправдано. Не стоит «добавлять картинку» просто для красоты. 

12. Элементы рисунка, графика, схемы рекомендуется обозначать по часовой стрелке (рис. 3).

13. В большинстве случаев варианты ответов замыкают задания (так было и в примерах выше), образуя завершенное истинное или ложное высказывание. Но иногда ответы приходится ставить в середине или за одно-два слова от конца содержательной основы задания теста. Тогда можно использовать такой вариант:

Инструкция

: Выберите один правильный ответ.
Невская битва произошла в … году.

  1. 1198
  2. 1240
  3. 1242
  4. 1245

14. Ответ на одно тестовое задание не должен служить ключом к правильным ответам на другие задания теста. Это нарушает условие локальной независимости заданий. В этом случае невозможно сделать корректный вывод о том,  знает ли испытуемый ответ на второе и последующие задания, или он не справился с ними потому что неправильно ответил на первый вопрос. 

Как подобрать дистракторы

К каждому тестовому заданию нужно подобрать правдоподобные неправильные варианты ответа (дистракторы). Это одна из самых сложных задач, стоящих перед составителем тестов. Перед вами основные рекомендации по подбору дистракторов: 

1. Все предложенные в задании дистракторы должны быть правдоподобными, теоретически вероятными.

Наиболее хороши дистракторы, подобранные на основе типичных ошибок, которые допускают тестируемые, или на основе распространенных заблуждений.

2. Все дистракторы к заданию должны быть одинаково привлекательными для тестируемых, не знающих правильного ответа.

Дистрактор, который никто не выбирает в качестве правильного ответа, обычно называют неработающим. Если в задании имеется хотя бы один неработающий дистрактор, удалите его, и вы сразу увидите реальное, а не формальное число ответов к заданию теста. 

Если все дистракторы в задании не работают, все испытуемые выполнят даже сложное задание верно, выбрав единственный правдоподобный ответ. Например, такое задание: 

Инструкция

: Выберите один правильный ответ.
Во вращении предплечья наружу участвует

  1. двуглавая мышца плеча
  2. двуглавая мышца бедра 
  3. икроножная мышца
  4. прямая мышца живота
  5. собственно жевательная мышца

Даже не будучи знатоком данной предметной области, нетрудно догадаться, что мышцы, расположенные на нижней конечности, животе или черепе, не могут приводить в движение предплечье. Получается, что в тесте нет ни одного работающего дистрактора. Имеется всего один работающий вариант ответа, его и выберут испытуемые как единственно правильный. 

Вы спросите: «А что же здесь плохого»? Как мы писали выше, педагогические тесты создаются для объективной оценки структуры и качества знаний. А о какой объективной оценке можно говорить, если правильный ответ можно просто угадать, не имея совсем никакого представления о предмете? Конечно, если целью тестирования было узнать, отличает ли испытуемый живот или бедро от предплечья, то можно сказать, что все прошло успешно. Но все же перед тестами обычно ставятся более серьезные задачи.    

Если в предложенном задании мы заменим неработающие дистракторы на правдоподобные, теоретически вероятные (все перечисленные мышцы тем или иным образом двигают предплечье), справиться с ним так просто будет нельзя:

Во вращении предплечья наружу участвует

  1. плечевая мышца
  2. двуглавая мышца плеча
  3. трехглавая мышца плеча
  4. локтевая мышца
  5. круглый пронатор

3. Дистракторы должны быть однородными, подобранными по общему (единому) основанию. 

Пример 1: Задание с однородными дистракторами

Инструкция

: Выберите один правильный ответ.
Телиоспоры возникают из

  1. урединиоспор
  2. эциоспор
  3. базидиоспор
  4. пикниоспор

Здесь все дистракторы подобраны по одному основанию, т.к. все они отвечают на вопрос «из чего?» и характеризуют то, из чего могут возникнуть телиоспоры.  

А в следующем задании дистракторы подобраны неудачно. 

Пример 2: Задание с неоднородными дистракторами

Инструкция

: Выберите несколько правильных ответов.
Телиоспоры возникают

  1. из урединиоспор
  2. из эциоспор
  3. поздней осенью на том же мицелии, на котором летом формировались урединиоспоры
  4. весной в результате слияния дикариона и последующего мейоза

В этом задании два первых ответа выбраны по одному основанию т.к. все они отвечают на вопрос «из чего?». Третий ответ подобран по другому основанию, поскольку соответствует вопросам «когда?» и «где?». 

Последний ответ не совпадает по основанию выбора ни с одним из предыдущих, он отвечает на вопросы «когда?» и «в результате чего?».

Самая частая причина появления в заданиях неоднородных дистракторов понятна – при невозможности подобрать нужное число дистракторов по одному основанию автор теста увеличивает их число, включая дополнительные, выбранные по другому основанию ответы. 

Иногда причиной является желание автора проверить с помощью одного задания как можно больше знаний испытуемых. Возможно, это оправдано спецификой предмета, однако некорректно с точки зрения требований тестовой технологии. 

Тестовое задание должно проверять один элемент знания. Если это не так, то становится неясным, с каким именно элементом знания тестируемый не справляется, в чем заключена причина невыполнения задания.

4. Все ответы должны быть параллельными по конструкции и грамматически согласованными с основной частью задания теста.

5. Все повторяющиеся в вариантах ответа слова (как в примере ниже) следует перенести в формулировку заданий.

Инструкция

: Выберите один правильный ответ.
Заштрихованная территория на карте России показывает районы

  1. газовых месторождений
  2. нефтяных месторождений
  3. месторождений каменного угля
  4. месторождений калийной соли

Вот что получится после небольшой правки этого примера:

Инструкция

: Выберите один правильный ответ.
Заштрихованная территория на карте России показывает районы месторождений

  1. газовых
  2. нефтяных
  3. каменного угля
  4. калийной соли

6. Рекомендуется использовать длинные задания и короткие ответы. В противоположном случае на прочтение и анализ ответов тратится слишком много времени.

7. Из числа неправильных исключаются ответы, вытекающие один из другого.

8. Ни один из дистракторов не должен быть частично правильным ответом, который при определенных условиях превратится в правильный ответ.

9. Ответы не должны отрицать смысл самого задания. «Почему? – спросите вы, – ведь так часто делают». Давайте разберемся на примере следующего задания:

Инструкция

: Выберите один правильный ответ.
PDF-файл можно преобразовать в документ Word, если на вкладке «Файл» выбрать команду

  1. Открыть
  2. Сохранить как 
  3. Экспорт
  4. PDF-файл нельзя преобразовать в документ Word

В этом примере четвертый ответ прямо противоречит основной части, утверждающей существование возможности преобразовать PDF-файл в документ Word. Налицо явная логическая ошибка. В задании же не спрашивается, можно ли преобразовать, а утверждается, что можно, а варианты ответов представляют собой перечисление способов преобразования.   

Если четвертый ответ – дистрактор, то в качестве правдоподобного ответа его вряд ли выберет хотя бы один тестируемый. Тогда этот ответ как неработающий дистрактор необходимо удалить из теста.

Если именно четвертый ответ является верным, все задание будет нерабочим, т.к. большинство тестируемых увидят логическую несообразность формулировок и пропустят задание, посчитав его ошибкой разработчика теста.

Если цель задания – выяснить, знает ли испытуемый, можно ли вообще преобразовать PDF-файл в документ Word или нет, лучше сформулировать вопрос по-другому, без нарушения логики: 

Преобразовать PDF-файл в документ Word

  1. можно
  2. нельзя

10. Не следует использовать в заданиях ответы типа «все вышеперечисленные», «ни один из вышеперечисленных» или, того хуже, – «все ответы неправильные» и «правильного ответа нет». Эта рекомендация, кстати, так же часто вызывает вопросы и несогласие аудитории, как и предыдущая. 

С точки зрения большинства тестологов, применение подобных ответов не оправдано по следующим причинам:

  • повышение вероятности угадывания правильного ответа, так как чаще всего это будет неработающий дистрактор, добавленный составителем «для количества» при трудностях с подбором качественных дистракторов;
  • нарушение логического закона исключенного третьего – если инструкция предписывает выбрать один верный ответ, то в задании он должен быть. Это придает однозначность замыслу самого задания и не допускает противоречивых толкований у испытуемых.

11. Не рекомендуется использовать слова «всегда», «никогда», «ни одного» и т.п., так как в отдельных случаях они способствуют угадыванию.

12. Частота выбора одного и того же номера места для правильного ответа в различных заданиях теста должна быть примерно одинакова или номер места для правильного ответа выбирается в случайном порядке.

13. Дистракторы из одного задания не используются в качестве ответов к другим заданиям теста.

14. Все ответы к одному заданию должны быть примерно одной длины. Если это трудновыполнимо, возможен вариант, когда в задании половина длинных ответов, половина коротких. Это нужно для того, чтобы исключить вероятность угадывания правильного ответа по признаку его полноты или краткости. Многие разработчики тестов грешат тем, что в их заданиях правильные ответы почти всегда или длиннее, или короче неправильных. Эта тенденция очень быстро «считывается» испытуемыми и делает общий результат теста необъективным. Следующая рекомендация имеет такое же обоснование.

15. Правильный ответ не должен быть длиннее других.

16. Дистракторы располагаются в логической последовательности: числа – по возрастанию, буквы – по алфавиту. Это удобнее при поиске тестируемым правильного ответа.

17. Количество дистракторов к заданию подбирается таким образом, чтобы задание не было слишком громоздким, но и чтобы исключить большую вероятность угадывания правильного ответа. Поэтому чаще всего в заданиях бывает три или четыре дистрактора и один правильный ответ.

В отдельных случаях, например, в заданиях с выбором нескольких правильных ответов, количество дистракторов может достигать шести–семи.

18. Число дистракторов и правильных ответов в разных заданиях может быть разным. Оно не должно быть одинаковым во всех заданиях теста.

Источник

По какому принципу придумывают тестовые задания

Из десяти принципов разработки тестовых заданий закрытой формы, которые выделяет В. С. Аванесов, предлагаю рассмотреть основные. Для наглядности будем это делать на примерах.

1. Принцип противоречия применяется при создании заданий с двумя вариантами ответов. Здесь один ответ отрицает другой. Например:

Инструкция

: Выберите один правильный ответ.
Поощрения в трудовую книжку

  1. записываются
  2. не записываются

2. Принцип противоположности ответов близок по смыслу к принципу противоречия, но при противоречии используется отрицание, а при противоположности один ответ заменяется другим, антонимичным по смыслу. Например:

Инструкция

: Выберите один правильный ответ.
С увеличением заряда ядра активность щелочных металлов

  1. возрастает
  2. убывает

Возможность промежуточных состояний при использовании принципа противоречия позволяет увеличить число ответов, например, до трех. Например:

Инструкция

: Выберите один правильный ответ.
При движении тягового органа конвейера реле скорости

  1. включено
  2. выключено
  3. заблокировано

3. Тесты, основанные на принципе однородности, содержат ответы, относящиеся к одному роду, виду, или отображают основные стороны, грани явления. Например:

Инструкция

: Выберите один правильный ответ.
Основателем андрагогики как науки является

  1. Ноулз
  2. Джарвис
  3. Холтон
  4. Ушинский

Инструкция

: выберите несколько правильных ответов.
Буква «о» пишется в словах

  1. пл_вец
  2. пок_рить вершину
  3. распол_гать 
  4. осн_щенный
  5. ум_лять значение

4. Принцип кумуляции означает, что второй ответ вбирает в себя (аккумулирует) содержание первого, третий – содержание второго и т.д.

Пример:

Инструкция

: Выберите один правильный ответ.
Чтобы задать движение точки естественным способом, надо знать

  1. траекторию
  2. траекторию и закон движения
  3. траекторию, закон движения, начало отсчета
  4. траекторию, закон движения, начало отсчета, скорость

Тестируемые, привыкшие давать полные и правильные ответы, выбирают обычно последний ответ в таких заданиях, ошибочно полагая, что он всегда самый правильный. Поэтому при разработке заданий по принципу кумуляции полезно иметь большую часть правильных ответов не на последнем месте. 

5. Принцип сочетания. Используется сочетание слов (знаков) по два или по три, реже четыре, в каждом ответе.

Пример 1: сочетание более или менее однородных и правдоподобных пар ответов

Инструкция

: Выберите один правильный ответ.
Ф. Шопен писал

  1. оперы и симфонии
  2. балеты и оратории
  3. мазурки и ноктюрны

Пример 2: сочетание одного слова (понятия) с несколькими другими

Инструкция

: Выберите один правильный ответ.
НЕ имеют ядра клетки крови

  1. эритроциты и лейкоциты
  2. эритроциты и тромбоциты
  3. эритроциты и лимфоциты
  4. эритроциты и базофилы

Пример 3: сочетание ответов по правилу цепочки, когда последнее слово в первом ответе становится первым во втором ответе, последнее во втором – первым в третьем и т.д.)

Инструкция

: Выберите один правильный ответ.
Служебными частями речи являются

  1. предлоги, союзы, частицы
  2. частицы, союзы, местоимения
  3. местоимения, частицы, предлоги

6. При использовании принципа градуирования ответы располагаются по возрастанию (увеличению) или по убыванию (уменьшению). Этот принцип применим для заданий с тремя и большим числом ответов. Например:

Инструкция

: Выберите один правильный ответ.
Растворимость газов при повышении температуры

  1. увеличивается
  2. остается без изменений
  3. уменьшается

Согласно ч. 3 ст. 5.63 КоАП РФ, нарушение должностным лицом порядка или сроков рассмотрения жалобы влечет наложение административного штрафа в размере … рублей.

  1. от трех тысяч до пяти тысяч 
  2. от пяти тысяч до десяти тысяч 
  3. от десяти тысяч до пятнадцати тысяч 
  4. от двадцати тысяч до тридцати тысяч 

7. Принцип формулирования заданий с ответами, правильными в различной мере, требует изменения инструкции, содержания задания и логики подбора ответов.

Инструкция, как мы уже говорили, обычно пишется так: Выберите наиболее правильный ответ.

Задача таких заданий – проверить сопоставительные знания, а ответы формулируются так, чтобы был реальный выбор между ответами, правильными в разной степени. Например:

Инструкция

: Выберите наиболее правильный ответ.
Зигота – это

  1. одна яйцеклетка
  2. оплодотворенная яйцеклетка
  3. диплоидная клетка, образующаяся в результате оплодотворения
  4. одноклеточная стадия развития многоклеточного организма млекопитающих

В этом задании наиболее правильным считается третий ответ (он наиболее емко и точно описывает все характеристики зиготы), следующий по степени правильности – второй ответ (он содержит совершенно правильное, но менее полное определение зиготы), затем четвертый (потому что зиготы образуются не только у млекопитающих). На последнем месте по степени правильности находится первый ответ – он самый неполный, ведь одной яйцеклетки для образования зиготы явно недостаточно.

Задания на выбор наиболее правильного ответа разрабатывать довольно сложно: наиболее правильный ответ далеко не всегда должен быть самым полным. В противном случае тестируемый при выполнении задания будет выбирать правильный ответ только по признаку полноты. 

Составили тест? Не поленитесь и пройдите по этому чек-листу.

Проверка качества тестовых заданий

  • Соответствует ли задание целям тестирования?
  • Все высказывания логичны?
  • Все формулировки однозначны и лаконичны?
  • Технологичен ли тест? (Задания становятся технологичными, если их содержание точно и быстро понимается испытуемыми, и если форма заданий способствует процессу компьютеризации тестирования)
  • Правильно ли выбрана форма задания?
  • Содержание корректно?
  • Правила оценки ответов разработаны заранее и соответствуют форме теста?
  • Правильно ли расположены элементы задания?
  • Инструкции одинаковы для всех тестируемых?
  • Инструкция соответствует форме и содержанию задания?

В этой статье мы обсудили основные аспекты составления тестовых заданий закрытой формы с одним или несколькими правильными ответами. Благодарю вас за внимание и терпение и надеюсь, что эта статья будет полезной для вас. 

Если вы считаете, что стоит продолжить цикл подобных статей и поговорить о методике составления тестовых заданий других видов, напишите, пожалуйста, об этом в комментариях. А если вам нужны готовые инструменты оценки качества обучения, обращайтесь к нам в «Сетевую Академию ЛАНИТ». Будем рады помочь.

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГБПОУ ПК им. Н.Н. Годовикова

УТВЕРЖДАЮ

Заместитель директора по учебно-методической работе

____________ И.В. Бойцова

«___» __________20__ года
аТТЕСтационные педагогические измерительные материалы

по дисциплине цикла МДК 04.01

Теоретические основы разработки и моделирования несложных систем автоматизации с учетом специфики технологических процессов
для специальности 220703 Автоматизация технологических процессов и производств

(наименование специальности)

Автор: Рассмотрены и одобрены
Елисеева Е.В. (Ф.И.О.)

(подпись)

на заседании цикловой комиссии от 30 января 2017г

протокол №

6

председатель цикловой комиссии

Елисеева Е.В. (Ф.И.О.)

(подпись)

«___» ____________ 2017 г.

Содержание

  1. Инструкция по проведению теста………………………..3
  2. Тестовые задания………………………………………….4
  3. Ответы……………………………………………………..16
  4. Критерии оценки………………………………………….17

Инструкция по проведению тестирования
Перед началом тестирования студенты должны быть ознакомлены с целью, особенностями (количество заданий, время выполнения, типы вопросов и правила ответов и т.д.), правилами и временными рамками проведения тестирования.

Студентам не разрешается перемещаться по аудитории, разговаривать; если у студента возник вопрос, ему необходимо поднять руку и дождаться, когда подойдет преподаватель.

Студенту разрешается пользоваться листами для черновиков, справочными материалами, калькулятором, если они необходимы по условиям тестирования.

Перед проведением тестирования подписываются бланки ответов и дается краткая инструкция по выполнению задания для тестируемых:

  1. внимательно прочитайте тестовые задания;
  2. в процессе работы общаться друг с другом не разрешается;
  3. ответы пишутся четко и разборчиво;
  4. в бланке вписываются фамилия тестируемого, факультет, курс, группа.

После краткой инструкции тестируемым студентам раздаются бланки, фиксируется время начала работы.

По истечении времени работа прекращается и сдаётся для проверки.

Комплексный тест по дисциплинам цикла ОП «МДК 04.01» специальностей среднего профессионального образования
1 вариант

Выберете один вариант правильного ответа

1. Датчики бывают следующих типов:

А) генераторные

Б) синусоидальные

В) положительные

Г) отрицательные
2. Электрические схемы делятся на следующие типы:

А) мостовые

Б) последовательные

В) индуктивные

Г) фазовые
3. Тензоэффект преобразует:

А) механические деформации в напряжение

Б) механические деформации в изменение сопротивления проводника

В) механические деформации в силу тока

Г) механические деформации в крутящий момент
4. Тензодатчики бывают следующих типов:

А) фольговые

Б) емкостные

В) электролитические

Г) инерционные
5. Пьезодатчики производятся из следующих материалов:

А) манганин

Б) серебро

В) кварц

Г) константан
6. Прямой пьезоэффект это:

А) при механической деформации происходит электролизация кристалла

Б) изменение R кристалла

В) изменение структуры кристаллической решетки

Г) изменение сопротивления датчика
7. Реостатный датчик применяется для:

А) изменение механического напряжения

Б) изменение I в цепи

В) изменение фазового сдвига

Г) измерения деформации
8. Ёмкость в емкостном датчике уменьшается при…

А) изменении сопротивления

Б) увеличении расстояния между пластинами

В) увеличении температуры

Г) увеличении корпуса датчика
9. Профилометр это…

А) тензодатчик

Б) пьезодатчик для измерения шероховатостей поверхностей

В) реостатный датчик

Г) контактный датчик
10. Укажите тип выходной величины после контактного датчика.

А) ступенчатая

Б) не ступенчатая

В) в зависимости от входной величины

Г) в зависимости от материала контактов
11. Прямой термооэффект это…

А) наведение термо ЭДС при разной t сплавов

Б) нагрев спая при прохождении тока

В) изменение сопротивления датчика при нагреве

Г) деформации датчика при нагреве
12. Термосопротивление бывает…

А) платиновое

Б) константановое

В) электролитическое

Г) манганитовое
13. Тензодатчики включаются в следующую схему…

А) мостовая

Б) четырехпроводная

В) последовательная

Г) трехпроводная
14. Модуляция это…

А) передача сигнала на расстояние

Б) способ измерения механической величины

В) способ измерения электрической величины

Г) визуализация изображения
15. Видеоизображение передаётся с помощью…

А) АМ (амплитудной модуляции)

Б) ЧМ (частотной модуляции)

В) ШИМ (широтно-импульсная модуляция)

Г) АКМ (амплитудно-кодовая модуляция)
16. В частотной модуляции изменяется:

А) амплитуда

Б) частота

В) угол сдвига фаз

Г) длительность импульсов
17. При амплитудно-кодовой модуляции сигнал передаётся…

А) с помощью беспроводной связи

Б) с помощью кодов

Г) с помощью девиации частоты

Д) длительность импульсов
18. Механические перемещения измеряют следующие датчики:

А) оптических датчиков

Б) фотодатчиков

В) термодатчики

Г) емкостные датчики с переменной площадью пластин
19. Изменение уровня жидкости можно измерить с помощью датчиков:

А) емкостного

Б) терморезистора

В) фотопреобразователя

Г) тензодатчика

20. Высокие температуры измеряют с помощью…

А) биметаллических пластин

Б) термопары

В) корреляционного метода

Г) радиационного метода

2 вариант
Выберете один вариант правильного ответа

1. Генераторные датчики это:

А) термопара

Б) емкостной

В) контактный

Г) реостатный
2. Мостовые схемы имеют:

А) 1 плечо

Б) 2 плеча

В) 3 плеча

Г) 4 плеча
3. Тензоэффект бывает:

А) прямой

Б) постоянный

В) механический

Г) динамический
4. Тензодатчик конструктивно состоит из…

А) диэлектрика

Б) проволоки

В) кварца

Г) термоэлемента
5. Реостатный датчик меняет:

А) сопротивление

Б) емкость

В) индуктивность

Г) частоту
6. Укажите датчик, в котором происходит замыкание контактов.

А) индуктивный

Б) мостовом

В) контактном

Г) реостатном
7. Термопара относится к категории датчиков:

А) пъезодатчики

Б) тензодатчики

В) термодатчики

Г) электродинамические датчики
8. Модуляция применяется для…

А) коммутации цепей

Б) передачи информационного сигнала на расстояние

В) измерения давления, силы

Г) преобразования перемещения в сопротивления
9. Датчик это:

А) логический элемент

Б) индикатор

В) элемент автоматики

Г) усилитель
10. Укажите тип выходной величины после контактного датчика.

А) ступенчатая

Б) не ступенчатая

В) в зависимости от входной величины

Г) в зависимости от материала контактов
11. Прямой термооэффект это…

А) наведение термо ЭДС при разной t сплавов

Б) нагрев спая при прохождении тока

В) изменение сопротивления датчика при нагреве

Г) деформации датчика при нагреве
12. Термосопротивление бывает…

А) платиновое

Б) константановое

В) электростатическое

Г) манганиновое
13. Тензодатчики включаются в следующую схему…

А) мостовая

Б) четырехпроводная

В) последовательная

Г) трехпроводная
14. Модуляция это…

А) передача информационного сигнала на расстояние

Б) способ измерения механической величины

В) способ измерения электрической величины

Г) визуализация изображения

15. Видеоизображение передаётся с помощью…

А) АМ (амплитудной модуляции)

Б) ЧМ (частотной модуляции)

В) ШИМ (широтно-импульсная модуляция)

Г) АКМ (амплитудно-кодовая модуляция)
16. В частотной модуляции изменяется:

А) амплитуда

Б) частота

В) угол сдвига фаз

Г) длительность импульсов
17. При амплитудно-кодовой модуляции сигнал передаётся…

А) с помощью беспроводной связи

Б) с помощью кодов

Г) с помощью девиации частоты

Д) длительность импульсов
18. Механические перемещения измеряют следующие датчики:

А) фотодатчик

Б) светодиод

В) термодатчики

Г) емкостные датчики
19. Изменение уровня жидкости можно измерить с помощью датчиков:

А) емкостного

Б) терморезистора

В) фотопреобразователя

Г) тензодатчика
20. Высокие температуры измеряют с помощью…

А) биметаллических пластин

Б) термопары

В) корреляционного метода

Г) радиационного метода

3 вариант
Выберете один вариант правильного ответа
1. Измерение t◦ производится с помощью следующих датчиков:

А) пьезодатчик

Б) профилометр

В) термопара

Г) тензодатчик
2. Низкие температуры имеют следующий предел:

А) 10К до 80К

Б) 2500Сдо ∞

В) 1600Сдо 2500С

Г) 2500Сдо 30.000К
3. Для защиты термопар используется:

А) короба

Б) защитные чехлы и арматура нерабочего спая

В) корпуса

Г) экранировка
4. Датчик преобразует:

А) неэлектрическую величину в электрическую для дальнейшего масштабирования

Б) меняет предел измерений

В) расширяет шкалу

Г) электрическую величину в неэлектрическую
5. Изменение активного сопротивления при деформации это:

А) термоэффект

Б) пьезоэффект

В) тензоэффект

Г) ничего из вышеперечисленного
6. Материал кварц используется в следующих датчиках:

А) термопара

Б) тензодатчик

В) пьезодатчик

Г) терморезистор
7. Два спаянных между собой проводника или полупроводника это…

А) модулятор

Б) термопара

В) резистивный датчик

Г) электролитический тензодатчик

8. Амплитуда несущей меняется в следующей модуляции:

А) частотной

Б) амплитудной

В) фазовой

Г) импульсной
9. Профилометр это…

А) тензодатчик

Б) пьезодатчик для измерения шероховатостей поверхностей

В) реостатный датчик

Г) контактный датчик
10. Укажите тип выходной величины после контактного датчика.

А) ступенчатая

Б) не ступенчатая

В) в зависимости от входной величины

Г) в зависимости от материала контактов
11. Прямой термооэффект это…

А) наведение термо ЭДС при разной t сплавов

Б) нагрев спая при прохождении тока

В) изменение сопротивления датчика при нагреве

Г) деформации датчика при нагреве
12. Термосопривление бывает…

А) платиновое

Б) константановое

В) электростатическое

Г) манганитовое
13. Тензодатчики включаются в следующую схему…

А) мостовое

Б) четырехпроводная

В) последовательное

Г) трехпроводная
14. Модуляция это…

А) передача сигнала на расстояние

Б) способ измерения механической величины

В) способ измерения электрической величины

Г) визуализация изображения
15. Видеоизображение передаётся с помощью…

А) АМ (амплитудной модуляции)

Б) ЧМ (частотной модуляции)

В) ШИМ (широтно-импульсная модуляция)

Г) АКМ (амплитудно-кодовая модуляция)
16. В частотной модуляции изменяется:

А) амплитуда

Б) частота

В) угол сдвига фаз

Г) длительность импульсов
17. При амплитудно-кодовой модуляции сигнал передаётся…

А) с помощью беспроводной связи

Б) с помощью кодов

Г) с помощью девиации частоты

Д) длительность импульсов
18. Механические перемещения измеряют следующие датчики:

А) фотодатчик

Б) светодиод

В) термодатчики

Г) емкостные датчики
19. Изменение уровня жидкости можно измерить с помощью датчиков:

А) емкостного

Б) терморезистора

В) фотопреобразователя

Г) тензодатчика
20. Высокие температуры измеряют с помощью…

А) биметаллических пластин

Б) термопары

В) корреляционного метода

Г) радиационного метода

4 вариант
Выберете один вариант правильного ответа

1. Механическую деформацию в заряды на гранях преобразует следующий датчик:

А) пьезодатчик

Б) термопара

В) терморезистор

Г) влагомер
2. Частота несущей изменяется при следующей модуляции:

А) амплитудная

Б) частотная

В) фазовая

Г) импульсная
3. Радиовысотомер и эхолот измеряют расстояние электромагнитным сигналом следующего типа:

А) γ излучение

Б) ультразвуковое излучение

В) β излучение

Г) α излучение
4. В автоматизированных системах не применяются следующие датчики:

А) тензодатчики

Б) пьезодатчики

В) индуктивные датчики

Г) измерительные генераторы
5. Преобразование температуры рабочего спая в термоЭДС это…

А) тензоэффект

Б) эффект термопары

В) парниковый эффект

Г) эффект Холла
6. Для измерения t расплавленных металлов применяются термопары с…

А) удлинительными термоэлектродами

Б) модулятором

В) аттенюатором

Г) тензоэффектом

7. Следующие приборы являются датчиками

А) вольтметр

Б) амперметр

В) терморезистор

Г) осциллограф
8. Ёмкость в емкостном датчике уменьшается при…

А) увеличении индуктивности

Б) увеличении расстояния между пластинами

В) увеличении сопротивления

Г) увеличении корпуса датчика
9. Профилометр это…

А) тензодатчик

Б) пьезодатчик для измерения шероховатостей поверхностей

В) реостатный датчик

Г) контактный датчик
10. Укажите тип выходной величины после контактного датчика.

А) ступенчатая

Б) не ступенчатая

В) генераторная

Г) электролитическая
11. Прямой термооэффект это…

А) наведение термо ЭДС при разной t сплавов

Б) нагрев спая при прохождении тока

В) изменение сопротивления датчика при нагреве

Г) деформации датчика при нагреве
12. Термосопротивление бывает…

А) платиновое

Б) константановое

В) электростатическое

Г) манганитовое
13. Тензодатчики включаются в следующую схему…

А) мостовое

Б) четырехпроводная

В) последовательное

Г) трехпроводная
14. Модуляция это…

А) передача сигнала на расстояние

Б) способ измерения механической величины

В) способ измерения электрической величины

Г) визуализация изображения
15. Видеоизображение передаётся с помощью…

А) АМ (амплитудной модуляции)

Б) ЧМ (частотной модуляции)

В) ШИМ (широтно-импульсная модуляция)

Г) АКМ (амплитудно-кодовая модуляция)
16. В частотной модуляции изменяется:

А) амплитуда

Б) частота

В) угол сдвига фаз

Г) длительность импульсов
17. При амплитудно-кодовой модуляции сигнал передаётся…

А) с помощью беспроводной связи

Б) с помощью кодов

Г) с помощью девиации частоты

Д) длительность импульсов
18. Механические перемещения измеряют следующие датчики:

А) фотодатчик

Б) светодиод

В) термодатчики

Г) емкостные датчики
19. Изменение уровня жидкости можно измерить с помощью датчиков:

А) емкостного

Б) терморезистора

В) фотопреобразователя

Г) тензодатчика

20. Высокие температуры измеряют с помощью…

А) биметаллических пластин

Б) термопары

В) корреляционного метода

Г) радиационного метода

Ответы к комплексному тесту по дисциплинам цикла ОП «МДК 04.01» специальности СПО

п/п 1 вариант 2 вариант 3 вариант 4 вариант
А А В А
Б Г А Б
Б А Б Б
А Б А Г
В А В Б
А В В А
Б В Б В
Б Б Б Б
Б В Б Б
А А А А
А А А А
А А А А
А А А А
А А А А
А А А А
Б Б Б Б
Б Б Б Б
Г Г Г Г
А А А А
Б Б Б Б

Критерии оценки

Для оценки результатов тестирования предусмотрена следующая система оценивания учебных достижений студентов:

За каждый правильный ответ ставится 1 балл,

За неправильный ответ – 0 баллов.

Тестовые оценки можно соотнести с общепринятой пятибалльной системой. Оценивание осуществляется по следующей схеме:

— оценка «5» (отлично) выставляется студентам за верные ответы, которые составляют 91 % и более от общего количества вопросов. Это 18 – 20 вопросов;

— оценка «4» (хорошо) соответствует результатам тестирования, которые содержат от 71 % до 90 % правильных ответов. Это 14 – 17 вопросов;

— оценка «3» (удовлетворительно) от 70 % до 50 % правильных ответов. Это 10 – 13 вопросов;

— оценка «2» (неудовлетворительно) соответствует результатам тестирования, содержащие менее 50 % правильных ответов. Это 9 вопросов и менее.

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГБПОУ ПК им. Н.Н. Годовикова
БЛАНК ОТВЕТОВ
Дата тестирования____________________ Дата проверки ____________________
Ф.И.О. студента ______________________ Ф.И.О. проверяющего ______________

Группа______________________________ Кол-во правильных ответов _________

Дисциплина Кол-во неправильных ответов ________

Подпись студента_____________________ Оценка ___________________________

Вариант №___________________________ Подпись проверяющего _____________

п-п

ВАРИАНТЫ ОТВЕТОВ

п-п

ВАРИАНТЫ ОТВЕТОВ
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

МЕТОДИЧЕСКИЕ
РЕКОМЕНДАЦИИ

по
составлению и оформлению тестовых заданий

ВВЕДЕНИЕ

 Один из
элементов системы оценки качества – тестирование учебных достижений обучающихся.
Система тестирования – универсальный инструмент определения уровня обученности обучающихся
на всех этапах образовательного процесса, в том числе для оценки уровня
остаточных знаний.

Тест обладает
способностью сравнивать индивидуальный уровень знания каждого обучающегося с
некими эталонами, уровень знания отражается в тестовом балле испытуемого.
Индивидуальные результаты тестирования можно сравнить с результатами других обучающихся
этой же группы и проранжировать их, можно сравнить результаты тестирования
нескольких групп и т.д.

С помощью теста можно
оценить структуру знаний, то есть установить наличие последовательности
в усвоенных обучающимися знаниях, отсутствие пробелов.

Методические
рекомендации по составлению и оформлению тестовых заданий имеют целью
определить единые требования к составлению тестов по учебным дисциплинам/МДК,
предназначенных для проверки уровня и структуры знаний обучающихся техникума.

Объективность
результатов тестирования, в первую очередь, зависит от качества тестовых материалов,
поэтому при разработке необходимо учитывать комплекс требований, диктуемых
положениями теории и практики тестирования.

Методические
рекомендации помогут унифицировать тестовые материалы. Тестирование —
лишь один из способов оценки качества подготовки обучающихся.
Тестирование
не заменяет, а дополняет другие формы диагностики, контроля и оценки уровня
обученности.

Методические
рекомендации призваны способствовать:

— формированию культуры тестирования в
системе оценки качества обученности обучающихся;

— повышению объективности процессов и
результатов оценки учебных достижений обучающихся;

— созданию необходимых предпосылок и
условий для совершенствования содержания и структуры образовательного процесса;


повышению уровня квалификации педагогов, непосредственно разрабатывающих и
применяющих тестовые материалы.

  1. СЛОВАРЬ ТЕРМИНОВ

Тестирование
один из наиболее эффективных методов выявления и оценки уровня учебных
достижений обучающихся, осуществляемый посредством стандартизированных
материалов — тестовых заданий; технологический процесс, реализуемый в форме
алгоритмически упорядоченного взаимодействия студента с системой тестовых
заданий и завершающийся оцениванием результатов.

Тестовое задание (ТЗ)
— варьирующаяся по элементам содержания и по трудности единица контрольного
материала, сформулированная в утвердительной форме предложения с неизвестным.
Подстановка правильного ответа вместо неизвестного компонента превращает
задание в истинное высказывание, подстановка неправильного ответа приводит к
образованию ложного высказывания, что свидетельствует о незнании студентом
данного учебного материала.

Тест
система заданий возрастающей трудности специфической формы, позволяющая
качественно и эффективно определить уровень и оценить структуру
подготовленности тестируемого.

Контролирующий тест
— тест, выступающий в качестве метода или способа измерения уровня и структуры
знаний обучающихся.

Банк тестовых заданий
– логически упорядоченный набор тестовых заданий, позволяющих генерировать
множество тестов.

Спецификация теста
— система характеристик теста, отражающая его содержание и структуру.

Надежность теста
характеристика теста, свидетельствующая о постоянстве эмпирических измерений,
то есть многократном повторении.

Валидность теста
действительная способность теста измерять ту характеристику, для диагностики
которой он заявлен.

Дистрактор
близкий искомому по своему смыслу вариант ответа, но не являющийся таковым.

Эталон – это
правильный и полный ответ или метод выполнения заданной деятельности.

II. ФОРМЫ
ТЕСТОВЫХ ЗАДАНИЙ

По
классификации тестов, предложенной Аванесовым В.С., можно выделить тестовые
задания четырех основных форм:

·        
задания
закрытой формы, в которых испытуемый выбирает один или несколько
вариантов ответов из списка предложенных;

·        
задания
открытой формы, требующие от испытуемого самостоятельного ответа (в
текст задания вписывается слово, вставляется формула и т.д.);

·        
задания
на установление соответствия, выполнение которых связано с выявлением
соответствия между элементами двух множеств;

·          
задания
на установление правильной последовательности, в которых требуется
указать правильный порядок действий или процессов.

Задания закрытой
формы:

       задания с
выбором одного правильного ответа
(предлагается
несколько ответных альтернатив, но только один ответ – правильный);

       задания с
выбором наиболее правильного ответа
(предлагается несколько
ответных альтернатив, в числе которых могут быть и неправильные, и правильные,
но в разной степени. От испытуемого требуется выбрать наиболее правильный
ответ);

       задания с
выбором всех правильных ответов
(предлагается несколько ответных
альтернатив, в числе которых может быть несколько правильных. Испытуемый должен
выбрать все правильные ответы).

 Задания закрытой формы
сопровождаются инструкцией: «Запишите номер/-а (цифру/-ы, букву/-ы)
правильного/-ых ответа/-ов».

Задания
открытой формы

В
заданиях открытой формы готовые ответы не даются, их должен получить или
придумать сам испытуемый. Задания открытой формы бывают двух типов:

       задания на
дополнение
;

       задания со
свободно конструируемым ответом
.

Для
задания открытой формы рекомендуется использовать инструкцию, состоящую из
слов: «Дополните фразу», «Дайте определение..» и т.п..

Задания
на установление соответствия

Они могут быть
двух типов:

       Соответствия
взаимно-однозначные: любому элементу из левого столбца соответствует только
один элемент из правого столбца и наоборот;

       Соответствия
не взаимно-однозначные: различным элементам из левого столбца может
соответствовать один и тот же элемент из правого столбца.

К
заданиям предлагается стандартная инструкция, состоящая из двух слов:
«Установите соответствие».

Задания
на установление правильной последовательности

Эта
форма заданий проверяет определенные знания: алгоритмические, процессуальные,
процедурные, технологические.

Стандартная инструкция к заданиям этой формы имеет вид
«Установите правильную последовательность».

Сопоставительный
анализ характеристик тестовых заданий

 

Характеристики

Задания закрытой формы

Задания открытой формы

Задания на установление соответствия

Задания на установление
последовательности

Проверка знания фактов

Годны

Годны

Годны

Годны

Применение знаний по образцу

Годны

Годны

Годны

Годны

Применение знаний в нестандартных ситуациях

Негодны

Годны

Негодны

Годны

Простота конструирования

Есть

Есть

Нет

Нет

Исключение угадывания

Не исключено

Исключено

Не исключено

Не исключено

Объективность оценки

Да

Нет

Да

Да

Исключение описок

Нет

Да

Нет

Нет

Возможность оригинального ответа

Нет

Да

Да/Нет

Нет

III. Уровни сложности тестовых заданий

ТЗ должны быть различного уровня сложности
(классификация тестов по В.С. Беспалько).

Первый
уровень

ознакомительный (узнавание ранее изученных объектов, свойств): тесты
на узнавание
, т.е. отождествление объекта и его обозначения (задания на
опознание, различение или классификацию объектов, явлений и понятий,
соотнесение). Вопросы задаются в открытой и закрытой формах по основным дидактическим
единицам дисциплины («да» — «нет», «выбрать один или несколько правильных
ответов», «соотнести объекты и их характеристики, свойства»).

Второй
уровень

репродуктивный (выполнение деятельности по образцу, инструкции):
тесты-подстановки, в которых намеренно пропущено слово, фраза,
формула или другой какой-либо существенный элемент текста, и конструктивные
тесты
, в которых обучающимся в отличие от теста-подстановки не
содержится никакой помощи даже в виде намеков и требуется дать определение
какому-либо понятию, указать случай действия какой-либо закономерности и т.д. В
качестве тестов второго уровня могут использоваться и типовые задачи,
условия которых позволяют «с места» применять известную разрешающую их
процедуру (правило, формулу, алгоритм) и получать необходимый ответ на
поставленный в задаче вопрос.

Третий
уровень

продуктивный (планирование и самостоятельное выполнение
деятельности, решение проблемных задач): нетиповые задачи на
применение знаний в реальной практической деятельности и тест «Черный
ящик»
.

Условия нетиповой задачи формулируются близкими к тем,
которые имели место в реальной жизненной обстановке. Решение такой  задачи
состоит в сведении ее к типовой путем преобразования известных формул или
нахождения алгоритма решения. Проверяется деятельность в нестандартной ситуации
по аналогии, сходству между изученными и не изучавшимися ранее элементами.

Тест «Черный ящик»
представляет собой проблемную ситуацию, решение которой содержится в известных
обучающимся знаниях и умениях. Опираясь на них, обучающиеся
решают предложенное задание. («Определите то, что находится в чёрном ящике:
Через него пропускают переменный ток. Чем меньше его частота, тем меньше
сопротивление того. Что в чёрном ящике?» Эталон: конденсатор).

Рекомендуемое распределение
заданий в одном тесте по уровням:

заданий
I уровня –
не более 30% (20-25% заданий разных форм),

заданий
II уровня –
60-70%;

заданий
III уровня –
5-10%.

IV.
ТРЕБОВАНИЯ К ТЕСТОВЫМ ЗАДАНИЯМ

Общие требования

1.      Соответствие
ФГОС и рабочей программе учебной дисциплины.

2.      Содержание
ТЗ должно отражать знания, умения, практический опыт, которые необходимо
проверить.

3.      Содержание
каждого ТЗ должно охватывать какую-либо одну смысловую единицу, то есть должно
оценивать что-то одно.

4.      Наличие
ТЗ различной формы и уровня сложности.

5.      Формулировка
задания должна быть не в форме вопроса, а в форме утверждения. Предложение
должно быть сформулировано грамотно, коротко, четко, ясно, без повторов,
малопонятных слов и символов, без использования отрицательных частиц.
Не
рекомендуется начинать ТЗ с предлога, союза, частицы.

6.      Наличие
правильного ответа к разработанному заданию.

7.      Среднее время,
отводимое на выполнение одной задачи (вопроса) теста обучающимся,  должно быть
минимум 1 минута, а максимум – 3-5 минут.

8.      Соблюдение
единого стиля оформления заданий, входящих в один тест.

В дополнение к 
общим требованиям существует еще ряд других, обусловленных  спецификой
выбранной тестовой формы.

Требования к заданиям закрытой формы:

      Основная
часть задания формулируется в форме утверждения, которое обращается в истинное
или ложное высказывание после подстановки одного из вариантов ответа.

      Задание
формулируется предельно кратко, как правило, в форме предложения, состоящего из
7-8 слов. В основную часть задания следует включать как можно больше слов,
оставляя для ответа не более 2-3 наиболее важных, ключевых для данной проблемы
понятий.

      Из текста
задания необходимо исключать все ассоциации, способствующие выбору правильного
ответа с помощью догадки.

      ТЗ
закрытой формы должны содержать не более пяти вариантов ответов на каждый
вопрос (оптимально – 4 варианта).

      Среди
предложенных вариантов ответа может быть как один, так и несколько верных.

      В ответах
не рекомендуется использовать слова «все», «ни одного», «никогда», «всегда» и
т.п., так как в отдельных случаях они способствуют угадыванию правильного
ответа.

Примеры (уровень
сложности  — 1):

1. Преобразование
электрических колебаний в звуковые происходит в …

а) микрофоне;

б) динамике;

в) детекторе
радиоприёмника;

г) приёмной
антенне.

2.
В данном списке найдите два региона России, в которых нет
городов-миллионеров:

Требования
к тестовым заданиям открытой формы:

    
Текст
задания должен обладать предельно простой синтаксической конструкцией. В тексте
задания не должно быть повторов и двойного отрицания.

    
Место
пропущенного понятия обозначается точками или нижним подчеркиванием. Точки/подчеркивание
ставятся на месте ключевого элемента, знание которого является наиболее
существенным для контролируемого материала. Если это возможно, то после точек/подчеркивания
указываются единицы измерения.
Все точки/подчеркивания
в заданиях для одного теста рекомендуется делать равной длины.

    
Обычно
ответом служит одно слово или словосочетание, состоящее не более чем из двух
слов.

    
При
указании составителем теста правильного ответа должны быть перечислены все
возможные варианты написания слова-ответа.

Примеры (уровень
сложности 2):

1. Конституцией
определено, что забастовка – это временный … отказ работников от выполнения
обязанностей в целях разрешения спора.

Ответ:
добровольный.

2.
Низменность – это вид ______, с ____ высотой до __ метров.

Ответ:
равнины, абсолютной, 2000.

Требования
к тестовым заданиям на установление соответствия

    
Группы
объектов, между которыми устанавливается соответствие, могут быть одинакового
размера, но предпочтительнее, чтобы одна была больше другой (допускается одна
лишняя позиция).

    
Соответствие
между объектами групп должно быть однозначным, одному элементу первого
множества должен соответствовать один элемент второго множества.

     К
заданиям предлагается стандартная инструкция, состоящая из слов: «Установите
соответствие».

Пример
(уровень сложности 1):

Установите
соответствие между видами конфликтов и их характеристикой.

Столкновение
между личностью и группой

Внутригрупповой

Внутреннее
противоборство человека

Внутриличностный

Столкновение
между подразделениями организации    

Межгрупповой

Столкновение
взаимодействующих лиц

Межличностный

Требования
к тестовым заданиям на установление правильной последовательности

     
Последовательность
устанавливаемых объектов должна быть однозначной, не рекомендуется составлять
последовательность, требующую повторения одного из объектов.

     
В
основном тексте задания должно быть указание на направление последовательности.

      Стандартная
инструкция к заданиям четвертой формы имеет вид «Установите правильную
последовательность».

Пример
(уровень сложности  2):

Установите
последовательность этапов переговорного процесса:

o    Подготовительный
этап

o    Взаимное
уточнение позиций участников

o    Выдвижение
аргументов и обоснование своих взглядов

o    Согласование
позиций и выработка договоренностей

o    Анализ
результатов переговоров

Примеры заданий 3 уровня сложности:

1.
Составьте алгоритм трудовых действий продавца по продаже сыра в молочном
отделе.

2.
Группа обучающихся  выполняла облицовку стен  в столовой керамической плиткой.
После окончания работы оказалось, что ширина швов на облицованной поверхности —
неодинаковая. Раствор был качественный, поверхность была подготовлена
правильно.         Отчего это произошло?

V. Структура теста

Основными структурными
компонентами
теста являются:

·       
Спецификация
теста

·       
Инструкция
для тестируемых

·       
Основной
текст

·       
Эталон ответов и критерии оценки

Спецификация
теста

В
спецификации теста описываются основные характеристики теста. К характеристикам
теста относятся: название дисциплины, по которой составлен тест; название темы,
по которой составлен тест; цель теста; содержание теста, критерии оценки.

Возможные цели тестов: для контролирующих тестов
основной целью является проверка (контроль) усвоенных обучающимися знаний и
навыков по конкретной учебной дисциплине.

Целью текущего контроля является проверка знаний и навыков по
одной или нескольким темам учебной дисциплины, по одному разделу.

Целью итогового контроля является проверка знаний и навыков по
всей учебной дисциплине в целом.

Целью может быть проверка уровня остаточных знаний по дисциплине.

Инструкция
для тестируемых

Инструкция должна содержать указания на то, что и как обучающийся
должен сделать, какое количество времени дается на его выполнение, какой
стратегии должен придерживаться испытуемый (например, если не знаете ответ на
задание, приступайте к выполнению следующего), что надо сделать, чтобы записать
правильный ответ.

Перед группой однотипных заданий можно поместить общую инструкцию.
Очень важно указать, каким образом нужно делать отметки при выполнении заданий:
например, для тестовых заданий открытой формы – вписать ответ в отведенное
место.

Если тест включает различные формы заданий, то при смене форм,
перед каждой частью теста можно дать дополнительную инструкцию по выполнению
данной формы задания.

Эталон ответов и
критерии оценки

Данный
компонент является обязательной составной частью теста, который предназначен
преподавателям, которые должны проверить тест.

VI. Этапы составления тестов

Для облегчения процедуры
составления тестов учебный материал должен быть достаточно формализован, т.е.
каждый раздел, тему учебной дисциплины (МДК) необходимо представить в виде
таких задач и (или) вопросов, которые наиболее полно отображают содержание дисциплины
(МДК). При этом важно выделить главные (проблемные) вопросы, не увлекаясь
второстепенными.

На втором этапе, в зависимости
от цели тестирования (текущий контроль знаний, итоговый контроль знаний, оценка
остаточных знаний и др.) и формы теста, разрабатывается план раскладки задач и
вопросов в тестовые задания. Формализация учебного материала и составление
тестовых заданий — наиболее ответственные и сложные этапы составления тестов.

Рекомендуемое время
тестирования и количество вопросов (из расчёта 1-3 минуты  — на выполнение
одного тестового задания):

        
тест для текущего контроля на 12-15 мин может содержать 6-7
тестовых заданий,

        
тесты для промежуточной аттестации на 90 мин должны включать не
менее 30 тестовых заданий,

        
тесты для промежуточной аттестации на 45 мин – не менее 15
тестовых заданий.

После составления тестовых
заданий педагог оформляет эталон ответов (Приложение 2), инструкцию для
тестируемых, определяет критерии оценки.

VII. методика оценивания ответов

 Методика
оценивания ответов обучающихся должна быть проста, объективна и удобна для
обработки результатов тестирования.

Пример системы оценивания для разноуровневых заданий:

       ТЗ
1 уровня: правильный ответ – 1 балл; неправильный ответ – 0 баллов.

       ТЗ
2 уровня: правильный ответ – 2 балла; частично правильный ответ – 1 балл;
неправильный ответ – 0 баллов.

       ТЗ
3 уровня: правильный ответ – 3 балла; правильный ответ, но сопровождающие
записи с ошибками, или неправильный ответ, но записи свидетельствуют о
правильности хода размышлений – 2 балла; частичное решение или частичный ответ,
который не доведен до логического завершения – 1 балл; в остальных случаях – 0
баллов.

Суммируя
количество баллов за каждое задание, получаем максимальное количество баллов –
100%. Затем рассчитываем количество баллов на «4» и «3».

Рекомендуемая шкала оценки текста:

«3» — от 50% до 70% правильных ответов

«4» — от 71% до 90%

«5» — от 91% до 100%

ЗАКЛЮЧЕНИЕ

Рассмотрим достоинства и недостатки тестовой
проверки знаний.

Достоинства

От традиционных оценок
 контроля знаний обучающихся тесты отличаются объективностью измерения
результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателя,
а на объективные
 эмпирические критерии; быстротой получения результата, установления
связи с обучающимся и обсуждения результатов. Тест позволяет охватить большее
число обучающихся на уроке, экономя время на контроле. Эта форма контроля дисциплинирует
обучающихся, приучая их постоянно готовиться к систематическому тестовому
контролю, а так же улучшает психологическую атмосферу учебного процесса, преподаватель
перестаёт быть источником отрицательных эмоций при оценивании знаний.

Недостатки

Одним из недостатков тестовой формы
является возможность угадывания в заданиях закрытого типа.  Если тестовое
задание содержит всего два варианта ответа, то половину ответов на такое
тестовое задание можно угадать. Так же существует возможность списать ответы на
тесты закрытого типа. Преподаватель не видит хода решения (хода мыслительной
деятельности обучающегося), если результаты своей работы обучающийся
представляет только в виде номера ответа, гарантии наличия знаний у  обучающегося
нет. В тестах трудно выявить степень овладения умениями проводить наблюдения,
опыты, определять объекты, не развивается речь обучающегося.

На основании сказанного, можно
сделать вывод о преимуществе тестовой проверки знаний по сравнению с
традиционными формами контроля.
 Тестовые задания удобно использовать при организации
самоконтроля, при повторении учебного материала, при подготовке к уроку. Тесты
с успехом можно использовать наряду с другими формами контроля. Главное
достоинство тестовой проверки – в ее скорости, а традиционной проверки – в её
основательности.

Требования к составлению тестов

При составлении тестовых заданий следует учитывать следующие правила:

1.Содержание заданий должно отвечать программным требованиям и отражать содержание обучения.

2.Формулирование вопроса начинать с подбора правильного ответа, чтобы избежать двух часто встречающихся проблем: наличие более одного правильного ответа, наличие только неправильных ответов. Основное требование – тестовое задание должно иметь однозначный правильный ответ.

3. Вопрос должен содержать одну законченную мысль (тестовое задание должно проверять один элемент знания). Если это не так, то становится неясным, с каким элементом знаний ученик не справляется, в чём заключена причина невыполнения задания.

4.Вопрос должен быть чётко сформулирован. Особенно внимательно использовать слова “иногда”, “часто”, “всегда”, “никогда”. Они, с одной стороны, сами по себе содержат неопределённость, а с другой стороны – дают возможность учащимся догадаться о правильном ответе. Исключать по возможности слова “большой”, “небольшой”, “малый”, “много”, “мало”, “больше”, “меньше” и т. п.

5.Правильные ответы должны быть разумны, умело подобраны, не должно быть явных неточностей и подсказок.

6.Все варианты ответов должны быть грамматически согласованы с основной частью задания; следует использовать короткие, простые предложения.

7.Правильные и неправильные ответы должны быть однозначны по содержанию, структуре и общему количеству слов. Применять правдоподобные ошибочные варианты, взятые из опыта.

8.Место правильного ответа должно быть определено таким образом, чтобы оно не повторялось от вопроса к вопросу, не было закономерностей, а давалось в случайном порядке.

9.Лучше использовать длинный вопрос и короткий ответ. В противоположном случае на прочтение ответов уходит больше времени и тратится больше сил на анализ высказывания.

10.Дополнения лучше ставить в конце предложения.

Правила расположения заданий на листе.

1.Все задания должны быть на одной странице и под номерами.

2.У учеников должно быть достаточно места для записей (в заданиях открытого типа).

3.Размер шрифта должен соответствовать возрасту детей.

4.Варианты ответов располагать в один столбик.

Тестовые задания обязательно содержат систему проверки, обработки и анализа результатов. Проверка может осуществляться самими учениками в ходе урока (самопроверка, проверка в парах) или учителем после уроков. За правильно выполненное задание ученик получает определённое количество баллов. Все баллы суммируются, и по выбранной шкале ставится оценка.

Оценка “5” ставится за 95-100 % правильных ответов.

Оценка “4” ставится за 80-95 % правильных ответов.

Оценка “3” ставится за 65-80 % правильных ответов.

Оценка “2” ставится за 50-65 % правильных ответов.

Очень важно при проведении тестирования указывать время, необходимое для работы учащимся. Время является фактором, который определяет качество получаемых в процессе тестирования результатов. Увеличение времени приводит к утомлению учащихся, что в свою очередь повлияет на результаты тестирования. В начальной школе тестирование не должно занимать более 20-30 минут, в это время внимание поддерживается мотивацией. Я чаще всего использую тестовые задания для текущей проверки и включаю в них небольшое количество вопросов (5-7). Выполнение таких заданий занимает не более 7 минут. Снижает затраченное время и бланковая форма заданий. Учащимся выдаются заранее заготовленные бланки или индивидуальные листы с вопросами и вариантами ответов (для заданий закрытого типа). В 1-2 классах вопросы я читаю сама, что тоже приводит к уменьшению потраченного на эту работу времени. А также помогает всем детям, независимо от скорости чтения и темперамента, закончить работу в одно время.

Таким образом, неоспоримые преимущества для учителя тестовых заданий следующие:

• выявление знаний и умений каждого ученика;

• своевременное обнаружение пробелов в знаниях;

• быстрота проведения;

• простота проверки.

А для ученика следующие:

• этот вид работы не утомляет детей;

• не нужно формулировать ответ и думать, как его грамматически правильно написать;

• обладает самопроверкой.

Понравилась статья? Поделить с друзьями:
  • Требования к инструкции испытуемого при проведении эксперимента не включают
  • Требования к должностным инструкциям по законодательству
  • Требования к должностной инструкции 2022
  • Требования инструкций технических условий по оценке качества зерна
  • Требования инструкций по охране труда по профессиям и видам работ