Тесты достижений. Среди всех типов стандартизованных тестов тесты достижений численно превосходят все остальные. Они создавались для измерения эффективности программ и процесса обучения и ориентированы на оценку достижений индивида после завершения обучения. Их принято противопоставлять тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. Тесты достижений измеряют влияние относительно стандартизованного курса обучения, такого, как курс английского языка, алгебры или информатики. А тесты способностей отражает совокупное влияние разнообразного опыта повседневной жизни. Таким образом, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях, тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях.
Другим отличием тестов способностей от тестов достижений являются цели их использования. Тесты способностей служат для предсказания последующего выполнения той или иной деятельности и применяются для оценки целесообразности прохождения индивидом того или иного специального курса обучения или для предсказания уровня его достижений в новой ситуации. Тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, они дают ответ на вопрос, что индивид может делать к настоящему времени. При этом для тестов способностей выявляется прогностическая валидность, а тесты достижений в основном оцениваются в терминах валидности по содержанию.
Тесты достижений в практике образования. Тесты достижений, применяемые в образовании, имеют заметные преимущества по сравнению с существующей оценкой успеваемости учащихся. Их показатели ориентированы на измерение усвоения ключевых понятий, тем и элементов учебной программы, а не конкретной совокупности знаний, как это имеет место при традиционной школьной оценке. Тесты достижений благодаря стандартизированной форме оценки позволяют соотнести уровень достижений учащегося по предмету в целом и по отдельным существенным его элементам с аналогичными показателями в классе или в любой другой выборке испытуемых. Безусловно, эта оценка носит более объективный характер и требует меньших затрат времени (большинство тестов достижений являются групповыми тестами), чем традиционная школьная оценка.
Разработка тестов достижений, опирающихся на учебные программы, имеет ряд особенностей. Важным этапом является подбор контрольных тестовых задач, связанных с планируемой для теста содержательной валидностью. Условием разработки и стандартизации таких тесты достижений является опора на стандартные программы обучения.
При всех типах обучения периодическое применение тестов достижений облегчает этот процесс. Такие тесты выявляют недостатки прошлого обучения, подсказывают направление последующего и обеспечивают мотивацию обучающегося. Эффективность такой самопроверки обычно сказывается немедленно. Поэтому, когда проверка достижений применяется главным образом как средство обучения, желательно, чтобы учащиеся узнали о допущенных ошибках как можно раньше.
Кроме того, тесты достижений помогают приспособить курс обучения к потребностям индивида. Учение происходит более плодотворно, когда начинается с той стадии, на которой уже находится обучающийся. Выяснение того, что каждый индивид способен делать и что он знает о предмете, есть поэтому необходимый первый шаг эффективного обучения.
Наконец, тесты достижений могут использоваться как средство оценки, усовершенствования и постановки задач обучения. Тесты достижений дают информацию о соответствии знаний и навыков, усвоенных обучающимися, тому, что они действительно должны были усвоить. Тесты достижений помогают анализировать цели обучения и контролировать его содержание и методы.
Виды тестов достижений. Тесты достижений относятся к наиболее многочисленной группе психодиагностических методик. Среди тестов достижений имеются широкоориентированные тесты, применяемые для оценки навыков по основным, рассчитанным на продолжительное время, целям обучения (тесты на понимание научных принципов, восприятие литературы и т. д.). Некоторые из них предназначены для измерения влияния обучения на логическое мышление, приемы решения широкого круга задач, критическую оценку выводов и воображение. По содержанию заданий и характеру получаемых результатов они наиболее близки тестам интеллекта. Более того, тесты интеллекта коррелируют с тестами достижений почти так же, как различные тесты интеллекта коррелируют друг с другом.
Другую большую группу тестов достижений составляют методики по конкретным учебным предметам (достижения в чтении, математике и др.) и более специализированные тесты достижений, направленные на исследование усвоения отдельных тем, частей учебной программы, комплексов действий и т.д.
Пример теста достижений
Широкоориентированным тестом достижений является Станфордский тест достижений. Его 6 батарей охватывают классы с I по IX. Их проведение занимает 4-5 часов и осуществляется в несколько сеансов.
Так, батарея промежуточного уровня II, применяемая с середины V и до конца VI классов содержит следующие 11 субтестов:
1. Словарный: измеряет словарный запас независимо от умения читать; незавершенные предложения предъявляются устно; ребенок выбирает слово, правильно завершающее каждое предложение. Пример. «Человек, который большую часть времени находится в плохом настроении, называется»: а-отшельник, б-актер, в-брюзга, г-учащийся.
2. Понимание прочитанного: отрывки прозы или стихов прочитываются ребенком, к каждому из отрывков дается серия вопросов, ответы на которые требуют владения такими навыками, как выявление центральной мысли отрывка, делание выводов, понимание скрытого смысла и реагирование на ключевые моменты текста.
3. Навыки анализа слов: определение звучания зрительно предъявляемых букв и буквенных сочетаний, составление слов из слогов.
4. Математические понятия: понимание математических терминов, систем обозначений и действий, например дробей, множеств, процентов, геометрических понятий и т. д.
5. Математические вычисления: включает различные действия с числами.
6. Применение математики: словесно сформулированные задачи, представляющие обычные житейские ситуации; содержит типичные арифметические задачи на рассуждение, а также задания на измерение, составление графиков, вычисление площадей и т.д.
7. Грамотность: выявление неправильно написанных слов, а также неправильного употребления в контексте омофонов (например, пруд вместо прут, костный вместо косный).
8. Язык: правильное использование языка, в том числе употребление прописных букв, пунктуации, форм глаголов и местоимений, структуры предложений.
9. Социальные науки: предназначен выявить знание фактологии, а также способность к абстрактному мышлению; используются сведения из географии, истории, экономики, политики, антропологии и социологии.
10. Естественные науки: предполагает знание научных методов, основных понятий физических и биологических наук.
11. Понимание прослушанного: непосредственно после прослушивания зачитываемого экспериментатором отрывка ребенок отвечает на серию задаваемых вслух по тексту вопросов.
Индивидуальная база знаний как основа тестов достижений. Батареи общих достижений связываются с основными образовательными навыками. Вместе с тем, есть необходимость в методах измерения достижений в конкретных областях знаний, изучаемых в школе и ВУЗах. Это – тесты достижений по отдельным дисциплинам.
С самого начала разработки интеллектуальных тестов общее знание считалось неотъемлемой частью интеллекта человека. Вопросы, направленные на выявление того, что индивид знает про мир, входят в состав наиболее распространенных тестов, прежде всего тестов достижений. Дж.Кэмпион полагает, что дефициты в организации базы знаний являются одним из источников умственной отсталости. Напротив, хорошо структурированная база знаний выступает в качестве отличительной черты детской одаренности и высоких интеллектуальных достижений в профессиональной деятельности.
Особенности базы знаний субъекта характеризуют такое его психологическое качество как компетентность. Высокий уровень компетентности предполагает высокий уровень понимания проблем в некоторой реальной предметной области (такой как математика, шахматы и т.д.), опытность при выполнении сложных действий и эффективность суждений. При этом компетентность в отношении реальных профессиональных проблем не связана с IQ. Например, при прогнозе результатов конных скачек опытные знатоки, независимо от величины своего IQ, обнаруживали более высокие показатели умозаключающей способности и многовариантность суждений в отличие от новичков.
В контексте тестов достижений из всех психических функций оказываются задействованными, прежде всего, функции долговременной памяти. По мнению Р. Глезера (1980; 1984), люди с различным уровнем интеллектуальных способностей обладают в разной мере организованной системой знаний - как декларативных (знаний о том «что»), так и процедурных (знаний о том, «как»).
Одной из наиболее распространенных экспериментальных моделей, в рамках которой изучается роль базы знаний, является сравнительный анализ проявлений интеллектуальной активности экспертов (знающих, опытных, обученных субъектов) и новичков (малоосведомленных, неопытных, начинающих). Например, эксперты-физики (специалисты) сначала строят физическую репрезентацию проблемы и только потом начинают ее решать, тогда как новички (студенты) более быстро и непосредственно переходят к процессу решения. Далее, репрезентации экспертов-физиков строятся вокруг фундаментальных принципов, которые характеризуют наиболее обобщенное, а также «подразумеваемое» знание (последнее выступает в виде сложных интуитивных представлений, далеко не всегда четко вербализованных), тогда как репрезентации новичков - вокруг доминантных объектов, которые представлены в соответствующей физической ситуации в явном виде. Кроме того, знания экспертов включают знания о возможности применения того, что они знают. Наконец, они успешно извлекают из собственных знаний сведения, необходимые для планирования своих дальнейших действий.
Как известно, память может быть процедурная и декларативная, последняя в свою очередь подразделяется на эпизодную и семантическую. Процедурное знание - это знание о том, как выполнять действия, и оно часто имплицитно, мало осознанно. Это знание, как ездить на велосипеде, играть в теннис или в волейбол; оно охватывает двигательные и другие навыки. Декларативное знание - эксплицитное знание о событиях (знать что-то), о котором можно сообщить и которое осознается. Эпизодная память в значительной мере автобиографична по содержанию, она удерживает личные переживания, связанные с конкретным временем и местом. При этом она подвержена существенным изменениям или потерям информации, т.к. таким воспоминаниям во многом не хватает формальной структуры. Семантическая память связана со знаниями о мире, в ней отсутствует личностное качество эпизодной памяти. Согласно Э.Тулвингу (1972), семантическая память является, прежде всего, организованным знанием о словах и прочих вербальных знаках, их значениях и референтах, об отношениях между ними, а также о правилах, формулах и алгоритмах для манипулирования этими знаками, понятиями и отношениями. Семантическая память регистрирует не воспринимаемые свойства входных сигналов, а их когнитивные референты. Когда мы употребляем слово «синий», мы относим его не к конкретному эпизоду в нашей памяти, где это слово было использовано, а к общему значению этого слова.
Когнитивные карты и процесс обучения. В последнее время активно развивается психолого-педагогические направление, в котором интегрированы когнитивная и педагогическая психология. В частности, это касается использования в процессах научения понятия когнитивных карт, о чем первым заговорил Э.Толмен (1948).
Дополнительная информация
В работах Э.Толмена понятие «когнитивная карта» обозначало знание пространства, проявляемое крысами в лабиринте. Позже O"Keefe и Nadel (1978) развели «эгоцентрическое кодирование», позволяющее определять местоположения относительно самого животного в терминах расстояний и направлений от него, и «аллоцентрированное кодирование», при котором когнитивная карта дает ориентиры и точки привязки одна относительно другой и которое обеспечивает запоминание местоположений, подход к скрытой цели новыми маршрутами, используя обходы и пр.
I.Glynn (1999) предложил соотносить два типа декларативной памяти (эпизодную и семантическую) с двумя типами навигации следующим образом. «Эгоцентрическая навигация», или карта маршрута, связана с эпизодической памятью, а «аллоцентрическая», или топографическая, навигация - с семантической памятью. Первоначально, тот или иной маршрут зависит от эпизодической памяти, но когда он становится знакомым, мы не помним отдельные походы, которые мы сделали, и знание взаимных расположений предметов становятся частью нашего знания о мире, частью нашей семантической памяти.
Показано, что когнитивные карты имеют отношение к перемещению не только по физическому, но по виртуальному пространству, в качестве которого может выступать учебный материала. Так, учащийся сначала усваивает материал в связи с теми или иными ситуациями (ситуации лекции, чтения литературы в читальном зале и т.д.). Именно поэтому на первых порах обучения столь выражен контекстно-зависимый характер памяти (это – эпизодная память). Но в дальнейшем, по мере оптимизации учебной деятельности, происходит переход от «эгоцентрической навигации» в учебном материале к «топографической», прежде всего, на основе логических схем, отражающих учебный материал в символической форме, вне зависимости от ситуаций его изучения (семантическая память). Таким образом, в начале обучения материал запоминается преимущественно с помощью эпизодной памяти, а в дальнейшем – с использованием семантической. Эти закономерности – разведение эпизодной памяти и семантической - могут быть использованы при построении систем тестирования достижений студентов.
Семантическая организация памяти. Переходя к рассмотрению семантической организации памяти, надо констатировать, что существует несколько моделей, которые разработаны в рамках когнитивной психологии и могут быть использованы в тестировании знаний.
Кластерная модель (основные представители: Бусфилд и Г.Бауэр). Здесь постулируется, что понятия хранятся в семантической памяти в виде кластеров, т.е. скоплений элементов, которые имеют какие-то сходные признаки. Например, воспоминание о конкретной птице хранится вместе с воспоминаниями о других птицах, название города - вместе с названиями других городов и т.д.
Бусфилд разработал метод анализа кластерной организации, предполагающий количественную оценку, - метод свободного воспроизведения. То, как происходит воспроизведение, может дать информацию об организации слов в памяти человека и о характере когнитивной структуры их организации.
Методика
Испытуемым в случайном порядке предъявлялись списки имен, названий животных, профессий и овощей. Всего было 60 существительных (по 15 в каждой из четырех категорий). Затем они должны были непрерывно давать ассоциации на слова, служившие названиями категорий,- например, птиц. При воспроизведении названий птиц испытуемые воспроизводили названия сходных птиц по кластерам. Ответ испытуемого мог звучать так: «ястреб», «орел», «стервятник», а затем: «курица», «индюк», «утка» - как если бы он отыскивал названия в какой-нибудь одной подкатегории класса «птицы» и, исчерпав ее, переходил к другой подкатегории, исчерпывал ее содержание и переходил к следующей и т.д.
Таким образом, в процессе свободного воспроизведения испытуемые проявили тенденцию к объединению слов в кластеры по их категориальной принадлежности. Как показывает свободное воспроизведение слов, предложенных для запоминания в бессвязном порядке, слова, относящиеся к близким категориям, воспроизводятся вместе.
Групповая модель (основной представитель: Б.Мейер). Здесь также постулируется, что понятия представлены в семантической памяти в виде групп (кластеров). Но в отличие от кластерной модели, здесь описаны также и другие особенности групп. Так, понятия объединяются в памяти не только по предметным категориям (например: орел, воробей и канарейка находятся в кластере «птицы»), но и по признакам (например: имеет крылья, имеет перья, летает - это признаки «птиц»).
Модель сравнительных семантических признаков (основные авторы: Э.Смит и Рош). Модель сравнительных семантических признаков близка групповой модели. Здесь постулируется, что есть два типа признаков, хранимых в семантической памяти. Это 1) определяющие признаки, являющиеся существенной частью понятия, и 2) характерные признаки. Определяющие признаки - те, что образуют существенные аспекты значения понятия, без которых оно не может быть отнесено к данной категории, и характерные признаки - те, что свойственны понятию, но несущественны для отнесения его к данной категории.
Основой выступает суждение, что в долговременной памяти представлены определенные множества, наборы информации, соответствующие тому или иному семантическому классу. Эти множества могут рассматриваться как локальные хранилища видов информации, выделенные на основе семантических признаков. Причем одна и та же информация может содержаться во многих хранилищах, что составляет основу для ее извлечения из памяти по самым различным основаниям. Совпадением или отличием определительных и характерных признаков детерминируется степень близости понятий в субъективном пространстве памяти.
Эта модель отличается от групповой модели несколькими важными моментами. Первый состоит в том, что значение понятия не является неразложимой единицей, скорее оно представляет собой набор семантических признаков. Широкий набор признаков, связываемых с каждым словом, меняется в непрерывном диапазоне от исключительно важного до случайного.
Итак, три перечисленные модели семантической памяти можно проиллюстрировать следующим образом:
С позиции кластерной модели, слово «воробей» расположено в семантической памяти вместе с названиями других птиц - орла, дятла и т.д.;
С позиции групповой модели, оно не только относится к более крупной категории птиц, но также обладает свойствами, или атрибутами - крылья, перья;
Согласно модели сравнительных семантических признаков «воробей» описывается на основе определяющих признаков - имеет перья, крылья и коричневую окраску, и характерных признаков - не прирученный, безвреден и т.п. Хотя некоторые из компонентов, выделяемых в групповой модели и в модели сравнительных признаков идентичны, последняя модель отличается тем, что в ней используются и определяющие, и характерные признаки.
Сетевая модель. Здесь постулируется, что понятия существуют в памяти как независимые единицы, объединенные в сеть с помощью пропозиций (например, «ель есть дерево»). Эта сеть обладает максимальной упорядоченностью и компактностью. В простейшем случае связь - это отношение типа «А есть В» или «воробей есть птица». В более сложном варианте сеть включает множество высказываний и поэтому очень разветвлена.
Так, А.М.Коллинз и М.Р.Квиллиан (1969) предположили, что семантическая память организована в большое количество иерархических сетей. Эта структура представлена иерархией категориальных фактов, таких как «канарейка это птица» и «птица это животное», связывая узлы для двух категорий связями «суть». Главные понятия, например «животное», «птица» и «канарейка», представлены узлами, а с каждым узлом связаны различные свойства, или характеристики (например, «питается», «имеет крылья»). С категориями связаны свойства, которые для них истинны. Свойства, истинные для категорий более высокого уровня, также истинны для категорий низшего уровня. Так, поскольку животные дышат, из этого следует, что птицы дышат и канарейки дышат.
Коллинз и Куиллиан проверяли свою теорию с помощью эксперимента, где испытуемый должен был как можно быстрее решить, являются ли различные предложения истинными или ложными, при этом варьировалась семантическая близость элементов в памяти и измерялось время реакции испытуемых.
Методика
Использовались двух- или трехуровневые иерархии. Предложения были такой формы:
1. «Канарейки могут петь»,
2. «Канарейки имеют перья»,
3. «Канарейки имеют кожу»,
4. «Канарейка может летать»,
5. «Канарейка желтого цвета».
Испытуемым предъявлялись подобные утверждения, а также ложные утверждения, такие как «яблоки имеют перья». Испытуемых просили оценить, было ли утверждение истинным или ложным, нажимая одну из двух кнопок. Измерялось время от предъявления утверждения до нажатия кнопки.
Время, требуемое для каждого определения, должно было зависеть, по прогнозу, от расстояния, на которое удалены в иерархии субъект и предикат. Так, информация, подтверждающая предложение 1, хранилась непосредственно в узле «канарейка». Однако информация для предложения 2 не хранилась непосредственно в узле «канарейка», а скорее - в узле «птица», и предложение 2 может быть выведено из непосредственно хранящихся фактов, что «канарейка это птица» и «птицы имеют перья». Кроме того, предложение 3 непосредственно не хранилось в узле «канарейка»; скорее, предикат «имеет кожу» хранился в узле «животное». Таким образом, предложение 3 может быть выведено из фактов «канарейка это птица», «птица это животное» и «животные имеют кожу». В случае предложения 1 вся необходимая информация для проверки запасена в узле «канарейка»; в случае предложения 2 испытуемые должны пересечь одну связь от узла «канарейка» до узла «птица», чтобы вспомнить необходимую информацию; и в случае предложения 3 испытуемые были бы должны пересечь две связи от узла «канарейка» до узла «животное». Если категориальное знание структурировано так, можно ожидать, что предложение 1 проверялось бы быстрее, чем предложение 2, которое в свою очередь проверялось бы быстрее, чем предложение 3. Именно это и было обнаружено. Испытуемым требовалось 1310 мс, чтобы оценить утверждения, подобные предложению 1; 1380 мс для предложений, подобных предложению 2; и 1470 мс для предложений, подобных предложению 3. Таким образом, время поиска, затраченное на переход от одного узла к другому в этой иерархии, возрастало вместе с числом уровней, которые приходилось обрабатывать.
На этом основании авторы сформулировали принцип когнитивной экономности, в соответствии с которым свойства, не являющиеся уникальной характеристикой слова, должны храниться только в конфигурации более высокого уровня (например, чтобы попасть в узел «стол имеет четыре ножки», надо пройти через узел «мебель»). Такие свойства, как «питание» или «дыхание», связаны с узлом «животное», но не с узлами «птица» или «канарейка». На низшем уровне запоминаются только те особенности, которые отличают один вид птицы от прочих (например, тот факт, что канарейки желтые).
Дальнейшие исследования извлечения информации из памяти несколько усложнили выводы, сделанные из первоначального эксперимента А.М.Коллинза и М.Р.Квиллиана. Было отмечено, что частота переживаний фактов оказывала сильное влияние на время извлечения информации. К.Конрад (1972) заметила, что использованные предложения различались не только по иерархической дистанции, отделяющей субъект от предиката, но и по их знакомости. Например, предложение «У канарейки есть кожа» является очень незнакомым и, кроме того, характеризуется значительной иерархической дистанцией. Так, некоторые факты (например, «яблоки съедобны»), для которых предикат мог храниться с промежуточным понятием типа «продовольствие», но которые переживаются весьма часто, верифицируются так же быстро или быстрее, чем такие факты, как «яблоки имеют темные семечки», которые должны храниться непосредственно с понятием «яблоко». Она провела уравнивание различных групп предложений по их знакомости и установила, что иерархическая дистанция между субъектом и предикатом на скорости решения сказывается очень мало. Для теории данный результат имеет серьезнейшие последствия, так как он подрывает главное доказательство важности иерархической дистанции. Эти данные показали, что структура семантической памяти в действительности сложнее, чем предполагали А.М.Коллинз и М.Р.Квиллиан.
По-видимому, если с фактом, связанным с понятием, часто сталкиваются, он будет храниться с тем же понятием, даже если бы он мог быть выведен из более общего понятия. Были сделаны следующие утверждения относительно организации фактов в семантической памяти и времени их извлечения:
Если с фактом, связанным с понятием, часто сталкиваются, он будет храниться с тем же понятием, даже если бы он мог быть выведен из более общего понятия;
Чем чаще человек сталкивается с фактом, связанным с понятием, тем более
прочно этот факт будет связан с данным понятием; и чем более прочно факты связаны с понятиями, тем быстрее они верифицируются;
Верификация фактов, которые непосредственно не хранятся с понятием, но
которые должны быть выведены, занимает относительно большее время.
Таким образом, на время извлечения материала из памяти оказывают влияние как сила связей между фактами и понятиями (определяющаяся частотой переживаний), так и расстояние между ними в семантической сети.
Конструирование тестов достижений.
Любой практический психолог должен уметь сконструировать тест достижений.
Тест достижений – это группа психодиагностических методик, направленных на оценку достигаемого уровня развития навыков и знаний.
2 группы тестов достижений:
Тест достижения противоположен тесту способностей. Различия: между этими тестами существует различие в степени единообразия предшествующего опыта, который и диагностируется. Если тест способностей отражает влияние совокупного разнообразного опыта, получаемого учащимися, то тест достижений отражает влияние относительно стандартного курса обучения чему-то.
Цель применения тестов способностей и тестов достижений:
Ни тесты способностей, ни тесты достижений не диагностируют способности, навыки, одаренность, а только успешность предшествующего достижения. Идет оценка того, чему человек научился.
Классификация тестов достижений.
Широкоориентированные – для оценки знаний и навыков, соответствие основным целям обучения (рассчитанным на продолжительное время). Например: тесты достижений на понимание научных принципов.
Узкоспециализированные – усвоение отдельных принципов, отдельных или учебных предметов. Например: усвоение темы в математике – раздел простые числа – как усвоен этот раздел.
Цели использования тестов достижений.
Вместо учительской оценки. Ряд преимуществ по сравнению с учительской оценкой: объективность - можно выяснить насколько усвоены главные темы, выявление основного. Можно построить профиль усвоения каждой темы.
Тесты достижений очень компактны. Тесты достижений – групповые – поэтому удобны. Можно оценить сам процесс обучения и усовершенствовать его.
Как конструировать тесты достижений?
Ответы должны быть построены так, чтобы исключить возможность напоминания ответов (то есть не давать не относящихся к теме варианты ответов или очень легкие, чтобы испытуемый не смог догадаться, отбросив варианты ответов, как заведомо неприемлемые).
8. Задается критерий выполнения. Психолог разрабатывает большое число заданий, не все они войдут в тест. Для начала все задания проходят проверку. Войдут в тест те задания, которые решаются стопроцентным большинством людей, которые хорошо владеют материалом. Вторая проверка на тех, кто не владеет материалом – они должны выполнить меньше половины. Задания составляются по максимальному критерию. 90-100% - высокий уровень обученности. Тест достижений не оценивается по сопоставлению со статической нормой, а с классом. Сопоставляется индивидуальный результат.
Тесты профессиональных достижений.
Тесты профессиональных достижений используются для оценки эффективности обучения профессионалов или профессиональных тренировок. Для отбора людей на наиболее ответственные должности – профотбор. Используется для оценки уровня квалификации работников, при переходе на другую должность. Цель – оценить уровень обученности профессиональным знаниям, навыкам.
3 формы тестов профессиональных достижений:
Тесты профессиональных достижений создаются, как и тесты достижений. Создается большое количество заданий, заведомо больше в несколько раз. Проверяют. Испытывают три группы работников:
Задание включается в тест, если:
Больше чем для 250 видов профессиональной деятельности разработаны тесты достижений. У нас таких тестов практически нет.
Для диагностики успешности обучения разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов, либо малоформализованные диагностические средства, которые может использовать учитель, такие как наблюдение, беседа и др.). Как отмечает А. Анастази, по численности этот тип тестов занимает первое место.
Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, являются более объективным показателем обученности, чем оценка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него, может выражать отношение педагога к его дисциплинированности, организованности, особенностям поведения и т.д. Тесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.
Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например разделом математики "стереометрия" или курсом английского языка. На формировании способностей (например, пространственных) влияние обучения также сказывается, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника.
Во-вторых, различие между тестами определяется целями их применения. Тесты способностей направлены, главным образом, на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Тесты же достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т.д., т.е. с помощью этих тестов диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Вместе с тем нельзя отрицать, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения.
Тесты достижений отличаются также и от тестов интеллекта. Последние не направлены на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогии, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:
Заполни пропуски в предложениях:
Вторая мировая война началась в... году: а) 1945, б) 1941, в) 1939, г) 1935.
22 июня 1941 года фашисты напали на... : а) Польшу, б) Советский Союз, в) Францию, г) Венгрию.
В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:
Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть: а) товар, б) город, в) ярмарка, г) натуральное хозяйство, д) деньги; а) рабовладелец, б) раб, в) крестьянин, г) рабочий, д) ремесленник.
Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений. Однако если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки и т.д., то задания теста интеллекта могут вызвать значительные затруднения, поскольку для их выполнения одной хорошей памяти недостаточно. Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.
Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков, требуемых школьнику на разных этапах обучения, таких как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями.
И наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т.д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать преподаватель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т.д.).
Отдельные тесты достижений можно объединять в тестовые батареи, что позволяет получать профили показателей успешности обучения разным дисциплинам. Обычно тестовые батареи предназначаются для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу либо от курса к курсу. Однако в последнее время созданы батареи, позволяющие получать и такие данные.
При составлении заданий теста достижений следует соблюдать ряд правил, необходимых для создания надежного, сбалансированного инструмента оценки успешности овладения определенными учебными дисциплинами или их разделами. Так, необходимо проанализировать содержание заданий с позиции равной представленности в тесте разных учебных тем, понятий, действий и т.д. Тест должен быть не перегружен второстепенными терминами, несущественными деталями и не иметь акцента на механическую память, которая может быть задействована, если в тест включать точные формулировки из учебника или фрагменты из него. Задания теста должны быть сформулированы четко, кратко и недвусмысленно, чтобы все учащиеся однозначно понимали смысл того, что у них спрашивается. Важно проследить, чтобы ни одно задание теста не могло служить подсказкой для ответа на другое.
Варианты ответов на каждое задание должны подбираться таким образом, чтобы исключались возможности простой догадки или отбрасывания заведомо неподходящего ответа.
Важно выбирать и наиболее приемлемую форму ответов на задания. Учитывая, что задаваемый вопрос должен быть сформулирован коротко, желательно также кратко и однозначно формулировать ответы. Например, удобна альтернативная форма ответов, когда учащийся должен подчеркнуть одно из перечисленных решений "да - нет", "верно - неверно". Часто в задании делаются пропуски, которые должен заполнить испытуемый, выбирая из представленного набора ответов верный (выше мы приводили пример задания из теста достижений с такой формой ответов). Обычно на выбор предлагается 4 - 5 вариантов ответа. Этот вид теста, как и любой другой, должен удовлетворять всем необходимым критериям, обладать высокой надежностью и удовлетворительной валидностью.
Наряду с тестами учебных достижений в высшей школе могут найти применение и тесты профессиональных достижений. Они применяются, во-первых, для измерения эффективности обучения или тренировок; во-вторых, для отбора персонала на наиболее ответственные должности, где требуются хорошие профессиональные знания и опыт; в-третьих, для определения уровня квалификации рабочих и служащих при решении вопросов перемещения и распределения кадров по рабочим постам. Эти тесты, как правило, призваны оценивать уровни развития конкретных знаний и навыков, требуемых для отдельных профессий, поэтому область их применения ограничена и определяется рамками узкой специализации.
Известны три формы обсуждаемых тестов: тесты исполнения или, как их еще называют, тесты действия, образцы выполнения работы, а также письменные и устные тесты.
В тестах действия требуется выполнить ряд заданий, наиболее важных для успешного осуществления определенной профессиональной деятельности. Зачастую для этого просто заимствуются отдельные элементы из реальной трудовой деятельности. Поэтому для проведения тестирования могут быть использованы соответствующее оборудование или инструменты. Если это по каким-то причинам невозможно, то используются тренажеры, способные либо воспроизводить отдельные рабочие операции, либо моделировать узловые ситуации профессиональной деятельности. Учитываются скорость выполнения работы и ее качество (например, число и качество деталей и т.д.).
Тест имеет отдельные нормативы для мастеров высокой квалификации и для начинающих работников. Известные специалисты в области промышленной психологии Дж.Тиффин и Э.Маккормик рекомендуют использовать в качестве критериев для сравнения три квалификационные ступени работников: низкую, среднюю и высокую. Соответственно, валидность теста устанавливается путем сопоставления средних показателей его выполнения по этим трем группам. Очень распространены тесты исполнения при определении уровня квалификации представителей конторских профессий (клерков, стенографисток, машинисток, секретарей и др.). Это, например, Блэкстонский тест оценки квалификации стенографисток, тест адаптации к конторской работе Пурдье, тест изучения навыков печатания на машинке Терстона и ряд других.
Письменные тесты достижений используются там, где на первый план выступают специальные знания, осведомленность, информированность. Они, как правило, создаются по заказу, имеют узкую профессиональную направленность и представляют собой серию вопросов, которые предъявляются на специальных бланках. Преимущество письменных тестов достижений состоит в возможности одновременной проверки целой группы людей.
Еще одним вариантом оценки уровня квалификации работников являются устные тесты профессиональных достижений. Они широко применялись в период Первой мировой войны для отбора и аттестации военного персонала. Тесты представляют собой серию вопросов, касающихся специальных профессиональных знаний, и задаются в форме интервью. Они удобны в применении, просты в интерпретации.
Следует отметить, что тесты, конечно же, не могут раскрыть полностью все стороны квалификации работника. Их целесообразно использовать в комплексе с другими способами определения уровня профессионального мастерства.
Тесты достижений в настоящее время широко распространены за рубежом, например, в США они разработаны более чем для 250 различных профессий.
На наш взгляд, этот тип тестов мог бы реально помочь в решении целого ряда проблем высшей школы. Особенно пригодны они для оценки эффективности профессионального обучения, сравнения разных методов и учебных программ путем сопоставления достижений групп, обучающихся разными способами. Не менее полезны они для выявления пробелов в знаниях у начинающих профессионалов и их своевременного доучивания с помощью индивидуализированных методов и приемов. Объективность, простота применения, краткость процедуры делают их пригодными для аттестации работников на разряд, для оценки квалификации. Однако работа по созданию таких тестов не проста, она требует специальных знаний и квалификации.
Оценивая тесты учебных и профессиональных достижений в целом, следует отметить их хорошие возможности в осуществлении контроля за процессами обучения и формирования профпригодности.
Контрольные вопросы и задание
1. Перечислите варианты названий тестов достижений.
2. В чем преимущества тестов достижений по сравнению с традиционной оценкой?
3. Почему нельзя отнести тесты достижений к категории интеллектуальных тестов или тестов способностей?
4. Укажите основные правила составления тестов успешности.
5. Для решения каких задач могут использоваться в высшей школе тесты профессиональных достижений?
Развитие методов и методик психодиагностики. Тесты специальных способностей и достижений. Работы Ч. Спирмена, Л. Терстоуна.
РАЗВИТИЕ МЕТОДОВ И МЕТОДИК ПСИХОДИАГНОСТИКИ
История современной психодиагностики начинается с первой четверти XIX в., т.е. с начала так называемого клинического периода в развитии психологических знаний. Этот период характеризуется тем, что ключевую роль в добывании и анализе эмпирических психологических знаний о человеке начинают играть врачи (до них этим занимались в основном философы и писатели). Врачей интересуют причины происхождения трудноизлечимых и распространившихся в те годы в развитых странах мира душевных заболеваний и неврозов. Врачи-психиатры начинают вести в клиниках Европы систематические наблюдения за больными, записывая и анализируя результаты своих наблюдений. В это время появляются такие методы психодиагностики, как наблюдение, опрос, анализ документов. Однако в целом психодиагностика в эти годы носит еще нестрогий, произвольный характер, что проявляется в различных выводах и умозаключениях, к которым приходят врачи, наблюдая за одними и теми же больными и изучая их с помощью одних и тех же методов. Это, в частности, происходит потому, что методы психодиагностики в то время носят еще качественный характер.
Началом создания количественных методов психодиагностики следует считать вторую половину XIX в. - то время, когда под руководством выдающегося немецкого психолога В. Вундта была создана первая в мире экспериментальная психологическая лаборатория, где в целях психодиагностики стали применять технические устройства и приборы. К этому же времени относится открытие основного психофизического закона, который, показав количественную связь между физическими и психологическими явлениями, ускорил создание средств количественной психодиагностики. Основной психофизический закон открыл возможность измерения психологических явлений, и это открытие привело к созданию так называемых субъективных шкал для измерения ощущений. В соответствии с этим законом основным объектом измерения стали ощущения человека, и долгое время, вплоть до конца XIX в., практическая психодиагностика ограничивалась измерением ощущений.
Начальным периодом становления современных методов психодиагностики, касающихся основных психологических процессов, свойств и состояний человека, следует считать конец XIX -начало XX в. В это время весьма активно и не без участия профессиональных психологов развиваются те области теории вероятностей и математической статистики, на которые впоследствии стали опираться научные методы количественной психодиагностики. Большая часть тех методов первичной и вторичной статистической обработки экспериментальных данных, которые были описаны во втором разделе данной книги, появилась как раз в эти годы. Однако вначале математическую статистику стали применять не в психологии, а в других науках: в биологии, экономике, медицине и т.д.
На 50-60-е годы XX в. приходится основное количество разнообразных психодиагностических методик. Это были годы наибольшей психометрической активности ученых-психологов.
Заметим, что в немалой степени созданию и разработке психодиагностики способствовал общий кризис психологической науки, возникший как раз на рубеже XIX и XX столетий. Он отчетливо выявил недостатки старой, интроспективной психологии, связанные в первую очередь с отсутствием научно обоснованных средств точной психодиагностики, особенно таких сложных явлений, как способности, интеллект и личность. Разработка соответствующих методов явилась началом выхода психологии из состояния кризиса, так как вновь созданные методы позволяли получать не умозрительные и субъективные, а точные и объективные знания о психологических процессах, свойствах и состояниях человека.
Тесты специальных способностей и достижений.
Психодиагностика способностей имеет выраженную гуманистическую направленность, поскольку способствует выбору наиболее подходящих возможностям и склонностям человека профессий, путей и способов построения обучения с учетом индивидуальных особенностей. Все это существенно влияет на формирование положительной профессиональной мотивации и удовлетворенности трудом, а следовательно, и удовлетворенности жизнью в целом.
Специальные способности рассматриваются по отношению к отдельным, специальным областям деятельности, что выражается в их классификации по видам деятельности (математические, художественные, музыкальные и т. д.). К исследованию специальных способностей относят изучение:
Математических способностей В. А. Крутецким и его
сотрудниками (1968),
Музыкальных способностей Б. М. Тепловым
Организаторских способностей Л. И. Уманским (1968),
Педагогических способностей Н. Ф. Кузьминой (1961),
Летных способностей К. К. Платоновым (1972),
Художественных способностей Е. И. Игнатьевым (1961).
Одним из очень распространенных тестов является разработанный для изучения музыкальных способностей тест музыкальной одаренности Сишора (Теплов Б. М., 1961). Он содержит серию заданий на изучение восприятия силы, интенсивности и тембра звука. Тест очень хорошо зарекомендовал себя и в областях, далеких от искусства.
Следующая группа тестов специальных способностей представлена тестами технических способностей. Эти методы были разработаны одними из первых среди методов диагностики специальных способностей. Поскольку тесты интеллекта были сосредоточены на изучении в основном «абстрактных» функций, возникла потребность в методах изучения более конкретных, практических способностей. В значительной степени эта потребность была удовлетворена за счет разработки тестов технических способностей. Очень популярным тестом изучения технического понимания
является тест Беннета, в котором используют серию картинок с короткими вопросами. Для того чтобы ответить на вопросы, необходимо понимать общие, технические принципы, встречающиеся в обыденных ситуациях.
Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Наиболее известным тестом достижений и широко применяемым до сих пор является Стэнфордский тест достижений (SAT) впервые опубликованный в 1923г. Он оценивает уровень обученности в разных классах в средних учебных заведениях.
Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Различаясь составом, методическими качествами, они сходны в одном - их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.
Теоретической основой для построения комплексных батарей тестов способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа Факторный анализ позволял точнее определить и классифицировать специальные способности. Поэтому остановимся немного на истории этого направления исследований Английский психолог Чарльз Спирмен в 1904 г пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий генеральный фактор. Он обозначил его буквой g (от англ. general - общий). Помимо фактора, общего для всех видов деятельности, в каждой из них обнаруживается специфический фактор, свойственный только данному виду деятельности (S - фактор). Теорию Ч Спирмена называют двухфакторной Согласно ее положениям целью психологического тестирования должно быть измерение g у индивидов. Если такой фактор проявляется во всех изучаемых психических функциях, то его наличие является единственным основанием для предсказания поведения индивида в разных ситуациях Измерение же специфических факторов смысла не имеет, поскольку они могут обнаружить себя только в одной ситуации, Спирмен не отрицал того, что двухфакторная теория требует уточнения. Если сравниваемые виды деятельности похожи, то в какой - то степени их корреляция может быть результатом не только фактора g, но и некоторого промежуточного фактора - не столь общего, как g, но и не столь специфичного, как S. Такой фактор, свойственный только части видов деятельности, был назван групповым. Позднее распространилась точка зрения, согласно которой структуру свойств составляет ряд достаточно широких групповых факторов, каждый из которых может в разных тестах иметь различный вес. Например, вербальный фактор может иметь больший вес в тесте на словарный запас, меньший - в тесте словесных аналогий и совсем незначительный - в тесте на математическое мышление Корреляции тестов между собой являются результатом нагруженности их групповым фактором Американские психологи Т Л Килли и Л Л Терстоун, продолжив работы факторно - аналитического направления, занялись проблемами групповых факторов. Их основные работы вышли в 20 - 30 - е гг. Л. Терстоун, основываясь на многочисленных исследованиях, выделил 12 факторов, которые он обозначил как "первичные умственные способности" Среди них можно назвать следующие: словесное понимание, беглость речи, числовой, пространственный, ассоциативная память, скорость восприятия, индукция (логическое мышление) и др. Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, равно 120.
На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известна среди них батарея тестов общих способностей (GATB), включающая тесты способностей для конкретных профессий. Современное понимание факторного анализа вносит некоторые изменения в ту его трактовку, которая была в 20 - 40 - е гг. Факторный анализ - это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами. Но, пожалуй, главное, что вызывает сомнение, это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в результате влияния требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований. Но техника факторного анализа принимает эти способности как некую данность; в действительности же они суть психические образования, находящиеся в динамике. Сказанное убеждает в том, что к возможностям факторного анализа нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.
Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845) В Америке тесты достижений начали использоваться при отборе сотрудников на государственную службу уже с 1872 г, а с 1883 г. их применение стало регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений была выполнена в течение первой мировой войны и сразу после нее Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах средних учебных заведений. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики Дальнейшее развитие тестов достижений привело к появлению в середине XX века критериально - ориентированных тестов
1.Сущность тестов достижений.
2. Типы и подтипы тестов достижений.
3. Нормоориентированные и критериально-ориентированные тесты достижений.
4. Стандартизированные тесты и неформальные тесты достижений.
5. Тесты специальных способностей и достижений.
Практическая часть.
Тесты достижений (они же тесты успешности, тесты успеваемости) являются диагностическим инструментом объективной оценки и контроля результатов образовательной или профессиональнойподготовки.
В 1894 г. американский ученый Дж. М. Райе применил таблицы по проверке знаний орфографии для изучения эффективности разработанных им методических приемов. В первое столетие XX столетия тесты достижений начали использоваться к образовательной и профессиональной практике США, Германии, Великобритании, России и других стран, однако в децентрализованной, прагматически ориентированной и активно развивающейся системе эти тесты получили более широкое распространение и развитие. На сегодняшний день тестовая методика в США рассматривается как универсальное средство проверки знаний, умений, профессиональной подготовки во всех областях человеческой деятельности. Для допуска практически к любому занятию, требующему навыков и знаний, необходимо получение сертификата. Тесты диагностики достижений в профессиональной деятельности, разумеется, намного сложнее. Индивидуальные экзамены сохранились лишь в тех областях, где требуются специальные знания, по которым подготовка дорогостоящих тестов нецелесообразна просто по финансовым соображениям. Таковы, например, экзамены в аспирантуре или в некоторых областях медици
ны. Если же речь идет о более или менее широком контингенте испытуемых, то для них всегда используются тесты.В процессе реформирования отечественной системы образования и ее интеграции в мировую образовательную практику тесты достижений переживают второе рождение. Начиная с 1998 г. Центром тестирования Минобразования России начат эксперимент по проведению централизованного абитуриентского тестирования в вузы, который стимулировал создание и внедрение итоговых тестов достижений по отдельным дисциплинам. Создается единый банк тестовых заданий; сформирован перечень обобщенных умений по географии, физике, истории, химии; создана стандартизированная спецификация тестов; осуществляется классификация тестовых заданий.
Опыт централизованного абитуриентского и репетиционного тестирования послужил основой для перехода к следующему этапу - единому государственному тестовому экзамену выпускников средних школ, который в порядке эксперимента проводится с 2001 г. Исследователи публикуют различные предложения по разрешению поставленных проблем отбора содержания для единого экзамена. В частности, для аттестации выпускников общеобразовательных учреждений предлагаются такие тестовые задания, которые позволяют судить о минимально допустимой компетентности выпускников. Рекомендуется использование критериально-ориентированных тестов, посредством которых определяется то, что испытуемый знает и чего он не знает из заданного стандарта.
Единый государственный экзамен по каждой дисциплине состоит из двух частей. Первая часть (А) - это аттестационный экзамен по курсу Х-Х1 классов, обязательный для всех учащихся. Предлагаются два варианта аттестации: А 1 - контроль обязательного уровня подготовки выпускников и А 2 - повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттестате. Вторая часть (В) - по желанию выпускников для поступления в вузы, состоящая также из вариантов В 1 (базовый уровень) и В 2 (повышенный уровень). По совокупным ответам на задания частей А (А, и А 2) иВ(В,и В 2) выдается сертификат единого государственного экзамена. Наиболее удобной для оценивания результатов тестирования абитуриентов является 100-балльная Т-шкала, по которой в настоящее время стал выставляться сертификационный балл выпускников средних школ.
Пока нормативная база отечественной системы образования (за исключением рассмотренного выше перехода школа-вуз) не разрешает проводить тестовые экзамены итогового и заключительного уровней, однако во всех компонентах этой системы ведется большая подготовительная работа. Наиболее актуальной становится разработка текущих, тематических и рубежных тестов, используемых в учебном процессе всех образовательных структур. Для сравнения можно указать, что в США ежегодно знания и способности учащихся проверяются с помощью 47 млн тестовых бланков, выпускаемых 400 тестовыми компаниями. Подавляющее большинство из них представляют бланки текущего, тематического и рубежного уровней достижений.
Сущностьтестовдостижений
Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретным, ограниченным определенными рамками учебного материала. Этим они отличаются от собственно психологических тестов - тестов способностей, умственного развития.
Как уже отмечалось ранее, выполнение тестов способностей отражает совокупное влияние разнообразного опыта жизни индивида. В отличие от тестов достижений тесты способностей измеряют результаты обучения в относительно неконтролируемых и неизвестных условиях. Так, на формирование пространственных способностей влияние отдельных разделов учебной программы (например, геометрические преобразования) хотя и нельзя отрицать, но их усвоение не является единственным фактором, определяющим уровень развития этих способностей. Поэтому при диагностике способностей трудно найти в условиях обучения однозначное объяснение высокой или низкой степени их развития у испытуемого.
Другое различие между тестами способностей и достижений относится к их назначению. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Напротив, тесты достижений применяются для оценки текущих или итоговых результатов усвоения тех или иных дисциплин либо их разделов. Главное значение в этих тестах придается тому, что конкретный индивид умеет делать в настоящий момент.
Такие авторитетные текстологи, как А. Анастази и Л. Кронбах, признают, что между тестами способностей и тестами достижений невозможно провести жесткую границу. Некоторые тесты способностейсоздаются в расчете на весьма специфическое предметное обучение, а некоторые тесты достижений могут охватывать относительно широкий образовательный опыт. Тесты достижений.могут в определенной степени предсказывать темпы продвижения учащихся в усвоении той или иной образовательной программы. Предметные тесты достижений, предваряющие профессиональную подготовку, могут служить предикторами успешности профессионального обучения.
Тесты достижений отличаются также и от тестов умственного развития, которые направлены на диагностику умений совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогия, классификация, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа.
Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимо знание конкретных фактов. Для того чтобы справиться с тестом умственного развития, необходимо логическое умение работать с понятиями (в нашем примере с понятиями «слово» и «предложение»), анализировать их, находить существенные признаки, устанавливать логические связи и т. д.
Тесты достижений противопоставляют субъективным методам проверки знаний, таким как устный и письменный опрос. Прежде всего, тесты обеспечивают объективность проведения испытания. Например, при проверке орфографических навыков диктант не даст такой объективной информации, какую предоставит специально разработанный тест. Преподаватели диктуют в разном темпе, с разной акцентуацией, и один и тот же ученик, пишущий диктант на одни и те же орфограммы, у разных учителей может сделать разные ошибки. В инструкции к тесту даются точные указания, как произносится слово, когда и в каком классе проводится тестирование, устанавливается, как следует диктовать предложения, сколько раз можно повторять слово и т. д. Объективность тестов достижений обеспечивается обработкой результатов испытания. Оценки одной и той же письменной работы разными учителями могут значительно отличаться друг от друга. Среди факторов, оказывающих воздействие на учителей при оценивании письменных работ, обычно выделяют следующие: объем письменной продукции, грамматические и орфографические ошибки (даже если оценивается исключительно содержание), почерк, последовательность, в которой оценивались работы, пол преподавателя и ученика, отношение к ученику. Тестовые задания составляют так, что для их выполнения достаточно написать число, слово, поставить крестик или подчеркнуть нужный ответ. Составленные таким образом, снабженные ключами и образцами типичных ответов, задания практически исключают расхождения при обработке результатов.
Тесту достижения, как и всякому другому тесту, присуща объективность интерпретации результатов измерения. Выставляя отметки, учитель пользуется не установленными стандартами выполнения, а своим личным масштабом оценки качества, часто ориентируясь на уровень усваемости класса, на то или иное место учебной дисциплины в образовательной программе. Так, отметка за один и тот же рисунок одного п того же ученика учителем школы с эстетическим уклоном и учителем общеобразовательной школы может быть совершенно различной. Гесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.
legno-board.ru - Сайт о саде, даче и комнатных растениях