ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ

 

-
-" ныи
фактор
Рис. 9. Векторная графическая мо-
дель соотношения <прямых> и <об-
ратных> эмпирических индикаторов
(пунктов) с релевантным (измеряе-
мый) фактором и иррелевантными
(<шумовыми>) факторами
3.3. ВАЛИДНОСТЬ ТЕСТОВ
Проблемы валидизации психологических тестов являются централь-
ными для дифференциальной психометрики, но, к сожалению, до сих
пор решенными не до конца. Решение этой проблемы зависит не от
статистического аппарата, а от уровня развития теоретического аппа-
рата дифференциальной психологии.
Валидность и надежность. Валидность (или обоснованность) всякой
процедуры измерения состоит в однозначности (устойчивости) получае-
мых результатов относительно измеряемых свойств объектов, т. е. от-
носительно предмета измерения. Отличие понятия валидности от на-
дежности измерения удобно раскрывать с помощью различения
<объекта> и <предмета> измерения. Надежность - это устойчивость
STR.75
процедуры относительно объектов. Надежность не обязательно пред-
полагает валидность. В психологии довольно часто возникает такая си-
туация, когда исследователь вначале предлагает определенную про-
цедуру измерения, показывает ее надежность -способность устойчиво
различать объекты, но вопрос о валидности остается открытым.
Если в сенсорной психофизике вопрос о валидности измерений ока-
зывается в значительной степени затушеванным тем обстоятельством,
что простейшие физические стимулы достаточно однозначно детерми-
нируют измеряемые свойства ощущений, то в дифференциальной психо-
метрике значимость проблемы валидности резко возрастает. Здесь си-
туация подобна той, когда в психофизическом опыте испытуемому не
указывают, по какому именно параметру следует сравнивать стимулы.
Пусть испытуемый А понял инструкцию так, что стимульные объекты
надо сравнивать по весу, а испытуемый Б - по размеру. Если проце-
дура измерения будет повторена по отношению к тем же объектам, то
она даст вполне устойчивые данные относительно объектов, но не даст
валидной информации ни о шкале ощущений <веса>, ни о шкале ощу-
щений <размера>.
При измерении способностей предъявляемый тест отнюдь не обяза-
тельно актуализирует именно тот психический процесс, который пред-
полагается измерить. Например, столкнувшись с уже встречавшейся
однажды задачей (например, с анаграммой <дзиканпр>), испытуемый
может начать запоминать просто то решение, к которому он уже одна-
жды пришел (слово <праздник>), чем заново решать эту задачу. Здесь
будет измеряться скорее уровень словесной памяти, чем уровень вер-
бального интеллекта. Точно так же реальная валидность некоторых
тестов раскрывается только в результате значительного опыта работы
с ними. Например, показано, что ряд тестов, внешне выглядящих
интеллектуальными, на деле измеряют скорее личностно-стилевые осо-
бенности индивида, чем операциональные возможности интеллекта, иа-
пример, методика <креативного поля> Д. Б. Богоявленской (1977).
Устойчивость теста относительно объектов (испытуемых) является
необходимым, но не достаточным условием его устойчивости относи-
тельно измеряемых атрибутов (свойств) объектов. Надежность явля-
1 ется необходимым, но не достаточным условием валидности. Отсюда
понятно основное соотношение психометрики:
валидность < надежность..
Это означает, что валидность теста не может превышать надежность
теста.
Данное соотношение, однако, неверно трактовать как указание на
прямо пропорциональную связь валидности и надежности. Повышение
надежности отнюдь не обязательно приводит к повышению валидно-
сти. В терминах А. Анастази валидность определяется репрезентатив-
ностью теста относительно измеряемой области поведения. Если эта
область поведения складывается из разнообразных феноменов, то со-
держательная валидность теста автоматически требует представленно-
сти в нем моделей всех этих разнообразных феноменов. Возьмем гло-
бальное понятие <речевая способность> (этому психолингвистическому
термину в традиционной тестологии соответствует <вербальный интел-
лект>). Сюда относятся такие относительно независимые друг от друга
навыки, как навыки письма и чтения. Если заботиться о содержа
Предельной внутренней согласованностью будет, например, .обладать тест-
опросник, состоящий из повторения одного и того же вопроса. Но валидность
данном случае будет минимальной.
STR.76
тельной валидности соответствующего теста, то нужно ввести в него
группы заданий на проверку этих довольно разных по своему опера-
циональному составу компонентов вербального интеллекта. В резуль-
тате введения разнородных пунктов и субшкал (субтестов) мы обяза-
тельно сокращаем внутреннюю согласованность, одномоментную на-
дежность теста, но зато добиваемся повышения валидности. Таким
образом, для расширения области применения теста психодиагност
должен избегать излишнего повышения внутренней согласованности.
Одновременно с этим снижением внутренних корреляций между раз-
личными пунктами теста (как это уже упоминалось в 3.1) обяза-
тельно исчезает отрицательный эксцесс на кривой распределения тес-
товых баллов, и она все более приближается по форме к нормальной
кривой.
Эмпирическая валидность. Если в случае с содержательной валид-
ностью оценка теста производится за счет экспертов (устанавливаю-
щих соответствие заданий теста содержанию предмета измерения), то
эмпирическая валидность измеряется всегда с помощью статистиче-
ского коррелирования:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172

ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ    

Рубрики

Рубрики