Клайн Пол

ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ

Наименьшим удовлетворительным значением для ретестовой на-
дежности является 0,7.
При более низком значении, как указывает Guilford (1956), ис-
пользование теста становится вряд ли целесообразным, поскольку
стандартная погрешность получаемых по нему показателей будет
настолько велика, что интерпретация показателей станет сомни-
тельной. Значение и влияние этой стандартной погрешности резуль-
тата будут обсуждаться в данной главе дальше, когда вы познакоми-
тесь с так называемой классической моделью погрешностей тестов
(Nunnally, 1978), рассматриваемой в рамках дискуссии о надежно-
сти.
Хотя ретестовая надежность проста в вычислении, следует быть
очень осторожным, чтобы не повысить ее искусственно проведением
слишком близких во времени испытаний, а выборки должны быть
достаточно репрезентативными применительно к той категории лиц,
для обследования которых предназначен тест.
И наконец, в связи с этим я должен упомянуть надежность парал-
лельных форм. В этом случае конструируются эквивалентные или
параллельные наборы заданий. Таким образом, испытуемые выпол-
няют совершенно другой тест при аналогичных условиях. Однако,
имеются трудности в доказательстве того, что обе формы являются
действительно эквивалентными. Несмотря на это, на практике па-
раллельные формы тестов оказываются полезными в установлении
надежности тестов.
Валидность
Кратко рассмотрим природу валидности, второй из основных ха-
рактеристик эффективных тестов. Как и при обсуждении надежно-
сти, целью этой главы является дать читателю общее представление
для понимания задач конструирования валидных тестов. Сами же
пути достижения валидности будут полностью представлены в этой
книге далее.
Тест называется валидным, если он измеряет то, для измерения
чего он предназначен. Однако такое определение не разъясняет удов-
летворительно значения валидности. В этом случае возникает новый
1 в известной мере условен. Для
Указанный предельный коэффициент надежности в известной мере уединен, wT
проективных и некоторых других тестов личности показатель ретестовой надеж-
ности может быть ниже, при этом диагностическая ценность методики не снижа-
ется (Прим.ред.)
вопрос: как мы узнаем, что тест измеряет то, для чего он предназна-
чен? В действительности, существует много различных способов до-
казательства валидноеT тестов, и каждый из них соответствует раз-
ным аспектам этого значения. О них и пойдет речь далее в этой главе.
Очевидная (внешняя) валидность (face validity)
Говорят, что тест является очевидно валидным, если о нем скла-
дывается впечатление, что он измеряет именно то, что подразумева-
ется, особенно с точки зрения испытуемых. Очевидная валидность не
имеет никакого отношения к истинной валидности и важна постоль-
ку, поскольку взрослые испытуемые обычно не включаются в работу
с тестами, которым недостает внешней валидности, полагая порой их
глупыми и даже оскорбительными. Дети, привыкшие к школьным
контрольным проверкам, не столь восприимчивы к внешним призна-
кам теста. Очевидная валидность, таким образом, лишь помогает
добиться сотрудничества с испытуемыми.
Конкурентная валидность (concurrent validity)
Эта валидность оценивается по корреляции результатов данного
теста с результатами других тестов. Так, если мы пытаемся устано-
вить конкурентную валидность некоторого теста интеллекта, мы бу-
дем изучать его корреляцию с другими тестами, валидность которых
установлена. Этот пример наглядно иллюстрирует недостаток опре-
деления конкурентной валидности. Если уже существует другой ва-
лидный тест, достаточно эффективный, чтобы он мог использовать-
ся, то новый тест, который предстоит валидизировать, может быть в
какой-тостепениненужным. Всамомделе, этобудеттак, еслитолько
он не обладает некоторой значимой характеристикой, не присущей
другим валидным тестам. Например, если он будет очень коротким,
простым в использовании, удобным для обработки, или хотя бы будет
нравиться испытуемым, то это вполне бы оправдало разработку но-
вого теста тогда, когда существуют другие тесты для измерения дан-
ного критерия. С другой стороны, если нет эффективных тестов для
измерения данного свойства или особенности, когда новый тест за-
трагивает иные свойства или особенности индивидуума, тогда ясно,
что изучение конкурентной валидности становится затруднитель-
ным.
Иногда, когда нет тестов для измерения некоторого свойства, мож-
но попытаться использовать экспертные оценки. Здесь, однако, су-
ществуют серьезные проблемы. Валидность рейтингов может точно
так же оказаться под вопросом и, кроме того, если возможно приме-
нение рейтингов, то вряд ли здесь нужен тест.
26
В общем, конкурентная валидность полезна тогда, когда есть не-
удовлетворительно работающие тесты для измерения некоторых пе-
ременных, а новые тесты создаются в попытке улучшить качество
измерения. В случаях, подобных этому, при изучении конкурентной
валидности можно ожидать значимых, но умеренных корреляций.
Таким образом ясно, что конкурентная валидность не является до-
статочно полным аспектом валидности. Чтобы принять тест как ва-
лидный, нам, в дополнение к исследованию конкурентной валидно-
сти, потребуются дальнейшие и отличные от данного свидетельства.
Конкурентная валидность также полезна для установления факта,
чего же не измеряет тест. Тест не должен иметь корреляции с другими
тестами, измеряющими совершенно иные переменные.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114

ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ

Введение в психометрическое проектирование

Рубрики

Рубрики