ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 


(1) Номинативные шкалы (шкалы наименований). Это простей-
шая классификация испытуемых: мужчина/женщина - классифи-
кация по номинативной шкале.
(2) Порядковые шкалы. Здесь субъекты ранжированы, например,
по весу или росту. Такая шкала очевидно груба, поскольку не учиты-
вает значения разностей между рангами.
(3) Шкалы интервалов. В них разности между значениями во
всех точках данной шкалы равны. Эквивалентные интервальные
22
шкалы могут быть линейно преобразованы друг в друга, что позволя-
ет приводить результаты тестирования к общим шкалам и таким
образом осуществлять сравнение показателей. Более того, многие
статистические процедуры предполагают измерения по шкале интер-
валов.
(4) Шкалы отношений. Шкалы отношений помимо всего имеют
значимую нулевую точку (в отличие от интервальной шкалы она не
произвольна, а указывает на полное отсутствие измеряемого свойст-
ва) . Наличие такой точки - проблема для большинства психологи-
ческих переменных, хотя существуют методы конструирования тес-
тов, позволяющие использовать эту возможность.
По рассмотрении перечисленных четырех шкал становится оче-
видным, что в идеале разработчик психологических тестов должен
стремиться использовать шкалы отношений. В случае, когда это не-
возможно, то желательны шкалы интервалов, если предполагается,
что результаты будут подвергаться статистическому анализу. По-
скольку изучение валидности тестов практически неизбежно влечет
за собой такой анализ (а также потому, что количественные показа-
тели измерений в психологических тестах предоставляют им преиму-
щества по сравнению с другими видами испытаний), вывод очевиден:
ничего менее точного, чем шкалы интервалов, использовать нельзя.
Фактически же, как указывает Brown (1976), большинство психо-
метрических тестов приближаются к интервальным шкалам, а обра-
ботка результатов тестов так, как если бы они основывались на шка-
лах интервалов, дает полезные результаты.
Надежность
В психометрии термин "надежность" имеет два значения. Тест
называется надежным, если он является внутренне согласованным
(self-consistent). Тесттакженазываетсянадежным, еслиондаетодни
и те же показатели для каждого испытуемого (при условии, что
испытуемый не изменился) при повторном тестировании. Надеж-
ность при повторном тестировании по прошествии времени называ-
ется ретестовой надежностью (test-retest reliability).
Значение и важность надежности
по внутренней согласованности
В психометрии стремятся разрабатывать тесты, являющиеся в
высокой степени внутренне согласованными, по той очевидной при-
чине, что если некоторая переменная измеряется частью теста, то
тогда в других частях, если они не согласованы с первой, эта же
переменная измеряться не может. Таким образом оказывается, что
23
для того, чтобы тест был валидным (то есть измерял именно то, для
измерения чего он предназначен), он должен быть согласованным:
общепринятая в психометрии точка зрения состоит именно в том, что
высокая надежность является предпосылкой валидности (напр.,
Guilford, 1956; Nunnally, 1978).
Единственным, кто подвергает это положение сомнению, являет-
ся Кэттелл (см.напр. Cattell и Kline, 1977). Он аргументирует свою
точку зрения тем, что высокая внутренняя согласованность в дейст-
вительности является противоположностью валидности на том осно-
вании, что каждый вопрос должен затрагивать меньшую область или
иметь более узкое значение, чем критерий, подвергающийся измере-
нию. Таким образом, если все вопросы в высокой степени согласова-
ны, они значимо коррелируют, и, следовательно, надежный тест
будет измерять только лишь сравнительно "узкую" переменную с
малыми отклонениями. В качестве поддержки такой точки зрения
можно заметить следующее: (1) действительно, коэффициент а.
Кронбаха возрастает при увеличении интеркорреляции заданий; и
(2) при прогностическом изучении любой области со многими пере-
менными максимальное значение величины множественной корре-
ляции между тестами и критерием (в данном случае между задания-
ми теста и общим результатом) может быть получено, когда перемен-
ные между собой не коррелируют. Это очевидно, поскольку если две
переменные весьма значимо коррелируют, то одна из них не будет
предоставлять никакой новой информации.
Таким образом, максимум валидности, по рассуждениям Кэттел-
ла, может быть получен тогда, когда все задания теста не коррелиру-
ют друг с другом, а каждое из них имеет положительную корреляцию
с критерием. Однако, такой тест будет характеризоваться низкой
надежностью по внутренней согласованности. С моей точки зрения,
теоретически Кэттелл прав. Однако, насколько мне известно, ни
одному разработчику тестов не удалось сформулировать такие зада-
ния, которые, коррелируя с критерием, не коррелировали бы между
собой. Barrett и Kline (1982) исследовали личностный тест самого
Кэттелла (16 PF), в котором была сделана такая попытка, но оказа-
лось, что она не была полностью удачна.
Несмотря на эти комментарии, общее психометрическое правило
гласит: на практике валидные тесты являются в высокой степени
согласованными.
Ретестовая надежность (test-retest reliability)
Когда тест не может дать тот же самый результат для некоторого
испытуемого (при условии, что этот испытуемый не изменился) в
24
различных условиях, - значит, не все в порядке. Способ измерения
ретестовой надежности очень прост. Вычисляется корреляция пока-
зателей для выборки испытуемых, протестированных в двух случаях.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114

ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ    

Рубрики

Рубрики