ПРОБЛЕМА ТЕОРЕТИЧЕСКОГО ОБОСНОВАНИЯ

ПРОБЛЕМА ТЕОРЕТИЧЕСКОГО ОБОСНОВАНИЯ

ПРЕДМЕТА ИСПЫТАНИЙ ПРИ РАЗРАБОТКЕ

ПСИХОЛОГИЧЕСКИХ ТЕСТОВ

Ю. З. ГИЛЬБУХ

Актуальность вопроса. Наблюдаемое в последние годы в советской психологии неуклонное повышение интереса к совершенствованию метода тестов делает особенно настоятельной разработку принципов и приемов теоретического обоснования предмета вновь создаваемых или модифицируемых методик. Каково положение в данной области?

Для тестологических концепций, получивших распространение на Западе, в течение длительного времени характерным было отрицание обязательности какого бы то ни было раскрытия сущности того психического свойства, которое избирается в качестве предмета разрабатываемого теста. Наиболее ярко это проявилось в подходе к конструированию умственных (интеллектуальных) тестов. Соответствующее «кредо» сформулировал в свое время Л. Термен, пытавшийся обосновать «слепое» тестирование ума аналогией с применением электричества: хотя, писал он, природа этого явления по-настоящему не раскрыта, тем не менее оно не только успешно измеряется, но и широко используется в практических целях [31]. И сегодня, несмотря на быстро растущее понимание западными тестологами роли теоретического знания, эта неправомерная, механистическая аналогия все еще оказывает влияние на отдельных авторов, причем таких известных, как, например, Г. Ю. Айзенк [16].

Западными тестологами за последние десятилетия издано немало фундаментальных трудов по «теории тестов» [28], [29]. Однако то, что обозначается этим термином, весьма далеко от психологической теории. Как справедливо отмечает Энн Анастази, «теория тестов» — это не психологическая, а математико-статистическая теория, охватывающая такие вопросы, как природа тестовой оценки, шкалы и методы определения надежности тестов [23].

Даже после того как стали оформляться различные теории умственного развития ребенка (например, Л. С. Выготского, Ж. Пиаже, Дж. Брунера), зарубежная ментиметрия продолжала оставаться своеобразной математико-статистической дисциплиной, изолированной от достижений психологической науки.

Проследив историю ментиметрической мысли от А. Бине до наших дней, подробно рассмотрев работы Л. Термена, Ч. Спирмена, Л. Терстона, Д. Векслера, Дж. Гилфорда, Ж. Пиаже, один из историков тестологии, приходит к выводу, что «ни одна теория или модель не стала основой для какого-либо умственного теста, за исключением разве что работ Дж. Гилфорда» [15; 204]1.

Наличие в этом перечне имен А. Бине, Л. Термена, Д. Векслера может показаться несколько неожиданным, поскольку указанные авторы вошли в историю как создатели весьма популярных тестовых методик. Парадокс, однако, заключен в другом: ни один из них не положил в основу созданного им теста какую-либо четко сформулированную концепцию, хотя каждый был известен и своими теоретическими работами.

Ч. Спирмен и Ж. Пиаже вообще не занимались конструированием тестов, но первый из них широко пользовался тестовыми методиками для обоснования своей теории «генерального фактора». Попытки разработать ряд тестов, основанных на экспериментальных методиках Ж. Пиаже (а значит, и на его концепции умственного развития [27]), пока не привели к созданию таких инструментов, которые вышли бы за стены исследовательских лабораторий. Что же касается Дж. Гилфорда, то, хотя он и положил в основу своих тестов определенную теоретическую концепцию, последняя, однако, оказалась недостаточно жизнеспособной (о чем более подробно сказано ниже).

Положение, сложившееся в практической сфере, может быть определено следующими словами Ли Кронбаха: «Практически используемые тесты сегодняшнего дня очень близки к тестам 20-х годов. Современные тесты отличаются от тестов более ранних поколений так же, как автомобили 70-х годов отличаются от автомобилей 20-х годов: они более мощны, более элегантны, но работают на тех же принципах, что и раньше» [24;. 199].

Для советской психологии положение, согласно которому исходным пунктом и важнейшим условием построения валидного и надежного теста [6], [9] является глубокая теоретическая проработка его предмета, всегда было и остается одной из главных аксиом. Учитывая модельную природу психологического теста, уместно в этой связи сослаться на следующую общую формулу М. Г. Ярошевского, высказанную, правда, в несколько иной связи: «Чем достовернее представление об образце, тем совершеннее модель» [22; 4]. Положительным примером теоретического анализа тестируемых психических свойств могут служить диагностические комплексы, разработанные под руководством Л. А. Венгера [14] и З. И. Калмыковой [17], И. С. Якиманской [21а]. С другой стороны, в методологических работах советских авторов по этому вопросу подвергнуты критике примеры содержательной невалидности тестов, обусловленной недостаточным знанием особенностей исследуемого психического свойства [15].

К сожалению, часто встречающиеся в работах советских авторов указания на необходимость глубокого, теоретического обоснования психических свойств, избираемых в качестве предмета тестирования, носят по преимуществу декларативный характер. Объясняется это в первую очередь тем, что не разработаны сами принципы и способы такого обоснования. Попытаемся в связи q этим проанализировать некоторые возникающие в данной области проблемы.

Основные парадигмы. В подходе к теоретическому обоснованию предмета испытаний при конструировании психологических тестов можно выделить две основные парадигмы. Первую из них условно назовем парадигмой последовательных этапов, вторую — парадигмой взаимодействия.

Парадигма последовательных этапов относит возможность создания психологического теста к моменту, когда налицо уже имеется некоторая законченная теория, «на основании» которой и создается соответствующий тест или комплекс тестов. Таким образом, объективно, в историческом аспекте, процесс создания теста складывается из двух этапов: 1) создание теории (не связанное непосредственно с перспективой последующей разработки того или иного теста); 2) сама разработка теста.

В советской психологии эта парадигма была сформулирована еще, в 20-х гг. [2], за рубежом к ней пришли в целом несколько позже2.

Признавая ее несомненную плодотворность, следует вместе с тем указать и на целесообразность использования второй парадигмы, в которой разработка теоретической модели психического свойства и конструирование соответствующего теста выступают как две органически связанные друг с другом стороны единого творческого процесса.

Парадигма взаимодействия в последние годы приобретает все больше сторонников. Так, в одной из недавно опубликованных работ подчеркивается необходимость «содержательно-нерасторжимой, двусторонней связи исследования и диагностики» (20; 169]. Правда, логика развертывания исследовательского процесса по созданию теста формулируется таким образом, что эта двусторонняя связь реализована еще не полностью, но все предпосылки для этого здесь уже налицо.

Следует отметить, что парадигма взаимодействия может функционировать не только в рамках разработки того или иного теста, но и применительно к развитию определенной теории. Достаточно указать на основополагающую роль, которую применение тестов сыграло — еще на заре тестологии — в разработке теории общих и специальных способностей, в последующих исследованиях психологической структуры личности. В дальнейшем на базе этих теорий были сконструированы новые тесты. Как справедливо отмечал в свое время С. Г. Геллерштейн, появление в арсенале психологической науки метода тестов оказалось «чрезвычайно плодотворным и для теоретической психологии» [4; 8]. Совершенно очевидно, что и в современных условиях исследование психических явлений не должно обходиться без применения тех, возможно, пока еще не вполне совершенных тестов, которые уже созданы к данному моменту.

Таким образом, тесная взаимообусловленность, с одной стороны, теоретического знания о психических свойствах человека и, с другой стороны, тестовых методик, используемых для их диагностики, выступает перед нами как явление, которое, по-видимому, будет становиться всё более характерным для развития как общей, так и прикладной психологии. При этом следует отметить, что парадигма взаимодействия находится только в начальной стадии своей реализации, ее возможности полностью еще не исследованы. И это побуждает нас к более детальному ее рассмотрению. Однако вначале следует остановиться на вопросах, одинаково значимых для обеих названных парадигм.

Психические свойства личности как предмет тестирования. Если обратиться к так называемым тестам «общего интеллекта» (Бине, Векслер, Армейский тест Альфа), то мы обнаружим следующие черты сходства: испытуемым предлагаются более или менее систематизированные наборы различных умственных заданий (перцептивных, мыслительных, имажинативных), по результатам выполнения которых выставляется одна совокупная оценка, мало или совсем не отражающая соответствующие внутрииндивидуальные различия и, следовательно, имеющая весьма незначительную диагностическую ценность.

По-иному обстоит дело в так называемых тестах личности (Роршах, TAT, MMPI и некоторые другие). Предмет в этих тестах, хотя и является весьма широким с точки зрения охвата различных аспектов в личности, тем не менее носит достаточно дифференцированный характер: мы получаем здесь «на выходе» информацию по систематизированному набору отдельных параметров, шкал и т. п., а также отношений между ними, что и обусловливает существенную диагностическую полезность тестов данного типа.

Итак, чем дифференцированнее предмет теста, тем, при прочих равных условиях, выше его научная и практическая ценность. Отсюда следует, что исходной предпосылкой теоретической обоснованности той

или иной тестовой методики должен стать выбор в качестве ее предмета определенного психического свойства3.

Мы не будем останавливаться на сущности данного понятия, поскольку она достаточно четко сформулирована в советской психологии, в частности в теоретических работах С. Л. Рубинштейна [19]. Проблема заключается в другом — поддаются ли психические процессы (а значит, и свойства) дифференцированной оценке?

При анализе этого вопроса мы исходим из положения об онтологической недизъюнктивности психических процессов, которые, однако же, могут быть расчленены в мышлении в процессе научной абстракции (т. е. гносеологически). При этом «мысленное расчленение онтологически нерасчлененного, недизъюнктивного объекта учитывает и сохраняет изначально недизъюнктивные (генетические) взаимосвязи между различными свойствами исследуемого предмета» [3; 8]. Подобное гносеологическое расчленение имеет под собой «онтологическое основание» [18; 149]. Его сущность мы видим в следующем. Онтологическая недизъюнктивность психических процессов означает лишь то, что, как правило, они не существуют изолированно во времени, а функционируют как компоненты целостной системы, в функциональном взаимодействии. Однако последнее обстоятельство не только не исключает, а, наоборот, предполагает их качественную определенность, своеобразие.

Это своеобразие открывается, нам прежде всего благодаря тому, что в некоторых естественных ситуациях отдельные психические процессы проявляют себя более или менее изолированно (например, на начальных стадиях онтогенеза, при локальных поражениях головного мозга). Возможно также и экспериментальное «улавливание» изолированных эффектов определенного психического процесса при его функциональном взаимодействии с другими процессами.

Остановимся на той разновидности «улавливания», которая основана на учете внутрииндивидуальных различий в уровнях развития отдельных познавательных процессов. С этой целью могут быть использованы аналитические тесты, построенные в соответствии с правилом, которое мы условно назвали принципом «максимальной нагрузки». Его основные положения сводятся к следующему:

1) тест должен содержать такой стимульный материал и такую инструкцию для испытуемых, чтобы в отношении диагностируемого свойства каждый из них — и самый слабый, и самый сильный — имел возможность и хотел показать свой «максимум»; 2) в отношении всех остальных психических свойств тест должен быть настолько доступным для испытуемых, чтобы индивидуальные уровни развития этих свойств не отражались на ходе и результатах его выполнения; 3) система оценивания в тесте должны быть «настроена», образно говоря, лишь на ту реактивную волну, на которой проявляет себя именно диагностируемое свойство. Все аспекты деятельности испытуемого, обусловленные другими психическими свойствами (которые не входят в предмет теста), системой оценивания не улавливаются, не отражаются.

В результате реализации указанных требований индивидуальные различия в оценках по тесту всецело обусловливаются различиями в уровне развития именно диагностируемого свойства, и только этого свойства.

Общепсихологические и дифференциально-психологические, определения психических свойств. Избрав в качестве предмета предполагаемых испытаний некоторое психическое свойство, автор будущего теста

обычно руководствуется при этом лишь общепсихологическим определением этого свойства. Известно, однако, что определения, которыми оперирует общая психология, отличаются максимальной обобщенностью и абстрактностью. Разумеется, гносеологически обобщение реальных психических свойств, если при этом имеется в виду лишь функциональный аспект, вполне правомерно, несмотря на присущее этим свойствам качественное своеобразие. Например, способность звуковысотного различения, так называемое ладовое чувство, и чувство ритма можно обобщить в родовом понятии «музыкальные способности», а последние объединить со способностями к литературной и изобразительной деятельности в еще более общем понятии «художественные способности». Затем мы приходим к понятию «умственные способности» и наконец к «психическим свойствам человека».

Однако при конструировании тестов пользоваться такими обобщениями в качестве определений предмета испытаний значит выдавать вексель, который в будущем при практическом использовании данного теста, может оказаться на деле неоплаченным (правда, такие случаи часто не замечаются).

Дело в том, что конструктор теста не может (да и не должен) включать в него все поведенческие проявления тестируемого свойства, но стремится ограничиться их репрезентативной выборкой. Возможность такого ограничения действительно существует. Логически она основана на неполной индукции через исключение случайностей [1; 256—260]. Подлинная реализация этой возможности делает тест весьма эффективным инструментом познания. Однако, для того чтобы в данном случае неполная индукция исключала случайности, необходимо осуществить предварительную «инвентаризацию» поведенческих проявлений, относящихся к тестируемому свойству. Между тем даже аналитические тесты в большинстве случаев не строятся на основе такой инвентаризации. Поэтому стимульная репрезентация тестируемого психического свойства соответствует здесь лишь требованиям неполной индукции, осуществляемой через простое перечисление и, следовательно, имеющей недостаточно обоснованный, во многом случайный характер [1; 255— 256]. В результате мы получаем тест, не обладающий достаточной содержательной и прогностической валидностью (см. схему).

Неадекватная стимульно-реактивная репрезентация выбранного психического свойства здесь практически неизбежна, поскольку это

свойство берется в общепсихологическом — максимально широком — значении. Реальный способ избежать подобных ситуаций заключается в том, чтобы при определении предмета разрабатываемого теста подходить к выбранному психическому свойству не с общепсихологической, а с дифференциально-психологической точки зрения, что означает необходимость более или менее детальной «инвентаризации» поведенческих проявлений, относящихся к данному психическому свойству.

Задавшись, например, целью сконструировать тест способности к кратковременному запоминанию, мы должны вначале ответить на вопрос: правомерно ли считать, что, измерив уровень кратковременного запоминания материала одного вида при определенной форме его воспроизведения, мы тем самым измерили и уровень запоминания всех других видов при всех других формах воспроизведения, или же для некоторых их видов должны быть созданы самостоятельные тесты? То же самое следует сказать и в отношении всех остальных психических свойств (внимательности, мыслительных способностей, трудолюбия, коллективизма, правдивости и т. д.) — все они с дифференциально-психологической точки зрения обладают генеральностью лишь до определенной степени, в рамках которой и должны конструироваться соответствующие тесты.

Более или менее точное знание этих рамок, наличие «инвентаря» входящих в них поведенческих проявлений позволило бы уверенно пользоваться одним из них в качестве репрезентатора данного психического свойства (так как в этом случае тестовая оценка представляла бы собой продукт неполной индукции, исключающей случайность).

Каким же образом может быть произведена такая инвентаризация?

Основной принцип дифференциально-психологического подхода к выделению психических свойств формулируется (в данном случае применительно к умственным способностям) следующим образом: «Отдельные способности идентифицируются на основании того факта, что некоторые люди выполняют одни задания более быстро или более правильно, чем другие задания» [32; 4]. Или — более развернуто: «Способности определяются эмпирически детерминируемыми связями между наблюдаемыми сепаратными деятельностями. Например, то, что индивиды, которые хорошо действуют по заданию А столь же хорошо действуют по заданиям В и С, но не по заданиям D, Е и F, истолковывается в том смысле, что в выполнение первых трех заданий включен некоторый общий процесс, отличный от процесса, включенного в последние три задания» [26; 1017].

Следовательно, главная особенность дифференциально-психологического подхода к определению предмета конструируемого теста — ярко выраженный эмпирический характер, жесткая зависимость от статистических распределений, полученных в результате обследования живых человеческих индивидов — носителей соответствующего психического свойства. Именно анализ таких распределений и позволяет выявить границы между поведенческими проявлениями различных, хотя и родственных друг другу, психических свойств.

О значении математико-статистических методов в идентификации и классифицировании психических свойств. Как известно, именно с этой целью в русле дифференциально-психологического подхода были разработаны методы корреляционного и факторного анализа тестовых оценок. Не вдаваясь в детальное рассмотрение возможностей этих методов, отметим лишь то, что представляется наиболее существенным для нашей темы.

Прежде всего следует отметить, что оформившееся в ходе факторно-аналитических исследований Ч. Спирмена и Л. Л. Терстона представление об интеллекте как системе общих групповых и специфических

способностей (факторов) потому оказалось достаточно жизнеспособным, что в основу этих исследований были положены плодотворные гипотезы, сформировавшиеся на основе предшествующих достижений теоретической и экспериментальной психологии. Использование же количественных методов лишь облегчило эмпирическую проверку этих гипотез. Более того, есть все основания полагать, что, как средство построения «тотальной» классификации умственных способностей (не говоря уже о классификации вообще всех психических свойств личности), факторный анализ в основном исчерпал на этом свои возможности.

Ярким свидетельством того, что успех в классифицировании психических свойств невозможен без использования зрелых теоретических гипотез, является неудача, постигшая Дж. Гилфорда в его известной попытке построить «всеохватывающую» и вместе с тем детальную модель, отражающую структуру интеллекта [5]. Главную причину этой неудачи мы видим в отрыве теоретических построений от эмпирической базы, в чрезмерном увлечении формально-логическими комбинациями при игнорировании собственно психологических закономерностей. Достаточно указать на идею Дж. Гилфорда о том, что различные сочетания отдельных видов содержания, умственных операций и их продуктов в каждом отдельном случае должны давать «самостоятельный» фактор, или способность. А где же тогда присущая умственным способностям генеральность? С другой стороны, разве доказано, что умственные операции совершенно независимы от содержания, которым они оперируют? И наконец, разве можно представить себе человеческий интеллект безо всяких иерархических взаимодействий?

Даже если не допускать подобных методологических ошибок, вряд ли дифференциальная психология в состоянии сегодня решить задачу всеобщей классификации психических свойств. По-видимому, начинать следует с более ограниченных целей — выделения и спецификации лишь отдельных психических свойств. Здесь особенно эффективной может оказаться парадигма взаимодействия. Ее реализация должна осуществляться в рамках построения концептуальных моделей тех психических свойств, которые выбраны в качестве предмета тестирования.

Парадигма взаимодействия: конкретные приемы реализации. Такая модель в каждом конкретном случае включает: 1) определение функциональной роли данного свойства в структуре той или иной деятельности; 2) определения основных факторов, формирующих данное свойство, а также главных стадий его развития в онтогенезе; 3) детальную спецификацию стимулов, провоцирующих его проявления и 4) реестр самих проявлений с указанием их временных, динамических и других параметров (показателей).

Каким же образом может быть построена такая модель?

Сведения по первым двум характеристикам черпаются из исследований по общей и возрастной психологии. На этой общетеоретической базе экспериментальным путем определяются последующие две характеристики.

Для этого в исходном — строго аналитическом — варианте теста, построенном в соответствии с принципом максимальной нагрузки, выделяется ряд независимых переменных, касающихся стимульного материала, инструкции для испытуемого, системы оценивания результатов. Методом повторного тестирования определяется надежность теста в данном его варианте, после чего производится определенная модификация по одной из выделенных независимых переменных4. Если коэффициент корреляции между исходным и модифицированным вариантом

теста окажется близким к полученному ранее коэффициенту надежности, то в этом случае делается вывод, что оба теста репрезентируют одно и то же психическое свойство: в противном случае их относят к различным психическим свойствам. Затем создается новая модификация, которая, в свою очередь, сопоставляется с исходной, и т. д. до тех пор, покуда не будут проанализированы все различия, в отношении которых можно предположить, что они не выходят за рамки поведенческой сферы того психического свойства, которое составило содержание исходного варианта теста.

Так, например, при разработке теста, предназначенного для испытания устойчивости оперативной памяти [12], планомерно варьировалось количество подсвечиваемых на пульте символов («объем программы»). Как показала экспериментальная апробация, эта переменная является инвариантной по отношению к принятой в данной методике зависимой переменной — «длине» непрерывного ряда правильных реакций, который испытуемый в состоянии показать в одной пробе. На этом основании был сделан вывод о том, что сфера проявлений указанной способности покрывает весь исследовавшийся диапазон варьирования данной переменной. Вместе с тем дальнейшая апробация данной методики, проведенная с помощью более совершенного аппарата [11], показала, что характер подсвечиваемых символов (буквы, цифры, разноцветные лампочки) существенным образом влияет на статистические распределения в отношении указанной зависимой переменной. Это дало основание сделать вывод о том, что для выполнения заданий с использованием указанных видов стимулов требуются разные, хотя и родственные, мнемические способности.

Таким образом, дифференциально-психологические определения психических свойств являются более конкретными по содержанию и вместе с тем более узкими по объему в сравнении с определениями, принятыми в общей психологии, причем большая конкретность выражается в том, что определение дается не только в плане указания абстрактной функции, но и в терминах, специфицирующих характер как стимульного «входа», так и реактивного «выхода».

При таком подходе идентифицирование определенного психического свойства, разработка его концептуальной модели, с одной стороны, и конструирование соответствующего теста, с другой стороны, сливаются в единый творческий процесс, в котором теоретический и эмпирический аспекты взаимопроникают и обусловливают друг друга.

Конструирование тестов и нерешенные вопросы теории. Успешная реализация парадигмы взаимодействия во многих случаях затрудняется нерешенностью некоторых вопросов общепсихологического плана. Так, до сих пор мы располагаем весьма ограниченными данными относительно того, как соотносятся и взаимодействуют друг с другом в формировании нейрофизиологического субстрата два фактора: с одной стороны, то, что является общим достоянием всех людей как представителей одного и того же биологического вида, и, с другой стороны, то, что привносится в эту сферу индивидуальным опытом. Этот кардинальный для психодиагностики вопрос обычно конкретизируется следующей, пока еще не решенной, дилеммой: сводятся ли межиндивидуальные различия в психической сфере только к сугубо количественным различиям или же, наряду с такими различиями, имеют место и различия качественного характера, в том смысле, что у одних индивидов отдельные психические свойства начисто отсутствуют, тогда как у других эти свойства развиты в более или менее значительной степени? Сложность этого вопроса во многом усугубляется возрастной изменчивостью психических свойств, в том числе процессами их структурной дифференциации и интеграции.

В последние годы высказывается мнение о том, что «не может

быть диагностических систем, одинаковых для разных возрастных периодов» [21; 66]. Это мнение представляется весьма интересным, хотя и несколько односторонним. Наряду с тестами, приуроченными к определенным возрастным периодам, целесообразно, на наш взгляд, создавать и «сквозные», «продольные» методики, рассчитанные на более длительные возрастные интервалы. Это важно потому, во-первых, что границы отдельных периодов онтогенеза характеризуются значительной вариативностью относительно всей популяции, а во-вторых, каждый из таких периодов подготавливается предшествующим развитием индивида.

Много неясного пока и в вопросе об измерительных параметрах психических свойств. Возьмем для примера отношение параметра скорости к понятиям «интеллект», «уровень умственного развития» и т. д. Если в представлениях Ф. Гальтона этот параметр играл первостепенную роль, то А. Бине совершенно не придавал ему значения. Ч. Спирмен считал, что открытый им «генеральный фактор» должен измеряться как по параметру «хорошего качества работы», так и по параметру ее скорости. И в современной литературе отсутствуют какие-либо определенные суждения относительно того, какой должна быть, например, оценка, с одной стороны, ошибочного ответа и, с другой стороны, отсутствия всякого ответа. Как соотносятся друг с другом «фактор скорости» и «фактор качества»?

Сложность данного вопроса обусловлена множественным характером детерминации, которую имеет параметр скорости. Так, исследования, проведенные в лаборатории психодиагностики НИИ психологии УССР, показали, в частности, что скорость выполнения интеллектуальных заданий определяется, по крайней мере, четырьмя основными факторами: 1) наличием у испытуемого стремления выполнить задание как можно быстрее; 2) скоростью протекания его нервно-психических процессов; 3) количеством допускаемых ошибок (этот фактор, в свою очередь, обусловливается многими причинами, в том числе уровнем внимательности субъекта) и 4) степенью самообладания, проявляемого при осознании возникших трудностей, исправлении допущенных ошибок и т. п. В обычных, «жизненных» условиях указанные факторы неразделимо слиты в своих следствиях, но диагностика во многих случаях должна основываться на их «разведении». Осуществить это можно, по нашему мнению, лишь в тестовых ситуациях, применяя различные аналитико-синтетические приемы и процедуры.

О специфицировании используемых понятий и терминов. Напомним: содержательная валидность теста непосредственно связана с терминологическим определением его предмета; одним лишь изменением формулировки последнего можно повысить или, наоборот, снизить качество теста по данному критерию [6]5. В свете этого обстоятельства становится очевидной та исключительная роль, которая принадлежит корректному употреблению релевантных терминов в создании высоковалидных тестов. Между тем мы весьма далеки от такого идеала.

К каким последствиям для научной коммуникации это приводит, можно видеть на примере употребления терминов «интеллект», «тесты интеллекта». Так, в одной из недавних публикаций [13] много внимания уделяется доказательству того, что операции, которые составляют содержание созданных на Западе интеллектуальных тестов, являются продуктом определенной культуры. Отсюда вывод: тесты интеллекта не обладают содержательной валидностью. Однако такой вывод может быть правомерным лишь при условии, если бы авторы современных интеллектуальных

тестов отрицали культурное происхождение умственных операций. Между тем в настоящее время на этот счет не высказывается каких-либо сомнений. Наоборот, подавляющее большинство современных тестологов сходится на том, что интеллект следует понимать как степень усвоения индивидом умственных операций, выработанных в данной культуре. Более того, главный источник достоинств интеллектуального теста (в частности, его прогностической валидности) усматривают именно в том, что умственные операции, составляющие его содержание, входят неотъемлемой частью в культурный фонд данной нации. В противном случае тест был бы лишен какой бы то ни было практической ценности [30]6.

Подлинный предмет дискуссии, связанной с содержательной валидностью интеллектуальных тестов, заключается в ином: что стоит за индивидуальными различиями в степени усвоения фонда умственных операций, выработанных в данной культуре (и так или иначе представленных в тестах) — главным образом факторы биологической наследственности, врожденной одаренности или же, наряду и во взаимодействии с ними, условия обучения и воспитания, которые в разных семьях и в разных школах с необходимостью оказываются более или менее разными? И этому посвящен ряд наших публикаций [7], [8], [10]. Сейчас же важно подчеркнуть другое: неспецифицированное употребление многозначных терминов уводит исследователя в сторону от существа проблемы, вносит путаницу в дискуссию, т. е. фактически порождает условия, отнюдь не благоприятствующие созданию валидных тестов.

1. Асмус В. Ф. Логика. — М., 1947. — 388 с.

2. Еланский П. П. Проблема ума и его измерения. — В кн.: Тесты. (Теория и практика). Сб. 2. — М., 1928, с. 11—26.

3. Брушлинский А. В. Основные проблемы и перспективы математизации психологии мышления. — Вопросы психологии, 1975, № 1, с. 3—11.

4. Геллерштейн С. Г. Метод тестов и его теоретические предпосылки. — В кн.: Тесты. (Теория и практика). Сб. 1. — М., 1928, с. 5—14.

5. Гилфорд Дж. Три стороны интеллекта. — В кн.: Психология мышления. — М., 1965, с. 433—456.

6. Гильбух Ю. З. Актуальные вопросы валидации психологических тестов. — Вопросы психологии, 1978, № 5, с. 108—118.

7. Гильбух Ю. З. Буржуазные биологизаторские концепции развития умственных способностей: апологетика и критика. — Советская педагогика, 1976, №2, с. 88—99.

8. Гильбух Ю. З. Интеллектуальное тестирование на Западе: итоги и проблемы. — Советская педагогика, 1980, № 2, с. 128—136.

9. Гильбух Ю. З. Надежность психологического теста и пути ее повышения. — Вопросы психологии, 1979, N° 3, с. 96—105.

10. Гильбух Ю. З. Психолого-педагогические приложения культурной антропологии в США. — Советская педагогика, 1970, № 6, с. 128—138.

11. Гильбух Ю. З., Удодова Л. П. Аппаратурный тест для диагностики оперативной памяти. — В кн.: Задачи и методы профессиональной психодиагностики / Под ред. В. И. Войтко и Ю. З. Гильбуха. Киев, 1981, с. 121 — 133.

12. Гильбух Ю. З., Удодова Л. П. Тест оперативной памяти. — Вопросы психологии, 1980, № 6, с. 116—121.

13. Гуревич К. М. Тесты интеллекта и индивидуальные культурно-психологические особенности испытуемых. — В кн.: Психодиагностика и школа. Тезисы симпозиума. Таллин, 1980, с. 19—25.

14. Диагностика умственного развития дошкольников / Под ред. Л. А. Венгер и В. В. Холмовской. — М., 1978. — 248 с.

15. Коган В. М. О психологическом анализе тестов. — В кн.: Институт конкретных социальных исследований АН СССР. Информационный бюллетень. № 3 (18).

16. Можно ли измерить интеллект? — Литературная газета, 1976, 12 нояб.

17. Проблема диагностики умственного развития учащихся / Под ред. З. И. Калмыковой. — М, 1975. — 208 с.

18. Рубинштейн С. Л. Бытие и сознание. — М., 1957. — 328 с.

19. Рубинштейн С. Л. Принципы и пути развития психологии. — М., 1959. — 355 с.

20. Слободчиков В. И. Принцип целостности в психологической диагностике. — В кн.: Психодиагностика и школа. Тезисы симпозиума. Таллин, 1980, с. 168—170.

21. Эльконин Д. Б. Психолого-педагогическая диагностика: проблемы и задачи.— В кн.: Психодиагностика и школа. Тезисы симпозиума. Таллин, 1980, с. 60—68.

21а. Якиманская И. С. Развитие пространственного мышления школьников. — М., 1980. — 240 с.

22. Ярошевский М. Г. Психология в XX столетии. — М., 1971. — 368 с.

23. Anastasi A., Psychology, psychologist and psychological testing. — Amer. Psychol., 1968, N 4, p. 297—306.

24. Cronbach L. J. Essentials of psychological testing. N. Y., 1970. 745 p.

25. Edwards A. J. Individual mental testing. Part 1. History and Theories. Scranton, 1971. 210 p.

26. Fleishman E. A. On the relation between abilities, learning and human performance. — Amer. Psychol., 1972, 11, p. 1017—1032.

27. Fogelman K. R. Piagetian tests for the primary schools. Windsor, 1973. 284 p.

28. Gulliksen H. Theory of mental tests. N. Y., 1950. 492 p.

29. Lörd F. M. Statistical theories of mental tests Scares. — Reading, Mass., 1968. 559 p.

30. Mental tests and cultural adaptation/Ed. by Cronbach L. J. and Drenth P. J. Mounton, 1972.

31. Terman L. M. The measurement of intelligence. — Boston, 1916. 174 p.

32. Vernon Rh. E. The structure of Human abilities. — L., 1961. 208 p.

1 Имеются в виду тесты, нашедшие применение в широкой практике.

2 В качестве примеров можно указать на создание ряда проективных тестов (Роршах, ТАТ и некоторые другие). Новейшей иллюстрацией может служить упомянутая выше «пиажезация» ментиметрии.

3 Предметом аналитического теста могут быть также отдельные «параметры» психического развития или умственной деятельности, например сформированность внутреннего плана действия, устойчивость оперативной памяти, когнитивный стиль и т.п.

4 Возможность таких модификаций с самого начала предусматривается конструкцией соответствующего аппарата, стимульного буклета и т. д.

5 Разумеется, за всяким подобным переформулированием должны стоять соответствующие изменения в понимании психологического содержания разрабатываемого теста, но с внешней стороны это выглядит именно так.

6 При таком понимании сущности интеллекта становится очевидным, что в психодиагностических целях интеллектуальный тест может применяться лишь к лицам, принадлежащим к одной и той же культуре, — той, в которой создана данная методика; применение интеллектуальных тестов в разных культурах правомерно лишь в рамках так называемого сравнительного метода, используемого в культурно-антропологических исследованиях [10].