Психологическая диагностика - Учебное пособие (К.М. Гуревича)

Глава xiv простейшие методы

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАТЕРИАЛОВ ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

Статистические методы применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех ко­личественных данных, которые получены в экспериментах, при оп­росе и наблюдениях, возможно больше полезной информации. В ча­стности, в обработке данных, получаемых при испытаниях по пси­хологической диагностике, это будет информация об индивидуаль­но-психологических особенностях испытуемых. Вообще психологи­ческие исследования обычно строятся с опорой на количественные данные. Вот пример.

К школьному психологу обратился шестиклассник Саня Ю. с прось­бой испытать его двигательный темп. Саню очень интересовал бас­кетбол, и он собирался вступить в баскетбольную команду, а бас­кетболист, несомненно, должен иметь высокий двигательный темп. Психолог разработал план небольшого исследования. Он начал с того, что попросил Саню так быстро, как он только может, ставить точки в центре кружков, нарисованных на листке бумаги. За одну минуту Саня поставил 137 точек. Насколько этот темп характерен для Сани? Чтобы установить это, психолог попросил Саню повто­рить эту пробу 25 раз. Действительно, некоторые результаты пре­вышали первоначально полученное число, но некоторые оказались и поменьше. Психолог просуммировал все полученные за 25 проб ре­зультаты, а сумму разделил на 25 — таким путем он получил сред­нее арифметическое по всем пробам. Это среднее арифметическое составило 141. Таков по этой пробе максимальный темп Сани. Можно ли считать этот темп высоким? Потребовался еще один шаг в исследовании. Психолог сформировал группу из 50 шестиклассни­ков, не отличающихся ни от Сани, ни друг от друга по возрасту бо­лее чем на полгода. С этими ребятами психолог также провел сна­чала по несколько тренировочных проб, чтобы получить надежные данные об их темпе, и, наконец, последнюю пробу, для обработки.

232

Все эти экспериментальные данные в виде средних арифметиче­ских были построены в один порядковый ряд, который был разбит по десяткам (по децклям). Санины данные вышли в десятку с наи­более быстрыми результатами. По этим количественным данным психолог сделал вывод о том, что Саня обладает сравнительно вы­соким двигательным темпом, о чем и было ему сообщено.

Современная математическая статистика представляет собой большую и сложную систему знаний. Нельзя рассчитывать на то, что каждый психолог, сделавший диагностику своей специально­стью, овладеет этими знаниями. Между тем статистика нужна пси­хологу постоянно в его повседневной работе. Специалисты-статис­тики разработали целый комплекс простых методов, которые со­вершенно доступны любому человеку, не забывшему то, что он вы­учил еще в средней школе.

В зависимости от требований, которые предъявляют к статистике различные области науки и практики, создаются пособия по геоло­гической, медицинской, биологической, психологической статисти­ке. (См., например: Суходольский Г.В. Основы математической ста­тистики для психологов. Л., 1972). В этой главе даются простейшие методы статистики для психологов. Все необходимые для их приме­нения вычисления можно выполнять на ручном компьютере, а то и на простых счетах. Уместное, грамотное применение этих методов позволит практику и исследователю, проведя начальную обработку, получить общую картину того, что дают количественные результаты его исследований, оперативно проконтролировать ход исследований. В дальнейшем, если возникнет такая необходимость, материалы ис­следований могут быть переданы для более глубокой разработки специалисту-статистику на большой компьютер.

Статистические шкалы. Применение тех или других статисти­ческих методов определяется тем, к какой статистической шкале относится полученный материал. С. Стивене предложил различать четыре статистические шкалы: шкалу наименований (или номина­тивную), шкалу порядка, шкалу интервалов и шкалу отношений.

Зная типические особенности каждой шкалы, нетрудно устано­вить, к какой из шкал следует отнести подлежащий статистической обработке материал.

Шкала наименований. К этой шкале относятся материалы, в которых изучаемые объекты отличаются друг от друга по их каче­ству. При обработке таких материалов нет никакой нужды в том, чтобы располагать эти объекты в каком-то порядке, исходя из их характеристик. В принципе объекты можно располагать в любой последовательности. Вот пример: изучается состав международной научной конференции. Среди участников есть французы, англичане,

233

Рис. 1. РАСПРЕДЕЛЕНИЕ УЧАСТНИКОВ МЕЖДУНАРОДНОЙ КОНФЕРЕНЦИИ:

1 — русские; 2 — датчане; 3 — англичане;

4 — французы; 5 — немцы

датчане, немцы и русские (рис. 1). Имеет ли значение порядок, в котором будут расположены    участники при изучении состава кон­ференции? Можно распо­ложить их по алфавиту, это удобно, но ясно, что ника­кого принципиального зна­чения в этом расположении нет. При переводе этих ма­териалов на другой язык (а значит, и на другой алфа­вит) этот порядок будет нарушен. Можно располо­

 

жить национальные группы по числу участников. Но при сравнении этого материала с материалом другой конференции найдем, что вряд ли этот порядок окажется таким же. Отнесенные к шкале на­именований объекты можно размещать в любой последовательности в зависимости от цели исследования.

При статистической обработке такого рода материалов нужно считаться с тем, каким числом единиц представлен каждый объект. Имеются весьма эффективные статистические методы, позволяю­щие по этим числовым данным прийти к научно значимым выводам (например, метод хи-квадрат).

Шкала порядка. Если в шкале наименований порядок следова­ния изучаемых объектов практически не играет никакой роли, то в шкале порядка — это видно из ее названия — именно на эту по­следовательность переключается все внимание. К этой шкале в ста­тистике относят такие исследовательские материалы, в которых рассмотрению подлежат объекты, принадлежащие к одному или не­скольким классам, но отличающиеся при сравнении одного с другим:

больше—меньше, выше—ниже и т.п.

Проще всего показать типические особенности шкалы порядка, если ^обратиться к публикуемым итогам любых спортивных соревно­ваний. В этих итогах последовательно перечисляются участники, занявшие соответственно первое, второе, третье и прочие по поряд­ку места. Но в информации об итогах соревнований нередко отсут­ствуют или отходят на второй план сведения о фактических дости­жениях спортсменов, а на первый план ставятся их порядковые места. Допустим, шахматист Д. занял в соревнованиях первое ме­сто. Каковы же его достижения? Оказывается, он набрал 12 очков. Шахматист Е. занял второе место. Его достижение — 10 очков.

234

Третье место занял Ж. с 8 очками, четвертое — 3. с б очками и т.д. В сообщениях о соревновании разница в достижениях при разме­щении шахматистов отходит на второй план, а на первом остаются их порядковые места. В там, что именно порядковому месту отво­дится главное значение, есть свой смысл. В самом деле, в нашем примере 3. набрал 6, а Д. — 12 очков. Это абсолютные их дости­жения — выигранные ими партии. Если попытаться истолковать эту разницу в достижениях чисто арифметически, то пришлось бы признать, что 3. играет вдвое хуже, чем Д. Но с этим нельзя согла­ситься. Обстоятельства соревнований не всегда просты, как не все­гда просто и то, как провел их тот или другой участник. Поэтому, воздерживаясь от арифметической абсолютизации, ограничиваются тем, что устанавливают: шахматист 3. отстает от занявшего первое место Д. на три порядковых места.

Заметим, что в других соревнованиях расклад абсолютных дос­тижений может быть иным: занявший первое место может всего на пол-очка опережать ближайших участников. Важно, что он набрал наибольшее количество очков. Только от этого зависит его порядко­вое место.

Шкала интервалов. К ней относятся такие материалы, в которых дана количественная оценка изучаемого объекта в фиксированных еди­ницах. Вернемся к опытам, которые провел психолог с Саней. В опытах учитывалось, сколько точек может поставить, работая с максимально доступной ему скоростью, сам Саня и каждый из его сверстников. Оценочными единицами в опытах служило число точек. Подсчитав их, исследователь получил то абсолютное число точек, которое оказалось возможным поставить за отведенное время каждому участнику опытов. Главная трудность при отнесении материалов к шкале интервалов со­стоит в том, что нужно располагать такой единицей, которая была бы при всех повторных измерениях тождественной самой себе, т.е. одина­ковой и неизменной. В примере с шахматистами (шкала порядка) такой единицы вообще не существует.

В самом деле, учитывается число партий, выигранных каждым участником соревнований. Но ясно, что партии далеко не одинако­вы. Возможно, что участник соревнований, занявший четвертое ме­сто — он выиграл шесть партий, — выиграл труднейшую партию у самого лидера! Но в окончательных итогах как бы принимается, что все выигранные партии одинаковы. В действительности же этого нет. Поэтому при работе с подобными материалами уместно их оценивать в соответствии с требованиями шкалы порядка, а не шкалы интервалов. Материалы, соответствующие шкале интерва­лов, должны иметь единицу измерения.

Шкала отношений. К этой шкале относятся материалы, в ко­торых учитываются не только число фиксированных единиц, как в

235

шкале интервалов, но и отношения полученных суммарных итогов между собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютную точку, от которой и ведется отсчет. При изуче­нии психологических объектов эта шкала практически неприменима.

О параметрических и непараметрических методах стати­стики. Приступая к статистической обработке своих исследований, психолог должен решить, какие методы ему более подходят по осо­бенностям его материала — параметрические или непараметриче­ские. Различие между ними легко понять. Вспомним, что говори­лось об измерении двигательной скорости шестиклассников. Как обработать эти данные? Нужно записать все произведенные изме­рения — в данном случае это будет число точек, поставленных ка­ждым испытуемым, — затем требуется вычислить для каждого ис­пытуемого среднее арифметическое по результатам опытов. Далее следует расположить все эти данные в их последовательности, на­пример, начиная с наименьших к наибольшим. Для облегчения обо­зримости этих данных их обычно объединяют в группы; в этом слу­чае можно объединить по 5—9 измерений в группе. Вообще же при таком объединении желательно, если общее число случаев не более ста, чтобы общее число групп было порядка двенадцати. Получи­лась такая таблица (с. 249).

Далее нужно установить, сколько раз в опытах встретились чи­словые значения, соответствующие каждой группе. Сделав это, нужно для каждой группы записать ее численность. Полученные в такой таблице данные носят название распределения численностей. Рекомендуется представить это распределение в виде диаграммы — полигона распределения. Контуры этого полигона помогут решить вопрос о статистических методах обработки. Нередко они напоми­нают контуры колокола, с наивысшей точкой в центре полигона и с симметричными ветвями, отходящими в ту и другую сторону. Такой контур соответствует кривой нормального распределения. Это поня­тие было введено в математическую статистику К.Ф. Гауссом (1777—1855), поэтому кривую именуют также кривой Гаусса. Он же дал математическое описание этой кривой. Для построения кри­вой Гаусса (или кривой нормального распределения) теоретически требуется очень большое количество случаев. Практически же при­ходится довольствоваться тем фактическим материалом, который накоплен в исследовании. Если данные, которыми располагает ис­следователь, при их внимательном рассмотрении или после перено­са их на диаграмму, лишь в незначительной степени расходятся с кривой нормального распределения, то это дает право исследовате­лю применять в статистической обработке параметрические методы,

236

исходные положения которых основываются на нормальной' крявой распределения Гаусса. Нормальное распределение называют пара­метрическим потому, что для построения и анализа кривой Гаусса достаточно иметь всего два параметра: среднее арифметическое, значение которого должно соответствовать высоте перпендикуляра, восстановленного в центре кривой, и так называемое среднее квад-ратическое, или стандартное, отклонение — величины, характери­зующей размах колебаний данной кривой, о способах вычисления той и другой величины будет далее рассказано.

Параметрические методы обладают для исследователя многими преимуществами, но нельзя забывать о том, что применение их правомерно только тогда, когда обрабатываемые данные показывают распределение, лишь несущественно отличающееся от гауссова.

При невозможности применить параметрические методы, надлежит обратиться к непараметрическим. Эти методы успешно разрабаты­вались в последние 3—4 десятилетия, и их разработка была вызва­на прежде всего потребностями ряда наук, в частности, психологии. Они показали свою высокую эффективность. Вместе с тем они не требуют сложной вычислительной работы.

Современному психологу-исследователю нужно исходить из того, что «существует большое количество данных либо вообще не под­дающихся анализу с помощью кривой нормального распределения, либо не удовлетворяющих основным предпосылкам, необходимым для ее использования» (Рунион Р. Справочник по непараметриче­ской статистике. М., 1982. С. 11.).

Генеральная совокупность и выборка. Психологу постоянно придется иметь дело с этими двумя понятиями. Генеральная сово­купность, или просто совокупность, — это множество, все элемен­ты которого обладают какими-то общими признаками. Так, все под­ростки-шестиклассники 12 лет (от 11,5 до 12,5) образуют совокуп­ность. Дети того же возраста, но не обучающиеся в школе, или же обучающиеся, но не в шестых классах, не подлежат включению в эту совокупность.

В ходе конкретизации проблем своего исследования психологу неизбежно придется обозначить границы изучаемой им совокупно­сти. Следует ли включать в изучаемую совокупность детей того же возраста, но обучающихся в колледжах, гимназиях, лицеях и других подобных учебных заведениях? В ответе на этот и на другие такие же вопросы может помочь статистика.

' О математически обоснованных способах определения того, можно ли считать данное распределение нормальным, см., например, в кн.: Урбах В.Ю. Математиче­ская статистика для биологов и медиков. М., 1963. С. 66.

237

В подавляющем большинстве случаев исследователь не в состоя­нии охватить в изучении всю совокупность. Приходится, хотя это и связано с некоторой утратой информации, взять для изучения лишь часть совокупности, ее и называют выборкой. Задача исследователя заключается в том, чтобы подобрать такую выборку, которая репре­зентировала бы, представляла совокупность; другими словами, при­знаки элементов совокупности должны быть представлены в выбор­ке. Составить такую выборку, в точности повторяющую все разно­образные сочетания признаков, которые имеются в элементах сово­купности, вряд ли возможно. Поэтому некоторые потери в инфор­мации оказываются неизбежными. Важно, чтобы в выборке были сохранены существенные, с точки зрения данного исследования, признаки совокупности. Возможны случаи, и для их обнаружения есть статистические методы, когда задачи исследования требуют создания двух выборок одной совокупности; при этом нужно уста­новить, не взяты ли выборки из разных совокупностей. Эти и дру­гие подобные казусы нужно иметь в виду психологу при обработке результатов выборочных исследований.

Следует рассмотреть типы задач, с которыми чаще всего имеет дело психолог. Соответственно приводятся и статистиче­ские методы, которые приложимы для обработки психологических материалов, направленных на решение этих задач.

Первый тип задач. Психологу нужно дать сжатую и достаточ­но информативную характеристику психологических особенностей какой-то выборки, например, школьников определенного класса. Чтобы подойти к решению этой задачи, необходимо располагать ре­зультатами диагностических испытаний; эти испытания, разумеется, следует заранее спланировать так, чтобы они давали информацию о тех особенностях группы, которые в этом конкретном случае инте­ресуют психолога. Это могут быть особенности умственного разви­тия, психофизиологические особенности, данные об изменении ра­ботоспособности и т.д.

Получив все экспериментальные результаты и материалы наблю­дений, следует подумать о том, как их подать пользователю в ком­пактном виде, чтобы при этом свести к минимуму потерю информа­ции. В перечне статистических методов, используемых при решении подобных задач, обычно находят свое место и параметрические и непараметрические методы, о возможностях применения тех и дру­гих, как было сказано выше, судят по полученному материалу. Об этих статистических методах и их использовании пойдет речь ниже.

Второй тип задач. Это, пожалуй, наиболее часто встречающие­ся задачи в исследовательской и практической деятельности психо-

238

лога: сравниваются между собой несколько выборок, чтобы установить, являются ли выборки независимыми или принадлежат одной и тон же совокупности. Так, проведя эксперименты в восьмых классах двух раз­личных школ, психолог сравнивает эти выборки между собой.

К этому же типу относятся задачи с определением тесноты связи двух рядов показателей, полученных на одной и той же выборке; в такой обработке чаще всего применяют метод корреляции.

Третий тип задач — это задачи, в которых обработке подлежат временные ряды, в них расположены показатели, пленяющиеся во времени; их называют также динамическими рядами. В предшест­вующих типах задач фактор времени не принимался во внимание и ма­териал анализировался так, как будто он весь поступил в руки иссле­дователя в одно и то же время. Такое допущение можно оправдать тем, что за тот короткий период времени, который был затрачен на собира­ние материала, он не потерпел существенных изменений. Но психологу приходится работать и с таким материалом, в котором наибольший ин­терес представляют как раз его изменения во времени. Допустим, пси­холог намерен изучить изменение работоспособности школьников в те­чение учебной четверти. В этом случае информативными будут показа­тели, по которым можно судить о динамике работоспособности. Берясь за такой материал, психолог должен понимать, что при анализе дина­мических рядов нет смысла пользоваться средним арифметическим ря­да, так как оно замаскирует нужную информацию о динамике.

В предыдущих главах упоминалось о лонгитюдинальном исследо­вании, т.е. таком, в котором однообразный по содержанию психоло­гический материал по одной выборке собирается в течение дли­тельного времени. Показатели лонгитюда — это также динамиче­ские ряды, и при их обработке следует пользоваться методами, предназначенными для таких рядов.

Четвертый тип задач — задачи, возникающие перед психоло­гом, занимающимся конструированием диагностических методик, проверкой и обработкой результатов их применения- Отчасти об этих задачах уже говорилось в других главах, но не уделялось вни­мания специально статистике. Психологическая диагностика, в осо­бенности тестология, имеет целый ряд канонических правил, при­менение которых должно обеспечивать высокое качество информа­ции, получаемой посредством диагностических методик. Так, мето­дика должна быть надежной, гомогенной, валидной. По упрочив­шимся в тестологии правилам, все эти свойства проверяются стати­стическими методами.

Здесь уместно высказать некоторые соображения о возможностях статистики в проведении психологического исследования.

239

Статистика как таковая не создает новой научной информации. Эта информация либо содержится, либо не содержится (к сожале­нию, и так бывает) в полученных исследователем материалах. На­значение статистики состоит в том, чтобы извлечь из этих материа­лов больше полезной информации. Вместе с тем статистика показы­вает, что эта информация не случайна и что добытые данные имеют определенную и значимую вероятность.

Статистические методы раскрывают связи между изучаемыми явле­ниями. Однако необходимо твердо знать, что как бы ни была высока вероятность таких связей, они не дают права исследователю признать их причинно-следственными отношениями. Статистика, как о ней пи­шут известные английские ученые Д.Э. Юл и М.Дж. Кендэл (Теория статистики. М., 1960. С. 18—19.), «вынуждена принимать к анали­зу данные, подверженные влиянию множества причин». Статистика, например, утверждает, что существует значимая связь между дви­гательной скоростью и игрой в теннис. Но отсюда еще не вытекает, будто двигательная скорость и есть причина успешной игры. Нель­зя, по крайней мере в некоторых случаях, исключить и того, что сама двигательная скорость явилась следствием успешной игры.

Чтобы подтвердить или отвергнуть существование причинно-следственных отношений, исследователю зачастую приходится про­думывать целые серии экспериментов. Если они будут правильно построены и проведены, то статистика поможет извлечь из резуль­татов этих экспериментов информацию, которая необходима иссле­дователю, чтобы либо обосновать и подтвердить свою гипотезу, ли­бо признать ее недоказанной.

Вот что нужно знать при использовании статистики. Итак, были перечислены типы задач, с которыми чаще всего встречаются психологи. Теперь перейдем к изложе­нию конкретных статистических методов, которые способ­ствуют успешному решению перечисленных задач.

Первый тип задач. Статистические методы, примеры их при­менения для принятия решения.

Допустим, школьному психологу нужно представить краткую ин­формацию о развитии психомоторных функций учащихся 6-х классов, в которых обучается 50 учеников. В процессе выполнения своей про­граммы психолог провел диагностическое изучение двигательной ско­рости, применив методику, которая была описана выше (С. 240).

Для реализации своей программы психологу надлежало получить количественные характеристики, свидетельствующие о состоянии изучаемой функции — ее центральной тенденции, величины, пока­зывающей размах колебаний, в пределах которого находятся все данные отдельных учеников, и то, как распределяются эти данные.

240

Какими методами вести обработку — параметрическими или непара­метрическими? Визуальное ознакомление с полученными данными по­казывает, что возможно применение параметрического метода, т.е. бу­дут вычислены среднее арифметическое, выражающее центральную тенденцию, и среднее квадратическое отклонение, показывающее раз­мах и особенности варьирования экспериментальных результатов.

Нельзя ограничиться вычислением только среднего арифметиче­ского, так как оно не дает полных сведений об изучаемой выборке. Вот пример. В одном купе вагона поместилась бабушка 60 лет с: че­тырьмя внуками: 4 лет, двое по 5 и 6 лет. Среднее арифметическое возраста всех пассажиров этого купе 80/5 = 16.

В другом, купе расположилась компания молодежи: двое 15-летних, 16-летний и двое 17-летних. Средний возраст пассажиров этого купе также равен 16. Таким образом, по средним арифмети­ческим пассажиры этих купе как бы и не различаются. Но если об­ратиться к особенностям варьирования, то сразу можно установить, что в одном купе возраст пассажиров варьирует в пределах 56 еди­ниц, а во втором — в пределах 2.

Для вычисления среднего арифметического применяется формула:

_ _ Ъх.

п а для среднего квадратического отклонения формула:

сг =

В этих формулах х означает среднее арифметическое, х — каж­дую величину изучаемого ряда, S — сумму; сг — среднее квадрати­ческое отклонение; п — число членов изучаемого ряда.

Вернемся к опыту с проверкой двигательной скорости учащихся (С. 244).

В опытах участвовали 50 испытуемых. Каждый из них выполнил по 25 проб, по 1 минуте каждая. Вычислена средняя каждого испы­туемого. Полученный ряд упорядочен и все индивидуальные резуль­таты представлены в последовательности от меньшего к большему:

85— 93— 93— 99— 101—105—109—110—111—115— 115— 116— 116— 117— 117— 117— 118— 119— 121 — 121 — 122 — 124 — 124 — 124 — 124 — 125 — 125 — 125 — 127 — 127 — 127 — 127 — 127 — 128 — 130 — 131 — 132 — 132 — 133 — 134 — 134 — 135 — 138 — 138 — 140 — 143 — 144 — 146 — 150 — 158

Для дальнейшей обработки удобнее эти первичные данные со­единить в группы, тогда отчетливее выступает присущее данному ряду распределение величин и их численностей. Отчасти упрощает-

241

ся и вычисление среднего арифметического и среднего квадратиче-ского отклонения. Этим искупается несущественное искажение информации, неизбежное при вычислениях на сгруппированных данных.

При выборе группового интервала следует принять во внимание такие соображения. Если ряд не очень велик, например содержит до 100 элементов, то и число групп не должно быть очень велико, например порядка 10—12. Желательно, чтобы при группировании начальная величина — при соблюдении последовательности от меньшей величины к большей — была меньше самой меньшей ве­личины ряда, а самая большая — больше самой большой величины изучаемого ряда. Если ряд, как в данном случае, начинается с 85, группирование нужно начать с меньшей величины, а поскольку ряд за­вершается числом 158, то и группирование должно завершаться большей величиной. В ряду, который нами изучается, с учетом высказанных со­ображений можно выбрать групповой интервал в 9 единиц и произвести разбиение ряда на группы, начав с 83. Тогда последняя группа будет за­вершаться величиной, превышающей значение последней величины ряда (т.е. 158). Число групп будет равно 9 (табл. 1).

Вычисление среднего арифметического и среднего квадратическо-го отклонения.

Таблица   1

Группы

Средние значе­ния

Резуль­тат раз­носки

Итоги разнос­ки

f-^

X — X

(1с -

х)2

Л/

/•(? -

Jt)2

83—91 92—100 101—109 110—118 119—127 128—136 137—145 146—154 155—163

87 96 105 114 123 132 141 150

1 ^0

i Ои

/

u u

QQ (ЗИИ/

an

3 L /

1 3 3 10 16 9 5 2 1

87 288 315 1140 1968 1188 705 300

1 c.q

1 0:7

36 27 18 9 0 9 18 27 36

1296 729 324 81 0 81 324 729 1296

-л-/

1296 2187 972 810 0 729 1620 1458 1296

Л £i'3J

 

 

 

 

n = 50

•Lf-x= =6150

 

 

 

 

•Lf-(x --х^= = 10368

 

группы, полученные после разбиения изучаемого

1-й столбец — ряда.

2-й столбец — средние значения каждой группы; этот столбец показывает, в каком диапазоне варьируют величины изучаемого ря­да, т.е. х.

242

3-й столбец показывает результаты «ручной» разноски величин ряда или иксов: каждая величина занесена в соответствующую ее значению группу в виде черточки.

4-й столбец — это итог подсчета результатов разноски.

5-й столбец показывает, сколько раз встречалась каждая величи­на ряда — это произведение величин второго столбца на величины 4-го столбца по строчкам. Итоги 4-го и 5-го столбцов дают суммы, необходимые для вычисления среднего арифметического.

6-й столбец показывает разность среднего арифметического и значения х" по каждой группе.

7-й столбец — квадрат этих разностей.

8-й столбец показывает, сколько раз встречался каждый квадрат разности; суммирование величин этого столбца дает итог, необхо­димый для вычисления среднего квадратического отклонения.

В заголовках 5-го и 8-го столбцов указывается, насколько часто встречается та или другая величина. Частота обозначается буквой / (от английского слова frequency).

Включение буквы /, означающей, насколько часто встречалась та или другая величина, ничего не изменяет в формулах среднего арифметического и среднего квадратического отклонения.

Поэтому формулы

х =

•Lx

Е/.х

 

<7=

16

Рис.2

вполне тождественны.

Остается показать, как вы­числяются по формулам сред­нее арифметическое и среднее квадратическое    отклонение. 12 Обратимся к величинам, полу­ченным в таблице:             8

Г = 6150 : 50 = 123.

При составлении таблицы это 4 число было заранее вычислено, без него нельзя было бы полу­чить числовые значения 6, 7, 8-го столбцов таблицы.     ___

о-= ^ 10368 : 50 = ^ 207,3 = 14.4.

243

При обработке изучаемого ряда оказалось возможным примене­ние параметрического метода, так как визуально в этом ряду рас­пределение численностей приближается к нормальному. Это под­тверждается и графиком (рис. 2, с. 251).

Нормальное распределение обладает некоторыми весьма полезными для исследователя свойствами. Так, в границах дГ ±ст находится при­мерно 68\% всего ряда или всей выборки, в границах х ±2ет — пример­но 95\%, а в границах ~х ±3сг — 97,7\% выборки. В практике иссле­дований часто берут границы — F ±2/3ст. В этих границах при нор­мальном распределении будут находиться 50\% выборки; распреде­ление это симметрично, поэтому 25\% окажутся ниже, а 25\% выше границ х' ±2/3ст. Все эти расчеты не требуют никакой дополни­тельной проверки при условии, что изучаемый ряд имеет нор­мальное распределение, а число элементов в нем велико, поряд­ка нескольких сотен или тысяч. Для рядов, которые распределе­ны нормально или имеют распределение, мало отличающееся от нормального, вычисляется коэффициент вариации по такой фор­муле:

у- 10^ . х

В примере, который был рассмотрен выше,

V= (100-14,4)/123 =11,7.

Выполнив все эти вычисления, психолог может представить инфор­мацию об изучении двигательной скорости с помощью примененной методики в 6-х классах. Согласно результатам изучения в 6-х классах получены: среднее арифметическое — 123; среднее квадратическое от­клонение — 14,4; коэффициент вариативности — 11,7.

Непараметрические методы. Ранжирование, медиана, квартиль. Далеко не все материалы, получаемые в психологиче­ских исследованиях, подлежат обработке параметрическими мето­дами. Если после ознакомления с изучаемым рядом исследователь убеждается в том, что этот ряд не имеет свойств нормального рас­пределения, ему остается перейти на методы непараметрической статистики. С их помощью могут быть получены и центральная тенденция изучаемого ряда — медиана — и величина, позволяющая судить о диапазоне варьирования и о строении изучаемого ряда — квартильное отклонение.

Вот пример. После диагностических испытаний уровня умствен­ного развития учеников 6-го класса полученные данные были упо­рядочены, т.е. расположены в последовательности от меньшей ве­личины к большей. Испытания проходили 18 учащихся (табл. 2).

244

Таблица 2

Учащиеся

Баллы

Ранги (и)

Учащиеся

Баллы

Ранги [Л)

А

25

1

К

68

10

Б

28

2

л

69

11.5

В

39

4

м

69

11.5

Г

39

4

н

70

14.5

Д

39

4

о

70

14.5

Е

45

6

п

70

14.5

Ж

50

7

р

70

14.5

3

52

8,5

с

74

17.5

И

52

8,5

т

74

17,5

 

Примечание. Буквами обозначены учащиеся, числами — [клученные ими баллы по тесту.

Процедура ранжирования состоит в следующем. Все числа ряда в их последовательности получают по своим, порядковым местам присваи­ваемые им ранги. Если какие-нибудь числа повторяются, то всем по­вторяющимся числам присваивается один и тот же ранг — средний из общей суммы занятых ими ранговых мест. Так, числу 28 в изучаемом ряду присвоен ранг 2. Затем следуют трижды повторяющиеся числа 39. На них приходятся занятые ими ранговые места 3, 4, 5. Поэтому этим числам присваивается один и тот же средний ранг, в дан­ном случае — 4. Поскольку места до 5-го включительно заняты, то следующее число получает ранг 6 и т.д.

При обработке ряда, не имеющего признаков нормального рас­пределения — непараметрического ряда, — для величины, которая выражала бы его центральную тенденцию, более всего пригодна ме­диана, т.е. величина, расположенная в середине ряда. Ее определя­ют по срединному рангу по формуле Mg = (n + 1)/2, где М^ — оз­начает медиану, п — как в ранее приводившихся формулах — число членов ряда. При нечетном числе членов ряда ранговая медиана — целое число, при нечетном число — с 0,5. Заметим, что числовое значение медианы может и не быть в составе самого обрабатывае­мого ряда.

Возьмем к примеру ряд в семь членов: 3—5—6—7—9—10—11. Проранжировав его, имеем: 1—2—3—4—5—6—7. Ранговая медиана в таком ряду равна: М^ = (7 + 1 )/2 = 4, этот ранг приходится на величину 7.

Возьмем ряд в восемь членов: 3—5—6—7—9—10—11—12. Проранжировав его, имеем: 1—2—3—4—5—б—7—8. Ранговая медиана в этом ряду равна: Afg = (8 + 1)/2 = 4,5. Этому рангу соответствует середина между двумя величинами, имеющими ранг 4 и ранг 5, т.е. между 7 и 9. Медиана этого ряда равна: ЛГе = (7 + 9)/2 = 8.

245

Следует обратить внимание на то, что величины 8 в составе ряда нет, но таково значение медианы этого ряда.

Вернемся к изучаемому ряду. Он состоит из 18 членов. Его ран­говая медиана равна: Му = (18 + 1)/2 = 9,5.

Она расположится между 9-й и 10-й величиной ряда. 9-я величи­на — 52, 10-я — 68. Медиана занимает срединное место между ними, следовательно, Afg = (52 + 68)/2 = 60.

По обе стороны от этой величины находится по 50\% величин ряда.

Характеристику распределения численностей в непараметриче­ском ряду можно получить из отношения его квартилей. Квартилью называется величина, отграничивающая 1/4 всех величин ряда. Квартиль первая — ее обозначение Qi — вычисляется по формуле:

О = д' + ^ч/2(лев.)

Это полусумма первого и последнего рангов первой — левой от медианы половины ряда;

квартиль третья, обозначаемая Qs, вычисляется по формуле:

Оз=

^n/2 + ^п/2(прав.)

 

т.е. как полусумма первого и последнего рангов второй, правой от ме­дианы, половины ряда. Берутся порядковые значения рангов по их по­следовательности в ряду. В обрабатываемом ряду Qi = (1+9)/2 = 5 Оз = (10 + 18)/2 = 14.

Рангу 5 в этом ряду соответствует величина 39, а рангу 14—70. Следовательно, в данном ряду Qi = 39, а <3з = 70.

Для характеристики распределения в непараметрическом ряду вычисляется среднее квартильное отклонение, обозначаемое Q. Формула для Q такова: Q = (Qs - Qi)/2. Для обрабатываемого ряда Q = (70 - 39)/2 = 15,5. Были рассмотрены статистическая обработка параметрического ряда Сх и от), статистическая обработка непараметрического ряда (Mg и Q). Параметрический ряд относится к шкале интервалов, не­параметрический — к шкале порядка. Но встречаются также ряды, относящиеся к шкале наименований. Наиболее краткая характери­стика такого ряда может быть получена с помощью моды, величи­ны, которая выражает наивысшее числовое значение величин дан­ного ряда, при п — числе членов ряда. Следует заметить, что моду можно лишь условно считать выражением центральной тенденции в ряду, относящемуся к шкале наименований. Она выражает наибо­лее типичную величину ряда.

246

Рассмотрим подробнее пример, приведенный выше (С. 242). Там речь шла об участниках некой конференции; в их числе были 3 англичанина, 2 датчанина, 5 немцев, 3 русских и 1 француз. Мода в данном ряду приходится на участников конференции — немцев. Число членов ряда равно — 13, а мода — Мд = 5

Итак, мы рассмотрели статистические методы, применяющиеся для задач первого типа.

Второй тип задач. Психологу в его повседневной практической и исследовательской работе приходится искать ответы на различные вопросы. Предположим, что проведены диагностические испытания умственного развития у школьников шестых классов городской и сельской школ: можно ли в дальнейшем рассматривать обе школь­ные выборки как принадлежащие одной совокупности? По поводу неодинаковых условий обучения в городской и сельской школах вы­сказано немало противоречивых суждений. Психолог а данном слу­чае намерен опираться на экспериментальные факты. Чтобы прийти к какому-то решению, целесообразно проанализировать полученный экспериментальный материал. Это достаточно часто встречающаяся задача, встречаются и такие, где приходится решать тот же вопрос относительно нескольких, а не двух выборок. Это и есть задачи второго типа.

Перед психологом два ряда численностей. Прежде всего нужно установить, на какие статистические методы опираться — на пара­метрические или непараметрические? Применять параметрические методы следует в том случае, если оба ряда имеют распределение, не отличающееся от нормального. Если же один из рядов не соот­ветствует этому требованию, то применение параметрических мето­дов противопоказано.

Положим, оба ряда показывают распределение, допускающее применение параметрических методов. Сравнение величин цен­тральных тенденций — в данном случае их представляют средние арифметические — не даст ответа на вопрос о том, относятся ли выборки к одной совокупности. Почти безошибочно можно утвер­ждать, что средние арифметические не будут тождественными, но этого явно недостаточно для ответа на поставленный вопрос, ответ не был бы получен, даже если бы средние арифметические оказа­лись равными. Для данного случая более всего подходит сравнение выборок по критерию t Стьюдента.

Перед тем как ознакомиться с техникой вычислений и интерпре­таций результатов, получаемых при работе с критерием t Стьюден­та, необходимо остановиться на некоторых статистических терми­нах; они постоянно встречаются в прикладной статистике.

В том разделе статистики, где заходит речь о проверке гипотез, постоянно приходится иметь дело с нуль-гипотезой, или нулевой

247

гипотезой. При сравнении двух выборок нуль-гипотеза формулиру­ется следующим образом: между изучаемыми выборками нет разли­чия или, иначе, различие между ними несущественно. Все даль­нейшие расчеты направлены на то, чтобы прийти к заключению верна ли нуль-гипотеза или от нее нужно отказаться, и в действи­тельности существенная разница между выборками имеется. В дру­гих случаях в зависимости от содержания материала меняются формулировки, но вычисления показывают, какова вероятность нуль-гипотезы. Для обозначения нуль-гипотезы используется символ hq.

Допустим, что разница между выборками имеется. Исследователь встает перед вопросом, насколько существенна эта разница, как часто будет обнаруживаться она в последующем, когда придется работать с подобными же выборками. Самые общие соображения при этом таковы: есл