Применение пакета статистических программ в психологических исследованиях - Учебное пособие (Беребин М.А.)

От автора

Определенной закономерности появления этого пособия предшествовало одновременное сочетание нескольких случайностей.

Автору в начале 90-х годов при написании диссертации понадобилась сложная математическая обработка результатов собственных исследований, включавших более 7 тысяч случаев наблюдений. Эти данные имели совершенно неоднородный клинический, психологический и статистический характер. В то же время познания автора в мире формул, методов математического анализа данных, увы, оставляли желать лучшего. И распространенные тогда калькуляторы (сначала с уже неизвестным молодому современнику светодиодным табло, а потом и портативные «малышки» с жидкокристаллическим дисплеем) не могли помочь решать такие сложные задачи. Лишь появление «чуда» в виде персональных микро-ЭВМ (именно так тогда представлялись нам «персоналки», Ай-Би-эМки, «пентюшки» и тому подобные привычные ныне достижения микроэлектроники) позволили надеяться на лучшее. Автор помнит благоговейный трепет перед внезапно открывшимися для него в 1992 году возможностями АТ-286 с жестким диском в целых 40 (!) мегабайт и оперативной памятью в 1 Мб (если ему не изменяет собственная и уже, увы, далеко не оперативная память). Работа на «встроенном» калькуляторе скоро заменилась первыми опытами общения со статистическими программами типа Super Calk, Lotus 1-2-3. Поражали возможности популярного тогда текстового редактора «W&D» («Слово и дело») производить вычисление любых простых статистик типа средней арифметической или возведение в квадрат непосредственно при работе в поле для ввода текста. Но не зря говорят, что аппетит приходит во время еды (работы). Вслед за героем популярного тогда мультфильма у автора возникло мнение: «Маловато будет!». И тогда появился статистический гений тех времен Его Величество «Пакет Статистических Программ STATGRAPHICS for DOS v.3.0», приобретенный нелегальным (чего уж там греха таить) способом. Открылись такие возможности добровольного погружения «в сладостный мир цифр, сводок, отчетов» (вспомните сюжет кинофильм Э. Рязанова «Служебный роман»)! И этот «служебный роман» автора с программами «Статграфикса» продолжается и до сей поры. И хотя уже давно умы и сердца advanced users (продвинутых пользователей, «юзающих» статистические пакеты) завоевывают такие «зубры», как Statistica, SAS, SYSTAT или SPSS, у автора сохраняются очень добрые чувства к старому, доброму, маленькому по нынешним меркам пакету STATGRAPHICS for DOS v.3.0, позволившему научиться понимать язык цифр и математики.

Второе открытие STATGRAPHICS произошло после того, как автор (волею судьбы и решением декана факультета психологии ЮУрГУ) стал преподавать дисциплину «Математические методы в психологии», наводящей почему-то ужас на студентов-психологов не только ЮУрГУ, но и других университетов. Автора всегда поражало, как быстро (в течение всего-то двух семестров), выветриваются из светлых голов студентов и, особенно, студенток, почти все основные познания высшей математики. Это недоумение увеличивается еще в связи с тем, что математика является профилирующим предметом на экзаменах при поступлении на психологический факультет. Это привело в преподавании предмета сначала к необходимости «перевести» строгие требования Государственного стандарта по дисциплине на язык, понятный даже для неопытной домохозяйки. Может быть, когда-нибудь и выйдет в свет соответствующее учебное «простое пособие о сложном»[1]. Вслед за этим возникла необходимость «перевести» знания, полученные студентами при изучении информатики, науки теперь XXI века, в навыки грамотного пользователя компьютера. Навыки, необходимые не только для поиска выхода из DOOM, но и из лабиринта массивов статистических данных для курсовой работы. Пришлось выбирать между имеющимся в каждом компьютере привычным и удобным Excel'ем и новыми модными статистическими пакетами типа Statistica и SPSS (ссылки на которые приводятся во многих современных статьях по медико-биологическим и психологическим проблемам). По целому ряду причин, о которых речь пойдет ниже, автор остановил свой выбор на статистическом пакете STATGRAPHICS for DOS v.3.0 как удобном учебном средстве для целей первоначальной подготовки студентов-психологов в вопросах статистического анализа данных на компьютере.

Предварительное знакомство с доступными сегодня статистическими пакетами приводит к выводу, что все компьютерные программы непринципиально отличаются друг от друга по архитектуре, интерфейсу и математико-статистическому потенциалу. Они содержат основные блоки (входной модуль, блоки редактора данных, преобразования данных, статистических методов, построения графиков, различные справочники, help-системы и т.п.). Такая структурная похожесть и несущественные различия в меню предлагаемых методов обработки данных приводят к выводу о том, что невозможно определить лучшую программу, поскольку в каждой из них есть свои плюсы и минусы. Более подробно об этом можно прочитать в других пособиях (например, у Ю.Н. Тюрина и А.А. Макарова, С.И. Калинина и др.). Поэтому автор считает целесообразным привести для читателя собственное видение плюсов и минусов STATGRAPHICS for DOS v.3.0 (далее – ST).

 ST во всех его версиях (от 3 до 7 и от DOS до Widows-версии) остается одним из самых известных статистических пакетов общего назначения, сохраняющих свою популярность среди не сильно искушенных в премудростях статистики пользователей. Все версии сохраняют преемственность в построении архитектуры пакетов, общих характеристик интерфейсов, набора предлагаемых статистических процедур. Это позволяет достаточно легко переходить от версии к версии по мере накопления собственного опыта работы с пакетом.

ST предоставляет возможность статистической реализации абсолютного большинства задач, встречающихся в практике работы психолога. Общее число опций ST for DOS v.3.0 (118) не столь уж сильно отличается, например, от числа опций в SPSS for DOS v.5 (115). Отмечается, что только 26 опций по-разному представлены в ST и SPSS (т.е. присутствуют в одном статистическом пакете и отсутствуют в другом). Реализующиеся в более мощных пакетах возможности расчета какого-либо эксклюзивного критерия, как правило, остаются невостребованными массовым пользователем в силу их ограниченной осведомленности в возможностях тех или иных методов математической обработки данных. По этой причине такие статистические пакеты и не представлены в настоящем пособии[2].

ST представляет широкие возможности для работы с данными, представленными в показателях номинативных шкал, а также с другими качественными данными. Для этого требуется лишь специальное формирование структуры электронной таблицы и ее последующая коррекция с помощью меню стандартных процедур.

ST предъявляет минимальные требования к компьютерной технике и успешно работает на любом «железе». Архивированный вариант ST спокойно умещается на стандартной 3,5" дискете и может быть легко перенесен и установлен на любой компьютер (в отличие от значительно более «тяжелых» Statistica и SPSS, имеющих объем со всеми приложениями в десятки Мб даже в архивированных вариантах).

ST в отличие от Excel позволяет получать не только первичные статистики и корреляционные матрицы, но и производить основные математико-аналитические процедуры (факторный, регрессионный, дисперсионный, дискриминантный, кластерный анализ данных). В то же время графические возможности версии ST 3.0 беднее графических возможностей Excel, и, тем более, SPSS и Statistica[3]. В тоже время сохраняется возможность импорта полученных при помощи ST результатов в Excel для построения наиболее простых графиков и диаграмм. Если возникает необходимость представления более сложных по дизайну и форме графиков, то рекомендуется пользоваться версиями «ST for Windows» или другими статистическими пакетами. Необходимо отметить, что потребность в применении более сложных форм графического представления данных прямо пропорционально связана с возрастанием пользовательской и математической компетентности исследователя и предполагает самостоятельный переход к более мощным и «навороченным» графикой статистическим пакетам.

Существенными недостатками ST for DOS v.3.0 являются отсутствие полностью русифицированной версии программы и существенный дефицит справочно-методической литературы. Предпринимались попытки создания текстовых и электронных пособий, включая и написание txt-файлов для базовой комплектации. Но в них отмечается существенный акцент на вопросах математического обеспечения, и как следствие, страдает методическая проработка пользовательских операторских процедур. Поэтому наиболее часто освоение пакета осуществляется пользователями экспериментальным методом, известным как метод «проб и ошибок». Кроме того, отсутствие экспертной системы – контекстно-ориентированной помощи по выбору того или иного метода статистического анализа данных и короткой понятной вербальной интерпретации полученных результатов несколько ограничивало возможности применения пакета массовым пользователем. Можно отметить, что ST for DOS v.3.0, в отличие от отечественных статистических пакетов, в большей мере ориентирован на специалистов, хорошо знакомых с математическими концепциями применяемых методов анализа данных (т.е. основами математического анализа, изучающимися, в частности, в рамках дисциплины «Математические методы в психологии»). Представляется, что освоение ST for DOS v.3.0 должно осуществляться параллельно с освоением хотя бы общих математических идей, лежащих в основе всех представленных ST методов анализа данных.

Это пособие не является пособием по математической статистике. В нем нет серьезных математических формул или специализированных терминов, не затрагиваются категории высшей математики. Предполагается, что читатель хотя бы в минимальной степени осведомлен о том, что означают те или иные знакомые со времен школы понятия и с помощью какого статистического метода возможно решить стоящую перед ним задачу. Предполагается, что пользователь не осведомлен лишь в вопросах работы с пакетом ST for DOS v. 3.0.

В то же время для удобства (и, может быть, закрепления уровня осведомленности читателя) приведены суждения об общих математико-статистических идеях конкретных методов математического анализа данных, заимствованные из различных учебников по математическо-статистическим процедурам и многомерному статистическому анализу данных. При этом эти данные представлены в виде, адаптированном для восприятия студента-психолога. Но эти описания не претендуют на характерную для математических выкладок строгость и точность. Для более глубокого изучения сущности используемых методов существует специальная литература, перечень которой приведен в конце учебного пособия [1–11].

В данном пособии рассмотрены не все возможности STATGRAPHICS for DOS v. 3.0, а только те, что могут быть востребованы на самом начальном этапе профессионального освоения математических методов обработки и представления результатов психологических исследований. При этом автор исходил из собственного опыта «изобретения велосипеда» и готов поделиться им с читателем. Вместе с тем, рассмотренные в пособии материалы составляют определенную часть профессиональных знаний, умений и навыков, оцениваемых на экзамене по дисциплине «Математические методы в психологии».

В пособии учебный материал представлен в основном в алгоритмах (вплоть до описания порядка нажимания тех или иных кнопок клавиатуры). Это делается для того, чтобы пользователь скорее смог получить заветную «морковку» или «банан» в виде успешного математико-статистического решения своей задачи, защищенной курсовой работы или сданного экзамена.

И последнее. Кажущаяся сложность английских названий математических терминов или «нагромождения» на экране монитора таблиц, коэффициентов и обозначений могут производить впечатление непонятности. По этому поводу хотелось бы процитировать нашего российского классика (совсем не математика по образованию) А. И. Герцена: «Пожалуй, есть и еще нелепее обвинение науки: зачем она употребляет незнакомые слова.– Кому незнакомые??[4]». В этом случае прояснение возможно достичь только путем простого и временами нудного общения пользователя с компьютерной программой STATGRAPHICS, последовательно осваивая, прямо скажем, далеко не сложные процедуры.

Успехов нам с тобой, читатель!