Применение пакета статистических программ в психологических исследованиях - Учебное пособие (Беребин М.А.)

8.1. общие идеи метода дисперсионного анализа

 

Дисперсионный анализ метод математического анализа изменчивости признака под влиянием каких-либо контролируемых факторов (ANOVA –Analisis of Variance – анализ вариативности). Дисперсионный анализ основывается на гипотезе о наличии причинно-следственных соотношений между переменными. При этом причинные переменные рассматриваются как факторы, а переменные-следствия – как результативные признаки или отклики. Соответственно, в дисперсионном анализе возможно исследование воздействия только одного фактора (однофакторный дисперсионный анализ) или исследование воздействия двух факторов (двухфакторный дисперсионный анализ). Кроме того, если анализируется одна и та же выборка испытуемых, подвергшихся влиянию разных факторов, то речь идет об одно- или двухфакторном дисперсионном анализе для связанных выборок. Если речь идет об анализе разных выборок испытуемых, подвергшихся воздействию разных факторов, то речь идет об одно- или двухфакторном дисперсионный анализе для несвязанных выборок. Одним из важных условий реализации метода является правило обеспечения статистической независимости выбранных наблюдений и оценки вариативности их результатов.

Поэтому для метода ANOVA отбираются результаты в рандомизированном порядке из независимых выборок, подчиняющихся закону нормального распределения и имеющих равные дисперсии s2. При этом никаких ограничений относительно значений средних арифметических и других параметров распределения не требуется.

Основное содержание метода составляет анализ вариативности признака, обусловленной действием независимых и неизвестных переменных. При этом в  общей вариативности признака следует выделять:

1) вариативность, обусловленную изолированным воздействием каждой из исследуемых независимых переменных;

2) вариативность, обусловленную взаимодействием всех исследуемых независимых переменных;

3) случайную вариативность, обусловленную действием всех других неизвестных для исследователя переменных.

Одним из основополагающих показателей оценки вариативности признака в дисперсионном анализе является критерий F (Фишера), оценивающий отношение вариативности, обусловленной специфическим действием независимых переменных, и вариативности, обусловленной взаимодействием этих переменных, к случайной вариативности. Эмпирические значения критерия F возрастают по мере увеличения степени влияния независимых переменных на вариативность признака. При этом факторы должны быть действительно статистически независимыми (т.е. должна отсутствовать корреляция между значениями этих факторов). Важным моментом является оценка характера действия каждого фактора по отношению к другому (синнергичное, антагонистическое) и, особенно, характера их взаимодействия. Последнему часто отдается предпочтение при проведении дисперсионного анализа в сравнении с оценкой действия каждого фактора в отдельности.

Другим обязательным условием является дискретный подход к оценке действующих факторов, выражающийся в представлении их по ступеням градации. При этом градация действующего фактора может проводиться в соответствии с правилами, действующими для равноинтервальных, ранговых или даже номинативных шкал. Важно лишь то, что для проведения дисперсионного анализа число градаций должно составлять не менее 3. В литературе по методам математического анализа данных принято назвать градации фактора, отличающиеся только качественно,[12] как условия действия фактора. Экспериментальные данные, представленные по градациям фактора, называются дисперсионным комплексом. Результаты исследования, относящиеся только к одной градации фактора, называются ячейкой дисперсионного комплекса. Отсюда еще одно непреложное требование-ограничение при проведении дисперсионного анализа – требование равенства ячеек дисперсионного комплекса, т.е. число случаев наблюдений в каждой ячейке комплекса должно быть одинаковым. При этом считается, что равенство ячеек комплекса позволяет обойти вышеописанное требование к равенству дисперсий в каждой ячейке. Справедливости ради следует упомянуть, что в специализированной литературе по методам математического анализа данных указываются алгоритмы, позволяющие обсчитывать и неравномерные комплексы. В практике уравнивание численности ячеек комплекса осуществляется, как правило, путем случайной выбраковки результатов исследования. При двухфакторном дисперсионном анализе обязательным являются соблюдение равенства ячеек комплекса и обеспечение их симметричности (т.е. количество градаций по каждому фактору должно быть одинаковым). Однако при однофакторном дисперсионном анализе число градаций не должно быть меньше 3, а при двухфакторном – не меньше 2.

Рабочая гипотеза исследования с помощью метода дисперсионного анализа (как правило, в такой роли выступает альтернативная гипотеза) гласит, что средние величины результативного признака в разных градациях исследуемого фактора различны.

Не вдаваясь далее в математические подробности метода, отметим, что при интерпретации полученных с помощью ANOVA результатов большое значение имеют определение показателей SS (sum of squares – сумм квадратов) в их различных вариантах. В дальнейшем, при описании полученных результатов ANOVA охарактеризуем метрический смысл этих показателей в их прикладном значении.