Болезни Военный билет Призыв

Мат методы в психологии. Математико-статистическая обработка данных психологического исследования (эксперимента) и форма представления результатов. «Московский социально-гуманитарный институт»

Проблема повышения качества и эффективности научных исследований в сфере психологии в последние годы выступает предметом исследования большинства ученых, приводит к активному внедрению в практическую психологию современных математических и информационных методов.

Методы математической обработки данных используются для обработки данных, установления закономерностей между изучаемыми процессами, психологическими феноменами. Использование математических методов позволяет повысить достоверность, научность результатов исследований.

Подобная обработка может осуществляться вручную либо при помощи специального программного обеспечения. Результаты исследования могут быть представлены в графическом виде, в виде таблица, в числовом выражении.

На сегодняшний день основными направлениями психологического знания, в которых уровень математизации знаний оказывается наиболее важным, является экспериментальная психология, психометрика и математическая психология.

К наиболее распространенным психологическим математическим методам относят регистрацию и шкалирование, ранжирование, факторный, корреляционный анализ, различные методы многомерного представления и анализа данных.

Регистрация и шкалирование как метод математической обработки данных в психологии

Сущность данного метода заключается в выражении исследуемых феноменов в числовых показателях. Выделяют несколько видов шкал, однако, в рамках практической психологии чаще всего используется количественная, которая позволяет измерять степень выраженности исследуемых свойств у объектов, выразить разницу между ними в числовых показателях. Использование количественной шкалы позволяет осуществлять операцию ранжирования.

Определение 1

Под ранжированием в современной научной литературе понимают распределение данных в порядке убывания/ возрастания исследуемого признака.

В процессе ранжирования каждому конкретному значению присваивается определенный ранг, что позволяет перевести значения из количественной шкалы в номинальную.

Корреляционный анализ в психологии

Сущность данного метода математической обработки заключается в установлении зависимости между психологическими феноменами, процессами. В процессе корреляционного анализа измеряется уровень изменений среднего значения одного показателя при изменении параметров, с которыми он находится во взаимосвязи.

Связь между феноменами может быть положительной, когда увеличение факторного признака приводит к одновременному увеличению результативного либо отрицательной, при которой зависимость выступает обратной положительной. Зависимость может быть линейной или кривой.

Использование корреляционного анализа позволяет выявить и установить взаимосвязи между феноменами, процессами, которые выступают не очевидными на первый взгляд.

Факторный анализ в психологии

Использование данного метода позволяет прогнозировать вероятное влияние определенных факторов на исследуемый феномен, причем все факторы воздействия изначально принимаются как имеющие равное значение, а степень влияния исследуемого фактора вычисляется математически. Применение факторного анализа позволяет установить общую причину трансформаций нескольких феноменов.

Таким образом, внедрение методов математической обработки данных в практическую психологию позволяет существенно повысить объективность результатов исследований, снизить уровень субъективности, влияния личности исследователя на реализацию изучение, анализ и интерпретацию данных.

Полученные в процессе математической обработки результаты позволяют лучше понять сущность исследуемых психологических феноменов во всем многообразии их взаимосвязей, осуществлять адекватное прогнозирование в отношении возможных изменений изучаемых феноменов, осуществлять конструирование математических моделей группового и индивидуального поведения и пр.

Федеральное агентство по образованию

Государственное образовательное учреждение

высшего профессионального образования

«Омский государственный технический университет»

Математические методы в психологии

Конспект лекций

для студентов 2 курса гуманитарных специальностей

дневного, вечернего и заочного отделений

Омск – 2008

Составитель Ананко Алла Александровна, ст. преподаватель

Печатается по решению редакционно-издательского совета Омского

государственного технического университета.

ЛЕКЦИЯ 1. Измерения и шкалы

1.1.Типы измерений

1.2. Измерительные шкалы

1.3. Как определить, в какой шкале измерено явление

ЛЕКЦИЯ 2. Дискретный вариационный ряд и его основные показатели

2.1. Вариация признака в совокупности и значение её изучения

ЛЕКЦИЯ 3. Статистический анализ выборочных средних двух выборок

3.1. Выбор метода и общий подход

3.2. t-критерий Стьюдента

3.3. Алгоритм расчета критерия Стьюдента для зависимых выборок измерений

ЛЕКЦИЯ 4 . Критерии для непараметрических распределений

4.1.
критерий Манна-Уитни

4.2. Критерий знаков

ЛЕКЦИЯ 5. Вычисление и анализ коэффициента ранговой корреляции

5.1. Выполнить ранжирование по следующему алгоритму

5.2. Алгоритм расчета коэффициента ранговой корреляции Спирмена

ЛЕКЦИЯ 6. Многомерное шкалирование

6.1. Назначение

6.2. Многомерные методы и модели

6.3. Неметрическая модель

ЛЕКЦИЯ 7 . Кластерный анализ

7.1. Назначение

7.2. Методы кластерного анализа

ЛЕКЦИЯ 8. Уравнение линейной регрессии

8.1. Анализ статистической взаимосвязи между двумя рядами

8.2. Построение модели парной регрессии

8.3. Анализ качества модели парной регресс

ПРИЛОЖЕНИЯ

Приложение А1. Критические значения критерия
Манна-Уитни.

Приложение А2. Критические значения критерия знаков

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

Лекция 1. Измерения и шкалы

1.1. Типы измерений

Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующего его свойства, как правило, при помощи чисел. Таким образом, следует различать объекты исследования (в психологии это чаще всего люди, испытуемые), их свойства (то, что интересует исследователя, составляет предмет изучения) и признаки , отражающие в числовой шкале выраженность свойств.

Измерение в терминах производимых исследователем операций - это приписывание объекту числа по определенному правилу. Это правило устанавливает соответствие между измеряемым свойством объекта и результатом измерения - признаком.

В обыденном сознании, как правило, нет необходимости разделять свойства вещей и их признаки: такие свойства предметов, как вес и длина, мы отождествляем, соответственно, с количеством граммов и сантиметров. Если нет необходимости в измерении, мы ограничиваемся сравнительными суждениями: этот человек тревожный, а этот - нет, этот более сообразителен, чем другой, и т.д.

В научном исследовании нам исключительно важно отдавать себе отчет в том, что точность, с которой признак отражает измеряемое свойство, зависит от процедуры измерения.

Пример. Мы можем разделить всех наших испытуемых на две группы по сообразительности: сообразительные и не очень. И далее приписать каждому испытуемому символ (например, 1 и 0) в зависимости от его принадлежности к той или другой группе мы можем упорядочить всех испытуемых по степени выраженности сообразительности, приписывая каждому его ранг, от самого сообразительного (1 ранг), самого сообразительного из оставшихся (2 ранг) и т. д. до последнего испытуемого. В каком из этих двух случаев измеренный признак будет точнее отражать различия между испытуемыми по измеряемому свойству, догадаться нетрудно.

В зависимости от того, какая операция лежит в основе измерения признака, выделяют так называемые измерительные шкалы. Они еще называются шкалами С. Стивенса, по имени ученого-психолога, который их предложил. Эти шкалы устанавливают определенные соотношения между свойствами чисел и измеряемым свойством объектов. Шкалы разделяют на метрические (если есть или может быть установлена единица измерения) и неметрические (если единицы измерения не могут быть установлены).

ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ В МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ ПСИХОЛОГИЧЕСКИХ ДАННЫХ

1.1. Признаки и переменные

Признаки и переменные - это измеряемые психологические явления. Такими

явлениями могут быть время решения задачи, количество допущенных ошибок, уровень

тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных

реакций, угол поворота корпуса в беседе, показатель социометрического статуса и

множество других переменных.

Понятия признака и переменной могут использоваться как взаимозаменяемые. Они

являются наиболее общими. Иногда вместо них используются понятия показателя или

уровня, например, уровень настойчивости, показатель вербального интеллекта и др.

Понятия показателя и уровня указывают на то, что признак может быть измерен коли-

чественно, так как к ним применимы определения "высокий" или "низкий", например,

высокий уровень интеллекта, низкие показатели тревожности и др.

Психологические переменные являются случайными величинами, поскольку заранее

неизвестно, какое именно значение они примут.

Математическая обработка - это оперирование со значениями признака,

полученными у испытуемых в психологическом исследовании. Такие индивидуальные

результаты называют также "наблюдениями", "наблюдаемыми значениями",

"вариантами", "датами", "индивидуальными показателями" и др. В психологии чаще всего

используются термины "наблюдение" или "наблюдаемое значение".

Значения признака определяются при помощи специальных шкал измерения.

1.2. Шкалы измерения

Измерение - это приписывание числовых форм объектам или событиям в

соответствии с определенными правилами (Стивене С, 1960, с.60). С.Стивенсом

предложена классификация из 4 типов шкал измерения:

1) номинативная, или номинальная, или шкала наименований;

2) порядковая, или ординальная, шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений.

Номинативная шкала - это шкала, классифицирующая по названию: потеп (лат.) -

имя, название. Название же не измеряется количественно, оно лишь позволяет отличить

один объект от другого или одного субъекта от другого. Номинативная шкала - это способ

классификации объектов или субъектов, распределения их по ячейкам классификации.

Простейший случай номинативной шкалы - дихотомическая шкала, состоящая всего

лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье";

"иностранец - соотечественник"; "проголосовал "за" - проголосовал "против"" и т.п.

Признак, который измеряется по дихотомической шкале наименований, называется

альтернативным. Он может принимать всего два значения. При этом исследователь

зачастую заинтересован в одном из них, и тогда он говорит, что признак “проявился”,

если тот принял интересующее его значение, и что признак “не проявился” , если он при-

нял противоположное значение. Например: "Признак леворукости проявился у 8

испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак

проявился - признак не проявился.

Более сложный вариант номинативной шкалы - классификация из трех и более

ячеек, например: "экстрапунитивные - интрапунитивные -импунитивные реакции" или

"выбор кандидатуры А - кандидатуры Б -кандидатуры В - кандидатуры Г" или "старший -

средний - младший -единственный ребенок в семье" и др.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам

классификации, мы получаем возможность от наименований перейти к числам, подсчитав

количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один

совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б

11, кандидатуру В - 28, а кандидатуру Г -всего 1. Теперь мы можем оперировать этими

числами, представляющими собой частоты встречаемости разных наименований, то есть

частоты принятия признаком "выбор" каждого из 4 возможных значений. Далее мы можем

сопоставить полученное распределение частот с равномерным или каким-то иным

распределением.

Таким образом, номинативная шкала позволяет нам подсчитывать частоты

встречаемости разных "наименований", или значений признака, и затем работать с этими

частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количество наблюдений

(испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это

одно наблюдение. Такие данные могут быть обработаны с помощью метода ·2,

биномиального критерия m и углового преобразования Фишера ·*.

Порядковая шкала - это шкала, классифицирующая по принципу "больше -

меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим

классификационные ячейки, то в порядковой шкале они образуют последовательность от

ячейки "самое малое значение" к ячейке "самое большое значение" (или наоборот).

Ячейки теперь уместнее называть классами, поскольку по отношению к классам

употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и

т.д.

В порядковой шкале должно быть не менее трех классов, например "положительная

реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия

вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем

лишь, что они образуют последовательность. Например, классы "подходит для занятия

вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу,

чем класс "подходит с оговорками" к классу "не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс

получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем

больше классов в шкале, тем больше у нас возможностей для математической обработки

полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по

преобладанию у них более высоких или более низких рангов или подсчитать коэффициент

ранговой корреляции между двумя переменными, измеренными в порядковой шкале,

допустим, между оценками профессиональной компетентности руководителя, данными

ему разными экспертами.

Все психологические методы, использующие ранжирование, построены на

применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей

по степени их значимости для него, проранжировать список личностных качеств

социального работника или 10 претендентов на эту должность по степени их

профессиональной пригодности, то во всех этих случаях испытуемый совершает так

называемое принудительное ранжирование, при котором количество рангов соответствует

количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

Независимо от того, приписываем ли мы каждому качеству или испытуемому один

из 3-4 рангов или совершаем процедуру принудительного ранжирования, мы получаем в

обоих случаях ряды значений, измеренные по порядковой шкале. Правда, если у нас всего

3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых

испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все

многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс

могут попасть люди, достаточно серьезно различающиеся между собой. С другой

стороны, принудительное ранжирование, то есть образование последовательности из

многих испытуемых, может искусственно преувеличивать различия между людьми.

Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми,

так как группы могут изначально различаться по уровню развития исследуемого качества,

и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего

лишь средний, и т.п.

Выход из положения может быть найден, если задавать достаточно дробную

классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности,

подавляющее большинство психологических методик, использующих экспертную оценку,

построено на измерении одним и тем же "аршином" из 10, 20 или даже 100 градаций

разных испытуемых в разных выборках.

Итак, единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при

этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К

данным, полученным по порядковой шкале, применимы все описанные в данной книге

критерии и методы.

Интервальная шкала - это шкала, классифицирующая по принципу "больше на

определенное количество единиц - меньше на определенное количество единиц". Каждое

из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения задачи в секундах, то

это уже явно шкала интервалов. Однако на самом деле это не так, поскольку

психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не

равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу

за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Аналогичным образом, каждая секунда после истечения полутора минут в опыте с

измерением мышечного волевого усилия на динамометре с подвижной стрелкой, по

"цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна

секунда за год идет" - так сформулировал это однажды один испытуемый.

Попытки измерять психологические явления в физических единицах - волю в

секундах, способности в сантиметрах, а ощущение собственной недостаточности - в

миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах

"объективно" существующего времени и пространства. Однако ни один опытный

исследователь при этом не обольщает себя мыслью, что он совершает измерения по

психологической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале

порядка, нравится нам это или нет (Стивене С, 1960, с.56; Паповян С.С., 1983, с.63;

Михеев В.И.: 1986, с.28).

Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А

решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Аналогичным образом, значения, полученные испытуемыми в баллах по любой

нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На

самом деле равноинтервальными можно считать лишь шкалы в единицах стандартного

отклонения и про-центильные шкалы, и то лишь при условии, что распределение значений

в стандартизующей выборке было нормальным (Бурлачук Л. Ф., Морозов С. М., 1989, с.

163, с. 101).

Принцип построения большинства интервальных шкал построен на известном

правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его

распределении укладываются в диапазоне М±3·2 Можно построить шкалу в единицах

долей стандартного отклонения, которая будет охватывать весь возможный диапазон

изменения признака, если крайний слева и крайний справа интервалы оставить

открытыми.

Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее

арифметическое значение в "сырых" баллах принимается за точку отсчета. Вправо и влево

отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена

схема вычисления стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-

факторного личностного опросника Р. Б. Кеттелла.

Справа

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем

последний из этих интервалов открыт. Слева от среднего значения будут располагаться интервалы, равные

5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых

баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; ·=2,4, вправо мы

откладываем 1/2·, т.е. 1,2 "сырых" балла. Таким образом, граница интервала составит: (10,2 + 1,2) = 11,4

"сырых" балла. Итак, границы интервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4

баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы

откладываем 1/2 · и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала,

соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения

9 и 10. Если испытуемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он получил 11

"сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться

одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и

15 - 9 стенов и т. д.

В принципе,шкалу стенов можно построить по любым данным, измеренным по крайней мере в

2 Определения и формулы расчета М и СТ даны в параграфе "Распределение признака. Параметры распределения".

порядковой шкале, при объеме выборки п>200 и нормальном распределении признака3.

Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу

равенства накопленных частот. При нормальном распределении признака в окрестности среднего значения

группируе·ся большая часть всех наблюдений, поэтому в этой области среднего значения интервалы

оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2).

Следовательно, такая процентильная шкала является равноинтервальной только относительно накопленной

частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).

Построение шкал равных интервалов по данным, полученным по шкале порядка,

напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала

поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы,

которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психо-

логическую переменную по шкале порядка, подсчитали средние и стандартные

отклонения, а затем получили, наконец, интервальную шкалу. "Такому нелегальному

использованию статистики может быть дано известное прагматическое оправдание; во

многих случаях оно приводит к плодотворным результатам" (Стивене С, 1960, с. 56).

Многие исследователи не проверяют степень совпадения полученного ими

эмпирического распределения с нормальным распределением, и тем более не переводят

получаемые значения в единицы долей стандартного отклонения или процентили,

предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают

скошенное, срезанное по краям или двухвершинное распределение. На Рис. 1.3

представлено распределение показателя мышечного волевого усилия на выборке из 102

испытуемых. Распределение с удовлетворительной точностью можно считать

нормальным (·2=12,7, при v=9, M=89,75, ·= 25,1).

На Рис . 1.4 представлено распределение показателя самооценки по шкале методики

Дж . Менестера - Р . Корзини " Уровень успеха , которого я должен был достичь уже сейчас "

(n=356). Распределение значимо отличается от нормального (· 2 =58,8, при v=7; p< 0,01;

М =80,64; · =16,86).

С такими "ненормальными" распределениями приходится встречаться очень часто,

чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне,

а в самой специфике психологических признаков. По некоторым методикам от 10 до 20%

испытуемых получают оценку "ноль" - например, в их рассказах не встречается ни одной

словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь

неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально,

но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали

объем выборки (см. п. 5.3).

Методы статистической обработки, предлагаемые в настоящем руководстве, в

большинстве своем не требуют проверки совпадения полученного эмпирического

распределения с нормальным. Они построены на подсчете частот и ранжировании.

Проверка необходима только в случае применения дисперсионного анализа. Именно

поэтому соответствующая глава сопровождается описанием процедуры подсчета необхо-

димых критериев.

Во всех остальных случаях нет необходимости проверять степень совпадения

полученного эмпирического распределения с нормальным, и тем более стремиться

преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были

измерены переменные - в секундах, миллиметрах, градусах, количестве выборов и т. п. -

все эти данные могут быть обработаны с помощь непараметрических критериев4,

составляющих основу данного руководства.

Шкала равных отношений - это шкала, классифицирующая объекты или субъектов

пропорционально степени выраженности измеряемого свойства. В шкалах отношений

классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4,

как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике

абсолютная нулевая точка отсчета встречается при измерении длин отрезков или

физических объектов и при измерении температуры по шкале Кельвина с абсолютным

нулем температур. Считается, что в психологии примерами шкал равных отношений

являются шкалы порогов абсолютной чувствительности (Стивене С, 1960; Гайда В. К.,

Захаров В. П., 1982). Возможности человеческой психики столь велики, что трудно

представить себе абсолютный нуль в какой-либо измеряемой психологической

переменной. Абсолютная глупость и абсолютная честность - понятия скорее житейской

психологии.

То же относится и к установлению равных отношений: только метафора обыденной

речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.

Абсолютный нуль, правда, может иметь место при подсчете количества объектов

или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали

альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом

случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем

альтернативу Б. Однако при этом измерено не психологическое свойство человека, а

соотношение выборов у 42 человек.

4 Определение и описание непараметрических критериев дано ниже в данной главе.

По отношению к показателям частот возможно применять все арифметические

операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале

отношений - 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали:

к универсальной шкале измерения в частотах встречаемости того или иного значения

признака и к единице измерения, которая представляет собой 1 наблюдение.

Расклассифицировав испытуемых по ячейкам номинативной шкалы, мы можем применить

потом высшую шкалу измерения - шкалу отношений между частотами.

1.3. Распределение признака. Параметры распределения

Распределением признака называется закономерность встречаемости разных его

значений (Плохинский Н.А., 1970, с. 12).

В психологических исследованиях чаще всего ссылаются на нормальное

распределение.

Нормальное распределение характеризуется тем, что крайние значения признака в

нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно

часто. Нормальным такое распределение называется потому, что оно очень часто

встречалось в естественнонаучных исследованиях и казалось "нормой" всякого массового

случайного проявления признаков. Это распределение следует закону, открытому тремя

учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и

Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального

распределения представляет собой привычную глазу психолога-исследователя так на-

зываемую колоколообразную кривую (см. напр., Рис. 1.1, 1.2).

Параметры распределения - это его числовые характеристики, указывающие, где "в

среднем" располагаются значения признака, насколько эти значения изменчивы и

наблюдается ли преимущественное появление определенных значений признака.

Наиболее практически важными параметрами являются математическое ожидание,

дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не параметрами, а их

приближенными значениями, так называемыми оценками параметров. Это объясняется

ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть

оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы

будем иметь в виду их оценки.

Среднее арифметическое (оценка математического ожидания) вычисляется по

формуле:

i - индекс, указывающий на порядковый номер данного значения признака;

п - количество наблюдений;

·- знак суммирования.

Оценка дисперсии определяется по формуле:

где xi - каждое наблюдаемое значение признака;

x - среднее арифметическое значение признака;

n - количество наблюдений.

Величина, представляющая собой квадратный корень из несмещенной оценки

дисперсии (S), называется стандартным отклонением или средним квадратическим

отклонением. Для большинства исследователей привычно обозначать эту величину

греческой буквой · (сигма), а не S. На самом деле, · - это стандартное отклонение в

генеральной совокупности, a S - несмещенная оценка этого параметра в исследованной

выборке. Но, поскольку S - лучшая оценка · (Fisher R.A., 1938), эту оценку стали часто

обозначать уже не как S, а как ·:

В тех случаях, когда какие-нибудь причины благоприятствуют более частому

появлению значений, которые выше или, наоборот, ниже среднего, образуются

асимметричные распределения. При левосторонней, или положительной, асимметрии в

распределении чаще встречаются более низкие значения признака, а при правосторонней,

или отрицательной - более высокие (см. Рис. 1.5).

Показатель асимметрии (A) вычисляется по формуле:

В тех случаях, когда какие-либо причины способствуют преимущественному

появлению средних или близких к средним значений, образуется распределение с

положительным эксцессом. Если же в распределении преобладают крайние значения,

причем одновременно и более низкие, и более высокие, то такое распределение

характеризуется отрицательным эксцессом и в центре распределения может образоваться

впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (E) определяется по формуле:

Рис. 1.6. Эксцесс: а) положительный; 6) отрицательный

В распределениях с нормальной выпуклостью E=0.

Параметры распределения оказывается возможным определить только по

отношению к данным, представленным по крайней мере в интервальной шкале. Как мы

убедились ранее, физические шкалы длин, времени, углов являются интервальными

шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней

мере, с формальной точки зрения. Параметры распределения не учитывают истинной

психологической неравномерности секунд, миллиметров и других физических единиц

измерения.

На практике психолог-исследователь может рассчитывать параметры любого

распределения, если единицы, которые он использовал при измерении, признаются

разумными в научном сообществе.

1.4. Статистические гипотезы

Формулирование гипотез систематизирует предположения исследователя и

представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не

теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что,

собственно, он обнаружил.

Статистические гипотезы подразделяются на нулевые и альтернативные,

направленные и ненаправленные.

Нулевая гипотеза - это гипотеза об отсутствии различий. Она обозначается как

H0 И называется нулевой потому, что содержит число 0: X1-

Х2=0, где X1, X2 - сопоставляемые значения признаков.

Нулевая гипотеза - это то, что мы хотим опровергнуть, если

перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как

H1. Альтернативная гипотеза - это то, что мы хотим до-

казать, поэтому иногда ее называют экспериментальной

гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть

подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные

испытуемые получают хотя и различные, но уравновешенные по трудности задания, или

что экспериментальная и контрольная выборки не различаются между собой по каким-то

значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость

различий, ибо они более информативны для нас в поиске нового. Нулевая и

альтернативная гипотезы могут быть направленными и ненаправленными.

Направленные гипотезы

H0: X1 не превышает Х2

H1: X1 превышает Х2

Ненаправленные гипотезы

H0: X1 не отличается от Х2

Н1: Х1 отличается от Х2

Если вы заметили, что в одной из групп индивидуальные значения испытуемых по

какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для

проверки значимости этих различий нам необходимо сформулировать направленные

гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных

воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже

необходимо сформулировать направленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в

группе А и Б, то формулируются ненаправленные гипотезы.

При описании каждого критерия в руководстве даны формулировки гипотез,

которые он помогает нам проверить.

Построим схему - классификацию статистических гипотез.

Проверка гипотез осуществляется с помощью критериев статистической оценки

различий.

1.5. Статистические критерии

Статистический критерий - это решающее правило, обеспечивающее надежное

поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой

вероятностью (Суходольский Г.В., 1972, с. 291).

Статистические критерии обозначают также метод расчета определенного числа и

само это число.

Когда мы говорим, что достоверность различий определялась по критерию ·2, то

имеем в виду, что использовали метод ·2 - для расчета определенного числа.

рассчитанное по методу ·2. Это число обозначается как эмпирическое значение критерия.

По соотношению эмпирического и критичOского значений критерия мы можем

судить о том, подтверждается ли или опровергается нулевая гипотеза. Например, если

эмп> ·2

кр, H0 отвергается.

В большинстве случаев для того, чтобы мы признали различия значимыми,

необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть

критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны

придерживаться противоположного правила.

Эти правила оговариваются в описании каждого из представленных в руководстве

критериев.

В некоторых случаях расчетная формула критерия включает в себя количество

наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое

значение критерия одновременно является тестом для проверки статистических гипотез.

По специальной таблице мы определяем, какому уровню статистической значимости

различий соответствует данная эмпирическая величина. Примером такого критерия

является критерий ·*, вычисляемый на основе углового преобразования Шишера.

В большинстве случаев, однако, одно и то же эмпирическое значение критерия

может оказаться значимым или незначимым в зависимости от количества наблюдений в

исследуемой выборке (n) или от так называемого количества степеней свободы, которое

обозначается как v или как df.

Число степеней свободы v равно числу классов вариационного ряда минус число

условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К

числу таких условий относятся объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной

шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы

получаем так называемый частотный вариационный ряд. Единственное условие, которое

соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет

работать на компьютере - умеет выполнять лишь определенные операции - не умеет

работать на компьютере". Выборка состоит из 50 человек. Если в первый класс отнесены

20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные

10 испытуемых. Мы ограничены одним условием - объемом выборки. Поэтому даже если

мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем

определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны

в определении количества испытуемых в третьем разряде, "свобода" простирается только

на первые две ячейки классификации:

v= c-l = 3-1 = 2

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы

были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т.

Способы более сложного подсчета числа степеней свободы при двухмерных

классификациях приведены в разделах, посвященных критерию ·2 и дисперсионному

анализу.

Зная n и/или число степеней свободы, мы по специальным таблицам можем

определить критические значения критерия и сопоставить с ними полученное

эмпирическое значение. Обычно это записывается так: "при n=22 критические значения

критерия составляют..." или "при v=2 критические значения критерия составляют..." и

т.п.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии

Критерии, включающие в формулу расчета параметры распределения, то есть

средние и дисперсии (t - критерий Стьюдента, критерий F и др.)

Непараметрические критерии

Критерии, не включающие в формулу расчета параметров распределения и

основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т

Вилкоксона и др.)

И те, и другие критерии имеют свои преимущества и недостатки. На основании

нескольких руководств можно составить таблицу, позволяющую оценить возможности и

ограничения тех и других (Рунион Р., 1982; McCall R., 1970; J.Greene, M.D"Olivera, 1989).

Таблица 1.1

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ НЕПАРАМЕТРИЧЕСКИЕ

КРИТЕРИИ

1. Позволяют прямо оценить различи* в

средних, полученных в двух выборках (t -

критерий Стьюдента).

Позволяют оценить лишь средние

тенденции, например, ответить на

вопрос, чаще ли в выборке А

встречаются более высокие, а в выборке

Б - более низкие значения признака

(критерии Q, U, ·* и др.).

2. Позволяют прямо оценить различия в

дисперсиях (критерий Фишера).

Позволяют оценить лишь различия в

диапазонах вариативности признака

(критерий ·*).

3. Позволяют выявить тенденции изме-

нения признака при переходе от условия

к условию (дисперсионный

однофакторный анализ), но лишь при

условии нормального распределения

признака.

Позволяют выявить тенденции

изменения признака при переходе от

условия к условию при любом

распределении признака (критерии

тенденций L и S).

4. Позволяют оценить взаимодействие

двух и более факторов в их влиянии на

изменения признака (двухфакторный

дисперсионный анализ).

Эта возможность отсутствует.

5. Экспериментальные данные должны

отвечать двум, а иногда трем, условиям:

а) значения признака измерены по

интервальной шкале; б) распределение

признака является нормальным; в) в

дисперсионном анализе должно

соблюдаться требование равенства

дисперсий в ячейках комплекса.

Экспериментальные данные могут не

отвечать ни одному из этих условий: а)

значения признака могут быть пред-

ставлены в любой шкале, начиная от

шкалы наименований; б) распределение

признака может быть любым и

совпадение его с каким-либо

теоретическим законом распределения

необязательно и не нуждается в

проверке; в) требование равенства

дисперсий отсутствует.

6. Математические расчеты довольно

сложны.

Математические расчеты по большей

части просты и занимают мало времени

(за исключением критериев ·2 и ·).

7. Если условия, перечисленные в п.5,

выполняются, параметрические критерии

оказываются несколько более мощными,

чем непараметрические.

Если условия, перечисленные в п.5, не

выполняются, непараметрические

критерии оказываются более мощными,

чем параметрические, так как они менее

чувствительны к "засорениям".

Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько

более мощными5, чем непараметрические, но только в том случае, если признак измерен

по интервальной шкале и нормально распределен. С интервальной шкалой есть

определенные проблемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой

интервальные. Кроме того, проверка распределения "на нормальность" требует

достаточно сложных расчетов, результат которых заранее неизвестен (см. параграф 7.2).

Может оказаться, что распределение признака отличается от нормального, и нам так или

иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и нетребуют таких

длительных и сложных расчетов. По сравнению с параметрическими критериями они

ограничены лишь в одном - с их помощью невозможно оценить взаимодействие двух или

более условий или факторов, влияющих на изменение признака. Эту задачу может решить

только дисперсионный двухфакторный анализ.

Учитывая это, в настоящее руководство включены в основном непараметрические

статистические критерии. В сумме они охватывают большую часть возможных задач

сопоставления данных.

Единственный параметрический метод, включенный в руководство - метод

дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.

1.6. Уровни статистической значимости

Уровень значимости - это вероятность того, что мы сочли различия существенными,

а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или

при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны,

составляет 0,05.

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или

при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны,

составляет 0,01.

Если перевести все это на более формализованный язык, то уровень значимости - это

вероятность отклонения нулевой гипотезы, в то время как она верна.

Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как

5 О понятии мощности критерия см. ниже.

она верна, называется ошибкой 1 рода.

Вероятность такой ошибки обычно обозначается как·. В сущности, мы должны

были бы указывать в скобках не р·0,05 или р·0,01, а ··0,05 или ··0,01. В некоторых

руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).

Если вероятность ошибки - это ·, то вероятность правильного решения: 1 - ·. Чем

меньше ·, тем больше вероятность правильного решения.

Исторически сложилось так, что в психологии принято считать низшим уровнем

статистической значимости 5%-ый уровень (р<0,05): достаточным - 1%-ый уровень

(р<0,01) и высшим 0,1%-ый уровень (р<0,001), поэтому в таблицах критических значений

обычно приводятся значения критериев, соответствующих уровням статистической зна-

чимости р<0,05 и р<0,01, иногда - р<0,001. Для некоторых критериев в таблицах указан

точный уровень значимости их разных эмпирических значений. Например, для ·*=1,56

р=0,06.

До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05,

мы еще не имеем права отклонить нулевую гипотезу. В настоящем руководстве мы, вслед

за Р. Рунионом (1982), будем придерживаться следующего правила отклонения гипотезы

об отсутствии различий (H0) И принятия гипотезы о статистической достоверности

различий (Н1).

Правило отклонения H0 И принятия H1

Если эмпирическое значение критерия равняется критическому значению,

соответствующему р<0,05 или превышает его, то H0 отклоняется, но мы еще не можем

определенно принять H1. Если эмпирическое значение критерия равняется критическому

значению, соответствующему р<0,01 или превышает его, то H0 отклоняется и

принимается H1.

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-

Уитни. Для них устанавливаются обратные соотношения.

Для облегчения процесса принятия решения можно всякий раз вычерчивать "ось

значимости".

Критические значения критерия обозначены как Q0,05 и Q0,01, эмпирическое значение

критерия как Qэмп. Оно заключено в эллипс.

Вправо от критического значения Q0,01 простирается "зона значимости" - сюда

попадают эмпирические значения, превышающие Q0,01 и, следовательно, безусловно

значимые.

Влево от критического значения Q0,05 простирается "зона незначимости", - сюда

попадают эмпирические значения Q, которые ниже Q0,05, и, следовательно, безусловно

незначимы.

Мы видим, что Q0,05=6; Q0,01=9; Qэмп

Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01- Это зона

"неопределенности": мы уже можем отклонить гипотезу о недостоверности различий (H0),

НО еще не можем принять гипотезы об их достоверности (H1).

Практически, однако, исследователь может считать достоверными уже те различия,

которые не попадают в зону незначимости, заявив, что они достоверны при р<0,05, или

указав точный уровень значимости полученного эмпирического значения критерия,

например: р=0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к

критериям Н Крускала-Уоллиса, ·2, Фридмана, L Пейджа, ·* Фишера, А, Колмогорова.

Уровень статистической значимости или критические значения критериев

определяются по-разному при проверке направленных и ненаправленных статистических

гипотез.

При направленной статистической гипотезе используется односторонний критерий,

при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более

строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое

значение критерия, которое ранее соответствовало уровню значимости р<0,05, теперь

соответствует лишь уровню р<0,10.

В данном руководстве исследователю не придется всякий раз самостоятельно

решать, использует ли он односторонний или двухсторонний критерий. Таблицы

критических значений критериев подобраны таким образом, что направленным гипотезам

соответствует односторонний, а ненаправленным - двусторонний критерий, и

приведенные значения удовлетворяют тем требованиям, которые предъявляются к

каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы

совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из

критериев.

1.7. Мощность критериев

Мощность критерия - это его способность выявлять различия, если они есть. Иными

словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если

она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как

она неверна, называется ошибкой II рода.

Вероятность такой ошибки обозначается как ·. Мощность критерия - это его

способность не допустить ошибку II рода, поэтому:

Мощность=1-·

Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут

быть решены с помощью разных критериев, при этом обнаруживается, что некоторые

критерии позволяют выявить различия там, где другие оказываются неспособными это

сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а

зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для

выбора критерия может быть не только мощность, но и другие его характеристики, а

именно:

а) простота;

б) более широкий диапазон использования (например, по отношению к данным,

определенным по номинативной шкале, или по отношению к большим n);

в) применимость по отношению к неравным по объему выборкам;

г) большая информативность результатов.

1.8. Классификация задач и методов их решения

Множество задач психологического исследования предполагает те или иные

сопоставления. Мы сопоставляем группы испытуемых по какому-либо признаку, чтобы

выявить различия между ними по этому признаку. Мы сопоставляем то, что было "до" с

тем, что стало "после" наших экспериментальных или любых иных воздействий, чтобы

определить эффективность этих воздействий. Мы сопоставляем эмпирическое

распределение значений признака с каким-либо теоретическим законом распределения

или два эмпирических распределения между собой, с тем, чтобы доказать неслучайность

выбора альтернатив или различия в форме распределений.

выборке испытуемых, для того, чтобы установить степень согласованности их изменений,

их сопряженность, корреляцию между ними.

Наконец, мы можем сопоставлять индивидуальные значения, полученные при

разных комбинациях каких-либо существенных условий, с тем чтобы выявить характер

взаимодействия этих условий в их влиянии на индивидуальные значения признака.

Именно эти задачи позволяет решить тот набор методов, который предлагается

настоящим руководством. Все эти методы могут быть использованы при так называемой

"ручной" обработке данных.

Краткая классификация задач и методов дана в Таблице 1.2.

Таблица 1.2

Классификация задач и методов их решения

Задачи Условия Методы

1. Выявление различий в

уровне исследуемого

признака

а) 2 выборки испытуемых Q - критерий Розенбаума;

U - критерий Манна-Уитни;

Фишера)

б) 3 и более выборок

испытуемых

Н - критерий Крускала-Уоллиса.

2. Оценка сдвига зна-

чений исследуемого

признака

а) 2 замера на одной и той

же выборке испытуемых

Т - критерий Вилкоксона;

G - критерий знаков;

·* - критерий (угловое преобразование

Фишера).

б) 3 и более замеров на

одной и той же выборке

испытуемых

·л

2 - критерий Фридмана;

L - критерий тенденций Пейджа.

3. Выявление различий в

распределении

а) при сопоставлении

эмпирического признака

распределения с

теоретическим

·2 - критерий Пирсона;

m - биномиальный критерий.

б) при сопоставлении двух

эмпирических

распределений

·2 - критерий Пирсона;

· - критерий Колмогорова-Смирнова;

·* - критерий (угловое преобразование

Фишера).

4.Выявление степени

согласованности

изменений

а) двух признаков rs - коэффициент ранговой корреляции

Спирмена.

б) двух иерархий или

профилей

rs - коэффициент ранговой корреляции

Спирмена.

5. Анализ изменений

признака под влиянием

контролируемых

условий

а) под влиянием одного

фактора

S - критерий тенденций Джонкира;

L - критерий тенденций Пейджа;

однофакторный дисперсионный анализ

Фишера.

б) под влиянием двух

факторов одновременно

Двухфакторный дисперсионный анализ

Фишера.

1.9. Принятие решения о выборе метода математической обработки

Если данные уже получены, то вам предлагается следующий алгоритм определения

задачи и метода.

АЛГОРИТМ 1

Принятие решения о задаче и методе обработки на стадии, когда данные уже

получены

1. По первому столбцу Табл. 1.2 определить, какая из задач стоит в вашем

исследовании.

2. По второму столбцу Табл. 1.2 определить, каковы условия решения вашей задачи,

например, сколько выборок обследовано или на какое количество групп вы можете

разделить обследованную выборку.

3. Обратиться к соответствующей главе и по алгоритму принятия решения о выборе

критерия, приведенного в конце каждой главы, определить, какой именно метод или

критерий вам целесообразно использовать.

Если вы еще находитесь на стадии планирования исследования, то лучшее заранее

подобрать математическую модель, которую вы будете в дальнейшем использовать.

Особенно необходимо планирование в тех случаях, когда в перспективе предполагается

использование критериев тенденций или (в еще большей степени) дисперсионного

анализа. , В этом случае алгоритм принятия решения таков:

АЛГОРИТМ 2

Принятие решения о задаче и методе обработки на стадии планирования

исследования

1. Определите, какая модель вам кажется наиболее подходящей для доказательства]

ваших научных предположений.

2. Внимательно ознакомьтесь с описанием метода, примерами и задачами для

самостоятельного решения, которые к нему прилагаются.

3. Если вы убедились, что это то, что вам нужно, вернитесь к разделу "Ограничения

критерия" и решите, сможете ли вы собрать данные, которые будут отвечать этим

ограничениям (большие объемы выборок, наличие нескольких выборок, монотонно

различающихся по какому-либо признаку, например, по возрасту и т.п.).

4. Проводите исследование, а затем обрабатывайте полученные данные по заранее!

выбранному алгоритму, если вам удалось выполнить ограничения.

5. Если ограничения выполнить не удалось, обратитесь к алгоритму 1.

В описании каждого критерия сохраняется следующая последовательность

изложения:

Назначение критерия;

Описание критерия;

Гипотезы, которые он позволяет проверить;

Графическое представление критерия;

Ограничения критерия;

Пример или примеры.

Кроме того, для каждого критерия создан алгоритм расчетов. Если критерий сразу

удобнее рассчитывать по алгоритму, то он приводится в разделе "Пример"; если алгоритм

легче можно воспринять уже после рассмотрения примера, то он приводится в конце

параграфа, соответствующего данному критерию.

1.10. Список обозначений

Латинские обозначения:

А - показатель асимметрии распределения

с - количество групп или условий измерения

d - разность между рангами, частотами или частостями

df - число степеней свободы в дисперсионном анализе

Е - показатель эксцесса

F - критерий Фишера для сравнения дисперсий

f - частота

f* - частость, или относительная частота

G - критерий знаков

Н - критерий Крускала-Уоллиса

i - индекс, обозначающий порядковый номер наблюдения

j - индекс, обозначающий порядковый номер разряда, класса, группы

k - количество классов или разрядов признака

L - критерий тенденций Пейджа

М - среднее значение признака или средняя арифметическая; то же, что и х

m - биномиальный критерий

n - количество наблюдений (испытуемых, реакций, выборов и т.п.)

N - общее количество наблюдений в двух или более выборках

Р - вероятность того, что событие произойдет

р - вероятность ошибки 1 рода (то же, что и а), уровень статистической значимости

Q - 1) вероятность того, что событие не произойдет; 2) критерий Розенбаума

rs - коэффициент ранговой корреляции Спирмена

S - критерий Джонкира

S2 - оценка дисперсии

Si - количество значений, которые выше или ниже данного значения

SS - суммы квадратов (в дисперсионном анализе)

Т - критерий Вилкоксона

Тс - суммы рангов по столбцам

Тк - большая сумма рангов в критерии U

U - критерий Манна-Уитни

Wn - размах вариативности, или диапазон значений от наименьшего до

наибольшего

хi - текущее наблюдение; каждое наблюдение по порядку

x - среднее значение признака (то же, что и М)

Греческие обозначения:

· (альфа) - вероятность ошибки I рода (отклонения H0, которая верна)

· (бета) - вероятность ошибки II рода (принятия H0, которая неверна)

·, (ламбда) - критерий Колмогорова-Смирнова

v (ню) - число степеней свободы в непараметрических критериях

· (сигма) - стандартное отклонение

· (фи) - центральный угол, определяемый по процентной доле в

критерии ·*

·* (фи) - критерий Фишера с угловым преобразованием

·2 (хи-квадрат) - критерий Пирсона

r (хи-ар-квадрат) - критерий Фридмана.

Материал размещен на сайте HRM.RU

Математические методы в психологии используются для обработки данных исследований и установления закономерностей между изучаемыми явлениями. Даже простейшее исследование не обходится без математической обработки данных.

Обработка данных может осуществляться вручную, а может - с применением специального программного обеспечения. Итоговый результат может выглядеть как таблица; методы в психологии позволяют и графически отображать полученные данные. Для разных (количественных, качественных и порядковых) применяются разные инструменты оценки.

Математические методы в психологии включают в себя как позволяющие установить числовые зависимости, так и методы статистической обработки. Остановимся подробнее на наиболее распространенных из них.

Для того чтобы измерить данные, прежде всего, необходимо определиться со шкалой измерений. И здесь используются такие математические методы в психологии, как регистрация и шкалирование , заключающиеся в выражении исследуемых явлений в числовых показателях. Выделяют несколько типов шкал. Однако для математической обработки пригодны лишь некоторые из них. Это, главным образом, количественная шкала, которая позволяет измерять степень выраженности конкретных свойств у исследуемых объектов и в числовом отношении выражать разницу между ними. Простейший пример - измерение коэффициента интеллекта. Количественная шкала позволяет проводить операцию ранжирования данных (см. далее). При ранжировании данные из количественной шкалы переводятся в номинальную (например, низкое, среднее или высокое значение показателя), при этом обратный переход уже невозможен.

Ранжирование - это распределение данных в порядке убывания (возрастания) признака, который оценивается. При этом используется количественная шкала. Каждому значению присваивается определенный ранг (показателю с минимальным значением - ранг 1, следующему значению - ранг 2, и так далее), после чего становится возможным перевод значений из количественной шкалы в номинальную. Например, измеряемый показатель - уровень тревожности. Было протестировано 100 человек, полученные результаты проранжированы, и исследователь видит, сколько человек имеют низкий (высокий или средний) показатель. Однако такой способ представления данных влечет за собой частичную утрату информации по каждому респонденту.

Корреляционный анализ - это установление взаимосвязи между явлениями. При этом измеряется, как изменится одного показателя при изменении показателя, во взаимосвязи с которым он находится. Корреляция рассматривается в двух аспектах: по силе и по направлению. Она может быть положительной (при возрастании одного показателя возрастает и второй) и отрицательной (при возрастании первого второй показатель убывает: например, чем выше уровень тревожности у индивида, тем меньше вероятность, что он займет лидирующее положение в группе). Зависимость может быть линейной, или, что бывает чаще, выражаться кривой. Связи, которые помогают установить могут быть неочевидны на первый взгляд, если применяются иные методы математической обработки в психологии. В этом его главное достоинство. К недостаткам можно отнести большую трудоемкость в связи с необходимостью использования немалого числа формул и тщательных вычислений.

Факторный анализ - это еще один который позволяет прогнозировать вероятное влияние различных факторов на исследуемый процесс. При этом все факторы воздействия изначально принимаются как имеющие равное значение, а степень их влияния вычисляется математически. Такой анализ позволяет установить общую причину изменчивости нескольких явлений сразу.

Для отображения полученных данных могут применяться методы табулирования (создания таблиц) и графического построения (диаграммы и графики, которые не только дают наглядное представление о полученных результатах, но и позволяют прогнозировать ход процесса).

Главным условиями, при которых вышеперечисленные математические методы в психологии обеспечивают достоверность исследования, являются наличие достаточной выборки, точность измерений и правильность производимых вычислений.

Материалы к курсу

«МАТЕМАТИЧЕСКИЕ МЕТ ОДЫ В ПСИХОЛОГИИ»

ЧАСТЬ 1

@Преподаватель: Голев Сергей Васильевич, адъюнкт-профессор психологии (доцент).

@Ассистент: Голева Ольга Сергеевна, магистр психологии

(ОМУРЧ «Украина» ХФ. – 2008 г.)

ИПИС ХГУ - 2008 г.)

В лекциях были использованы материалы следующих авторов:

Годфруа Ж. Что такое психология? М.: Мир, 1996. Т 2 . Куликов Л. В. Психологическое исследование: методические рекомендаций по проведению. - СПб., 1995. Немов Р.С. Психология: Экспериментальная педагогическая психология и психодиагностика. - М., 1999.- Т. 3. Практикум по общей экспериментальной психологии / Под ред. А.А. Крылова. - Л. ЛГУ, 1987. Сидоренко Е.В . Методы математической обработки в психологии. –СПб.: ООО «Речь», 2000. -350 с. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: Владос, 1998.-С.123. Суходольский Г.В. Математические методы в психологии. – Харьков: Изд-во Гуманитарный Центр, 2004. – 284 с.

Курс «Математические методы в психологии»

(Материалы для самостоятельного изучения студентами)

Лекция № 1

ВВЕДЕНИЕ В КУРС «МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»

Вопросы:

1.Математика и психология

2.Методологические вопросы применения математики в психологии

3.Математическая психология

3.1.Введение

3.2.История развития

3.3.Психологические измерения

3.4.Нетрадиционные методы моделирования

4.Словарь по математическим методам в психологии

Вопрос 1. МАТЕМАТИКА И ПСИХОЛОГИЯ

Существует мнение, неоднократно высказывавшееся круп­ными учеными прошлого: область знания становится наукой, лишь применяя математику. С этим мнением, возможно, не со­гласятся многие гуманитарии. А зря: именно математика позво­ляет количественно сравнивать явления, проверять правильность словесных утверждений и тем самым добираться до истины либо приближаться к ней. Математика делает обозримыми длинные и подчас туманные словесные описания, проясняет и экономит мысль.

Математические методы позволяют обоснованно прогно­зировать будущие события, вместо того, чтобы гадать на кофей­ной гуще или как-либо иначе. В общем, польза от применения математики велика, но и труда на ее освоение требуется много. Однако он окупается сполна.

Психология в своем научном становлении неизбежно должна была пройти и прошла путь математизации, хотя не во всех стра­нах и не в полной мере. Точной даты начала пути математизации, пожалуй, не знает ни одна наука. Однако для психологии в каче­стве условной даты начата этого пути можно принять 18 апреля

1822 г . Именно тогда в Королевском немецком научном обществе Иоганн Фридрих Гербарт прочел доклад «О возможности и необ­ходимости применять в психологии математику». Основная идея доклада сводилась к упомянутому выше мнению: если психоло­гия хочет быть наукой, подобно физике, в ней нужно и можно применять математику.

Спустя два года после этого программного по своей сути док­лада И. Ф. Гербарт издал книгу «Психология как наука, заново ос­нованная на опыте, метафизике и математике». Эта книга приме­чательна во многих отношениях. Она, на мой взгляд (см. Г.В Суходольский, ), явилась пер­вой попыткой создания психологической теории, опирающейся на тот круг явлений, которые непосредственно доступны каждо­му субъекту, а именно на поток представлений, сменяющих друг друга в сознании. Никаких эмпирических данных о характеристиках этого потока, полученных, подобно физике, эксперимен­тальным путем, тогда не существовало. Поэтому Гербарт в отсут­ствие этих данных, как он сам писал, должен был придумывать гипотетические модели борьбы всплывающих и исчезающих в сознании представлений. Облекая эти модели в аналитическую форму,например φ =α(l-exp[-βt]) ,где t-время, φ-скорость изменения представлений, α и β - константы, зависящие от опы­та, Гербарт, манипулируя числовыми значениями параметров, пы­тался описать возможные характеристики смены представлений.

По-видимому, И. Ф. Гербарту первому принадлежит мысль о том, что свойства потока сознания - это величины и, следова­тельно, они в дальнейшем развитии научной психологии подле­жат измерению. Ему также принадлежит идея «порога сознания», и он первый употребил выражение «математическая психология».

У И. Ф. Гербарта в Лейпцигском университете нашелся уче­ник и последователь, позднее ставший профессором философии и математики, - Мориц-Вильгельм Дробиш. Он воспринял, раз­вил и по-своему реализовал программную идею учителя. В слова­ре Брокгауза и Ефрона о Дробише сказано, что еще в 30-х годах Х1Х века он занимался исследованиями по математике и психо­логии и публиковался на латинском языке. Но в 1842г . М.В.Дро­биш издал в Лейпциге на немецком языке монографию под не­двусмысленным названием: «Эмпирическая психология соглас­но естественнонаучному методу».

На мой взгляд, эта книга М.-В. Дробиша дает замечательный пример первичной формализации знаний в области психологии сознания. Там нет математики в смысле формул, символики и рас­четов, но там есть четкая система понятий о характеристиках пото­ка представлений в сознании как взаимосвязанных величинах. Уже в предисловии М.-В. Дробиш написал, что эта книга предваряет другую, уже готовую, - имеется в виду книга по математической психологии. Но поскольку его коллеги-психологи недостаточно подготовлены в математике, постольку он счел необходимым про­демонстрировать эмпирическую психологию сначала безо всякой математики, а лишь на твердых естественнонаучных основах.

Не знаю, подействовала ли эта книга на тогдашних филосо­фов и богословов, занимавшихся психологией. Скорее всего - нет. Но она, несомненно, подействовала, как и работы И. Ф. Гербарта, на лейпцигских ученых с естественнонаучным образованием.

Лишь через восемь лет, в 1850 г . в Лейпциге вышла в свет вто­рая основополагающая книга М.-В. Дробиша-«Первоосновы математической психологии». Таким образом, у этой психологи­ческой дисциплины тоже есть точная дата появления в науке. Не­которые современные психологи, пишущие в области математи­ческой психологии, ухитряются начинать ее развитие с американ­ского журнала, появившегося в 1963 г. Воистину, «все новое - это хорошо забытое старое». Целое столетие до американцев развива­лась математическая психология, точнее - математизированная психология. И начало процессу математизации нашей науки по­ложили И. Ф. Гербарт и М.-В. Дробиш.

Надо сказать, что по части новаций математическая психоло­гия Дробиша уступает сделанному его учителем - Гербартом. Правда, Дробиш к двум борющимся в сознании представлениям добавил третье, а это сильно усложнило решения. Но главное, по-моему, в другом. Большую часть объема книги составляют приме­ры численного моделирования. К сожалению, ни современники, ни потомки не поняли и не оценили научного подвига, совершен­ного М.-В. Дробишем: у него ведь не было компьютера для чис­ленного моделирования. А в современной психологии математи­ческое моделирование - это продукт второй половины XX века. В предисловии к нечаевскому переводу гербартианской психоло­гии российский профессор А. И. Введенский, знаменитый своей «психологией без всякой метафизики», весьма пренебрежитель­но отозвался о попытке Гербарта применять в психологии мате­матику. Но не такова была реакция естествоиспытателей. И пси­хофизики, в частности Теодор Фехнер, и знаменитый Вильгельм Вундт, работавшие в Лейпциге, не могли пройти мимо основопо­лагающих публикаций И.Ф.Гербартаи М.-В. Дробиша. Ведь имен­но они математически реализовали в психологии идеи Гербарта о психологических величинах, порогах сознания, времени реакций сознания человека, причем реализовали с использованием совре­менной им математики.

Основные методы тогдашней математики-дифференциальное и интегральное исчисления, уравнения сравнительно несложных за­висимостей - оказались вполне пригодными для выявления и опи­сания простейших психофизических законов и различных реакций человека Но они не годились для изучения сложных психических явлений и сущностей. Не зря В.Вундт категорически отрицал воз­можность эмпирической психологии исследовать высшие психичес­кие функции. Они оставались, по Вундту, в ведении особой, по сути метафизической, психологии народов.

Математические средства для изучения сложных многомерных объектов, в том числе высших психических функции - интеллекта, способностей, личности, стали создавать англоязычные ученые. Сре­ди других результатов оказалось, что рост потомков как бы стремит­ся возвратиться к среднему росту предков. Появилось понятие «рег­рессия», и были получены уравнения, выражающие эту зависимость. Был усовершенствован коэффициент, раньше предложенный фран­цузом Бравэ. Этот коэффициент количественно выражает соотно­шение двух изменяющихся переменных, т. е. корреляцию. Теперь этот коэффициент - одно из важнейших средств многомерного анализа данных, дажесимвол сохранил аббревиатурный: малое латинское «г» от английского relation - отношение.

Еще будучи студентом Кембриджа, Фрэнсис Гальтон заметил, что рейтинг успешности сдачи экзаменов по математике,-а это был выпускной экзамен, -- изменяется от нескольких тысяч до немногих сотен баллов. Позднее, связав это с распределением талантов, Галь­тон пришел к мысли о том, что специальные испытания позволяют прогнозировать дальнейшие жизненные успехи людей. Так в 80-х гг. XIX века родился гальтоновский метод тестов.

Идею тестов подхватили и развили французы-А. Бит, В. Анри и другие, создавшие первые тесты для селекции социально отсталых детей. Это послужило началом психологической тестологии, что, в свою очередь, повлекло за собой развитие психологических измере­ний.