Математическая статистика для психологов онлайн. Дискретный статистический ряд

О. А. ШУШЕРИНА

математическая статистика

для психологов

Учебное пособие

Красноярск 2012

Часть 1. Описательная статистика
Тема 1. Генеральная совокупность. Выборка. Выбор…………….....
Тема 2. Вариационный и статистический ряды………………………
Тема 3. Числовые характеристики выборки……………………….....
Часть 2. Статистические оценки параметров распределения генеральной совокупности
Тема 1. Точечные оценки параметров генеральной совокупности….
Тема 2. Интервальные оценки параметров генеральной совокупности……………………………………………………………
Часть 3. Проверка статистических гипотез
Тема 1. Основные понятия теории принятия статистического решения………………………………………………………………….
Тема 2. Поверка гипотез о различии в уровне проявления исследуемого признака (критерий Манна-Уитни)…………………...
Тема 3. Проверка гипотезы о равенстве генеральных средних (независимые выборки)……………………………………………….
Тема 4. Проверка гипотезы о равенстве генеральных средних (зависимые выборки)……………………………………….
Часть 4. Корреляционный анализ
Тема 1. Корреляционная связь и ее статистическое изучение…………………………………………………………………
Тема 2. Значимость выборочного коэффициента линейной корреляции………………………………………………………………
Тема 3. Коэффициенты ранговой корреляции и ассоциации………………………………………………………………
Литература ……………………………………………………………
Приложения. Таблицы …………………………………………….

Часть 1. описательная статистика

Тема 1. генеральная совокупность. выборка. выбор.

Математическая статистика – это наука, разрабатывающая методы регистрации, описания и анализа данных наблюдений и экспериментов с целью получения вероятностно-статистических моделей изучаемых явлений. Ее методы применимы для обработки наблюдений и экспериментов любой природы.

Методы и способы математико-статистической обработки у студентов гуманитарных факультетов , в том числе и психологических, вызывают значительные затруднения и, как следствие, боязнь и предубеждение в возможности ими овладения. Однако, как показывает практика, это ложные заблуждения.

В современной психологии, в практической деятельности психолога любого уровня, без использования аппарата математической статистики все выводы могут восприниматься с известной долей субъективности.

1. Задачи математической статистики

Основная цель математической статистики – получение и обработка данных для статистически значимой поддержки процесса принятия решений , например, при решении задач планирования, правления, прогнозирования.

Задачей математической статистики является изучение массовых явлений в обществе, природе, технике методами теории вероятностей и их научное обоснование.

В теории вероятностей мы, зная природу некоторого явления, выясняем, как будут себя вести те или иные изучаемые нами характеристики, которые можно наблюдать в экспериментах.

В математической статистике , наоборот, исходными данными являются экспериментальные данные (наблюдения над случайными величинами), а требуется вынести то или иное суждение о природе изучаемого явления.

Основными задачами математической статистики являются:

§ Оценивание числовых характеристик или параметров распределения случайной величины по данным экспериментов.

§ Проверка статистических гипотез о свойствах изучаемого случайного явления.

§ Определение эмпирической зависимости между переменными, описывающими случайное явление, на основе экспериментальных данных.

Рассмотрим типичную схему исследований при решении указанных задач. Эти исследования естественно делятся на две части .

Часть 1. Сначала путем наблюдений и экспериментов собираются, регистрируются статистические данные, составляющие выборку, - это числа, называемые также выборочными данными . Затем они упорядочиваются, представляются в компактной, наглядной или функциональной форме. Вычисляются различного рода средние величины, характеризующие выборку. Часть математической статистики, обеспечивающая эту работу, называется описательной статистикой .

Часть 2. Вторая часть работы исследователя состоит в получении на основе найденных сведений о выборке достаточно обоснованных выводов о свойствах исследуемого случайного явления. Эта часть работы обеспечивается статистическими методами, составляющими статистику выводов.

2. Выборочный метод исследования

Виды деятельности" href="/text/category/vidi_deyatelmznosti/" rel="bookmark">вид деятельности , требующий высокой профессиональной компетентности и часто достаточно много времени для работы с каждым испытуемым. На помощь приходит выборочный метод исследования , в этом случае из всей совокупности отбирают случайным образом ограниченное число объектов и изучают их.

Генеральная совокупность – это совокупность объектов (любая группа людей), которую психолог изучает по выборке. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же считают, что этот объем ограничен в зависимости от объекта наблюдения и решаемой задачи.

Из всей совокупности людей, которую называют генеральной совокупностью, случайно отбирают ограниченное число людей (испытуемых, респондентов). Совокупность случайно отобранных объектов для изучения называют выборочной совокупностью , или просто выборкой .

Объемом выборки называют число входящих в нее людей. Объем выборки обозначается буквой . Он может быть различным, но не меньшим чем два респондента. В статистике различают:

малую выборку ();

среднюю выборку ();

большую выборку ().

Процесс составления выборки называется выбором .

При образовании выборки можно поступить следующими способами:

1) после отбора и изучения испытуемого его «возвращают» в генеральную совокупность; такую выборку называют повторной. Психологу нередко приходится тестировать несколько раз одних и тех же испытуемых при помощи одной и той же методики, но всякий раз испытуемые будут иметь различия, обусловленные функциональной и возрастной изменчивостью, присущей каждому человеку;

2) после отбора и изучения испытуемого его не возвращают в генеральную совокупность; такую выборку называют бесповторной .

К выборке предъявляются требования , определенные целями и задачами исследования.

1. Организованная выборка должна быть репрезентативной для того, чтобы правильно представлять в той же пропорции и той же частотой основные признаки в генеральной совокупности. Выборка будет репрезентативной, если ее осуществлять случайно : каждый испытуемый отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Репрезентативная выборка – это меньшая, но точная модель генеральной совокупности.

В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое (генеральную совокупность, популяцию). Такие ошибки, при обобщении, переносе результатов, полученных при изучении отдельной выборки, на всю генеральную совокупность, называются ошибками репрезентативности .

2. Выборка должна быть однородной , т. е. каждый испытуемый должен обладать теми характеристиками, которые являются для исследования критериальными: возраст, пол, образование и так далее. Условия проведения экспериментов не должны меняться, причем выборка должна быть получена из одной генеральной совокупности.

Выборки называют независимыми (несвязными ), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых другой выборки.

Выборки называют зависимыми (связными ), если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на результаты измерения этого же свойства в другом эксперименте. Обратим внимание, что одна и та же группа испытуемых , на которой дважды проводилось психологическое обследование (пусть даже разных психологических качеств, признаков, особенностей), считается зависимой, или связной выборкой .

Основным этапом работы психолога с выборкой является выявление результатов статистического анализа и распространение полученных выводов на всю генеральную совокупность.

Выбор наиболее приемлемого объема выборки зависит от:

1) степени однородности изучаемого явления (чем более однородно явление, тем меньше может быть объем выборки);

2) статистических методов, которые использует психолог. Одни методы требуют большое количество испытуемых (более 100 человек), другие допускают малое количество (5-7 человек).

Статистическое исследование

1. Сбор эмпирических данных Выборочный метод исследования

2. Первичная обработка Вариационный ряд

результатов наблюдений

Эмпирическое распределение

Полигон частот Гистограмма частот

3. Математическая обработка

статистических данных Оценка параметров

распределения

Методы корреляционного Методы факторного Методы регрессионного

анализа анализа анализа

Этапы статистического исследования

Контрольные вопросы

1. Каковы основные задачи математической статистики?

2. Что называется генеральной и выборочной совокупностями для исследуемой случайной величины?

3. В чем сущность выборочного метода?

4. Какая выборка называется репрезентативной, однородной?

1. Таблицы сгруппированных данных

Обработка экспериментального материала начинается с систематизации и группировки результатов по некоторому признаку.

Таблицы . Основное содержание таблицы должно быть отражено в названии .

Простая таблица – это перечень, список отдельных единиц испытания с количественной или качественной характеристикой. Используется группировка по одному признаку (например, по полу).

Сложная таблица применяется для выяснения причинно-следственных связей между признаками и позволяет выявить тенденцию, обнаружить разные аспекты между признаками.

№ испытуемых	Баллы, полученные за задание

2. Дискретный статистический ряд

Последовательность данных, расположенная в порядке их получения в эксперименте , называется статистическим рядом .

Результаты наблюдений, в общем случае ряд чисел, расположенных в беспорядке, необходимо упорядочить (проранжировать ). Ранжировать можно как по возрастанию, так и по убыванию признака. После операции ранжирования опытные данные можно сгруппировать так, чтобы в каждой группе признак принимал одно и то же значение, которое называется варианта (обозначено ).

Число элементов в каждой группе называется частотой варианты (). Частота показывает , сколько раз встречается данное значение в исходной совокупности. Общая сумма частот равна объему выборки: .

Упорядоченный ряд распределения, в котором указана повторяемость вариант, принадлежащих к данной совокупности, называется вариационным рядом .

Варианты (значения признака)

Статистика в психологии (statistics in psychology)

Первое применение С. в психологии часто связывают с именем сэра Фрэнсиса Гальтона. В психологии под «статистикой» понимается применение количественных мер и методов для описания и анализа результатов психол. исслед. Психологии как науке С. необходима. Регистрация, описание и анализ количественных данных позволяют проводить обоснованные сравнения, опирающиеся на объективные критерии. Применяемая в психологии С. обычно состоит из двух разделов: описательной (дескриптивной) статистики и теории статистического вывода.

Описательная статистика.

Описательная С. включает в себя методы орг-ции, суммирования и описания данных. Дескриптивные показатели позволяют быстро и эффективно представлять большие совокупности данных. К наиболее часто используемым описательным методам относятся частотные распределения, меры центральной тенденции и меры относительного положения. Регрессия и корреляции применяются для описания связей между переменными.

Частотнее распределение показывает, сколько раз каждый качественный или количественный показатель (либо интервал таких показателей) встречается в массиве данных. Кроме того, нередко приводятся относительные частоты - процент ответов каждого типа. Частотное распределение обеспечивает быстрое проникновение в структуру данных, к-рого было бы трудно достичь, работая непосредственно с первичными данными. Для наглядного представления частотных данных часто используются разнообразные виды графиков.

Меры центральной тенденции - это итоговые С., описывающие то, что яв-ся типичным для распределения. Мода определяется как наиболее часто встречающееся наблюдение (значение, категория и т. д.). Медиана - это значение, к-рое делит распределение пополам, так что одна его половина включает все значения выше медианы, а другая - все значения ниже медианы. Среднее вычисляется как среднее арифметическое всех наблюденных значений. Какая из мер - мода, медиана или среднее - будет лучше всего описывать распределение, зависит от его формы. Если распределение симметричное и унимодальное (имеющее одну моду), среднее медиана и мода будут просто совпадать. На среднее особенно влияют «выбросы», сдвигая его величину в сторону крайних значений распределения, что делает среднее арифметическое наименее полезной мерой сильно скошенных (асимметричных) распределений.

Др. полезными описательными характеристиками распределений служат меры изменчивости, т. е. того, в какой степени различаются значения переменной в вариационном ряду. Два распределения могут иметь одинаковые средние, медианы и моды, но существенно различаться по степени изменчивости значений. Изменчивость оценивается двумя С.: дисперсией и стандартным отклонением.

Меры относительного положения включают в себя процентили и нормированные оценки, используемые для описания местоположения конкретного значения переменной относительно остальных ее значений, входящих в данное распределение. Велковиц с соавторами определяют процентиль как «число, показывающее процент случаев в определенной референтной группе с равными или меньшими оценками». Т. о., процентиль дает более точную информ., чем просто сообщение о том, что в данном распределении некое значение переменной попадает выше или ниже среднего, медианы или моды.

Нормированные оценки (обычно называемые z-оценками) выражают отклонение от среднего в единицах стандартного отклонения (σ). Нормированные оценки полезны тем, что их можно интерпретировать относительно стандартизованного нормального распределения (z-распределения) - симметричной колоколообразной кривой с известными свойствами: средним, равным 0, и стандартным отклонением, равным 1. Так как z-оценка имеет знак (+ или -), она сразу показывает, лежит ли наблюденное значение переменной выше или ниже среднего (m). А поскольку нормированная оценка выражает значения переменной в единицах стандартного отклонения, она показывает, насколько редким яв-ся каждое значение: примерно 34% всех значений попадает в интервал от т до т + 1σ и 34% - в интервал от т до т - 1σ; по 14% - в интервалы от т + 1σ до т + 2σ и от т - 1σ до т - 2σ; и по 2% - в интервалы от т + 2σ до т + 3σ и от т - 2σ до т - 3σ.

Связи между переменными. Регрессия и корреляция относятся к тем способам, к-рые чаще всего используются для описания связей между переменными. Два разных измерения, полученных по каждому элементу выборки, можно отобразить в виде точек в декартовой системе координат (х, у) - диаграммы рассеяния, являющейся графическим представлением связи между этими измерениями. Часто эти точки образуют почти прямую линию, свидетельствующую о линейной связи между переменными. Для получения линии регрессии - мат. уравнения линии наилучшего соответствия множеству точек диаграммы рассеяния - используются численные методы. После выведения линии регрессии появляется возможность предсказывать значения одной переменной по известным значениям другой и, к тому же, оценивать точность предсказания.

Коэффициент корреляции (r) - это количественный показатель тесноты линейной связи между двумя переменными. Методики вычисления коэффициентов корреляции исключают проблему сравнения разных единиц измерения переменных. Значения r изменяются в пределах от -1 до +1. Знак отражает направление связи. Отрицательная корреляция означает наличие обратной зависимости, когда с увеличением значений одной переменной значения др. переменной уменьшаются. Положительная корреляция свидетельствует о прямой зависимости, когда при увеличении значений одной переменной увеличиваются значения др. переменной. Абсолютная величина r показывает силу (тесноту) связи: r = ±1 означает прямолинейную зависимость, а r = 0 указывает на отсутствие линейной связи. Величина r2 показывает процент дисперсии одной переменной, к-рый можно объяснить вариацией др. переменной. Психологи используют r2, чтобы оценить полезность конкретной меры для предсказания.

Коэффициент корреляции Пирсона (r) предназначен для интервальных данных, полученных в отношении предположительно нормально распределенных переменных. Для обработки др. типов данных имеется целый ряд др. корреляционных мер, напр. точечно-бисериальный коэффициент корреляции, коэффициент j и коэффициент ранговой корреляции (r) Спирмена. Корреляции часто используются в психологии как источник информ. для формулирования гипотез эксперим. исслед. Множественная регрессия, факторный анализ и каноническая корреляция образуют родственную группу более современных методов, ставших доступными практикам благодаря прогрессу в области вычислительной техники. Эти методы позволяют анализировать связи между большим числом переменных.

Теория статистического вывода

Этот раздел С. включает систему методов получения выводов о больших группах (фактически, генеральных совокупностях) на основе наблюдений, проведенных в группах меньшего размера, называемых выборками. В психологии статистический вывод служит двум главным целям: 1) оценить параметры генеральной совокупности по выборочным статистикам; 2) оценить шансы получения определенного паттерна результатов исследования при заданных характеристиках выборочных данных.

Среднее является наиболее часто оцениваемым параметром генеральной совокупности. В силу самого способа вычисления стандартной ошибки, выборки большего объема обычно дают меньшие стандартные ошибки, что делает статистики, вычисленные по большим выборкам, несколько более точными оценками параметров генеральной совокупности. Пользуясь стандартной ошибкой среднего и нормированными (стандартизованными) распределениями вероятностей (такими как t-распределение), можно построить доверительные интервалы - области значений с известными шансами попадания в них истинного генерального среднего.

Оценивание результатов исследования. Теорию статистического вывода можно использовать для оценки вероятности того, что частные выборки принадлежат известной генеральной совокупности. Процесс статистического вывода начинается с формулирования нулевой гипотезы (H0), состоящей в предположении, что выборочные статистики получены из определенной совокупности. Нулевая гипотеза сохраняется или отвергается в зависимости от того, насколько вероятным яв-ся полученный результат. Если наблюдаемые различия велики относительно величины изменчивости выборочных данных, исследователь обычно отвергает нулевую гипотезу и делает вывод о крайне малых шансах того, что наблюдаемые различия обязаны своим происхождением случаю: результат является статистически значимым. Вычисляемые критериальные статистики с известными распределениями вероятностей выражают отношение между наблюдаемыми различиями и изменчивостью (вариабельностью).

Параметрические статистики. Параметрические С. могут использоваться в тех случаях, когда удовлетворяются два требования: 1) в отношении изучаемой переменной известно или, по крайней мере, можно предположить, что она имеет нормальное распределение; 2) данные представляют собой интервальные измерения или измерения отношений.

Если среднее и стандартное отклонение генеральной совокупности известно (хотя бы предположительно), можно определить точное значение вероятности получения наблюдаемого различия между известным генеральным параметром и выборочной статистикой. Нормированное отклонение (z-оценку) можно найти путем сравнения со стандартизованной нормальной кривой (называемой также z-распределением).

Поскольку исследователи часто работают с малыми выборками и поскольку параметры генеральной совокупности редко известны, стандартизованные t-распределения Стьюдента обычно используются чаще нормального распределения. Точная форма t-распределения варьирует в зависимости от объема выборки (точнее, от числа степеней свободы, т. е. числа значений, к-рые можно свободно изменять в данной выборке). Семейство t-распределений можно использовать для проверки нулевой гипотезы, состоящей в том, что две выборки были извлечены из одной и той же совокупности. Такая нулевая гипотеза типична для исследований с двумя группами испытуемых, напр. эксперим. и контрольной.

Когда в исслед. задействовано больше двух групп, можно применить дисперсионный анализ (F-критерий). F - это универсальный критерий, оценивающий различия между всеми возможными парами исследуемых групп одновременно. При этом сравниваются величины дисперсии внутри групп и между группами. Существует множество post hoc методик выявления парного источника значимости F-критерия.

Непараметрические статистики. Когда не удается соблюсти требования адекватного применения параметрических критериев или когда собираемые данные являются порядковыми (ранговыми) или номинальными (категориальными), используют непараметрические методы. Эти методы параллельны параметрическим в том, что касается их применения и назначения. Непараметрические альтернативы t-критерию включают U-критерий Манна-Уитни, критерий Уилкоксона (W) и критерий с2 для номинальных данных. К непараметрическим альтернативам дисперсионного анализа относятся критерии Краскела - Уоллеса, Фридмана и с2. Логика применения каждого непараметрического критерия остается той же самой: соответствующая нулевая гипотеза отвергается в том случае, если расчетное значение критериальной статистики выходит за пределы заданной критической области (т. е. оказывается менее вероятным, чем предполагалось).

Так как все статистические выводы основаны на оценках вероятности, возможны два ошибочных исхода: ошибки I рода, при к-рых отвергается истинная нулевая гипотеза, и ошибки II рода, при к-рых сохраняется ложная нулевая гипотеза. Первые имеют следствием ошибочное подтверждение гипотезы исслед., а последние - неспособность распознать статистически значимый результат.

См. также Дисперсионный анализ, Меры центральной тенденции, Факторный анализ, Измерение, Методы многомерного анализа, Проверка нулевой гипотезы, Вероятность, Статистический вывод

А. Майерс

Смотреть что такое "Статистика в психологии (statistics in psychology)" в других словарях:

Содержание 1 Биомедицина и науки о жизни (Biomedical and Life Sciences) 2 З … Википедия

Эта статья содержит незавершённый перевод с иностранного языка. Вы можете помочь проекту, переведя её до конца. Если вы знаете, на каком языке написан фрагмент, укажите его в этом шаблоне … Википедия

Математическая статистика - Наука о том, как систематизировать и использовать статистические данные для научных и прикладных целей.

Математическая статистика в психологии

В психологии как науке математическая статистика применяется очень широко. С помощью тех или иных способов, например тестирования, разным особенностям поведения человека сопоставляются числа (шкалируются), и с этими числами уже работают методами математической статистики. После применения этих методов получаются новые данные, которые следует осмыслить.

Без применения математической статистики психология была бы довольно плоской и малоинформативной наукой, основанной на домыслах и спекуляциях (как это, например, имеет место быть в психоанализе). Разумеется, использование математической статистики не является "противоядием" против домыслов и спекуляций, однако предмет рассуждений становится значительно богаче.

Рассмотрим типичный и простой случай использования математической статистики. Допустим, кто-то провел исследование группы школьников. В числе прочих были найдены такие параметры, как экстраверсия-интроверсия и уровень интеллекта. Психолога-исследователя заинтересовало, а как связаны эти параметры между собой. Правда ли, что интроверты в среднем умнее экстравертов? Для этого группу испытуемых (выборку) можно поделить на две подгруппы: экстравертов и интровертов. Далее по каждой подгруппе находится среднее арифметическое по уровню интеллекта. Если, скажем, у интровертов в среднем IQ выше, значит, они умнее экстравертов. Это один подход. Другой может состоять в том, чтобы разделить испытуемых на подгруппу с высоким IQ (более 100) и низким (менее 100), а потом посчитать среднее по экстраверсии-интроверсии в каждой группе. Третий подход может состоять в том, чтобы вместо деления на подгруппы и высчитывания в них средних задействовать более сложный метод – корреляционный анализ. Все эти три методы по-разному, но покажут одну и ту же связь.

Математическая статистика позволяет делать интересные, иногда удивительные открытия. Продолжим наш гипотетический пример. Предположим, что психолог нашел парадоксальный результат, который противоречит с его прошлым опытом, знаниями. Скажем, он установил, что в одной школе экстраверты умнее интровертов, хотя во всех других школах было наоборот. Почему так? Дотошный психолог может начать свое расследование и установит, что, к примеру, это связано с тем, что в этой школе экстраверты ходят на факультатив по физике (потому что там «заводной учитель») и развивают свой интеллект, а интроверты ходят на факультатив по литературе (потому что там «душевный учитель»), где развивают другие качества своей души. Может ли, например, психоаналитик дойти до такого открытия? Крайне маловероятно.

В психологических исследованиях в расчет берутся не только такие чисто психологические параметры, как, скажем, интеллект, экстравертированность или тревожность. Могут использоваться и такие данные, как возраст, пол, уровень образования, рост, вес, физическая сила, политические взгляды, стаж работы и многое другое. Часто бывает, что именно без таких непсихологических показателей исследования оказываются неполными, малоинформативными. Также часто бывает, что представители других наук (например, социологии или биологии) тоже используют психологические параметры в своих исследованиях.

Математическая статистика позволяет много вещей:

Практические психологи в своей работе обычно ограничиваются нахождением средней арифметической, с разделением на подгруппы (как в примере выше). Ученые-психологи используют самый разнообразный арсенал методов математической статистики. Рассмотрим основные.

Нахождение средней арифметической

Самый банальный и простой метод. Показатели (например, рост испытуемых) складываются, затем делятся на число испытуемых. Несмотря на простоту, метод, конечно, очень информативный и наглядный. Наглядность – важное качество метода для практического психолога. Когда он представляет результаты своих исследований заказчику (например, директору школы), тот далеко не всегда способен понять сущность корреляционного или дисперсионного анализа. Разделение испытуемых на подгруппы по произвольному основанию усиливает потенциал средней арифметической, позволяя закрыть большинство потребностей исследователя.

Нахождение моды и медианы

Предположим, мы обследовали 1000 студентов – измеряли их рост с точностью до сантиметра. Эти данные заносили в таблицу. Если в таблице чаще всего встречается значение, скажем, 172 сантиметра, это и есть мода нашей выборки. Аналогичным, кстати, образом слово "мода" используется и в быту: если в этом сезоне чаще всего можно встретить шапочки красного цвета, значит это мода, хотя на долю этих шапочек может приходиться всего лишь 20 или 30 процентов.

В психологических исследованиях обычно мода находится где-то рядом со средней арифметической. Если мода 172 см, то и средняя будет около того. Чем больше выборка, тем ближе мода и среднее арифметическое.

Далее. Предположим, мы поделили своих студентов на две равные группы: в первой группе 500 низких студентов, во второй группе 500 высоких студентов. Значение роста, которое приходится на 500-го или 501-го студента и есть медиана . Медиана обычно тоже находится рядом со средней арифметической.

Выявление рассеяния значений

Как известно, средняя температура по больнице не так уж важна. И в хорошей больнице, где лечат хорошо, средняя температура может быть 36,6°C; и в плохой может быть такая же: просто у кого-то жар в 40 °C, а кто-то уже умер, и у него 18°C.

Самый простой способ оценить рассеяние выборки – найти ее размах (иначе – разброс). Если в нашей выборке самый низкий студент имеет рост 148 см, а самый высокий 205 см, значит размах выборки составит 205-148=57 см. Это величина важна в первую очередь для того, чтобы оценить, в каких рамках вообще меняется данный параметр.

Далее. Предположим такую ситуацию. Лет через двадцать по прихоти какого-нибудь богатого человека у него появятся дети-клоны. Ещё через двадцать лет они поступят в университет. И будет в университете выборка студентов объемом 1000 человек, из которых 998 имеют рост 177 см, один – 148 см, один – 205 см. По основным параметрам – средней арифметической, моде, медиане, размаху – эта выборка может не отличаться от другой выборки студентов (там будут такие же значения). Но при этом во второй (нормальной) выборке будет какое-то количество студентов с ростом 150-160 см, какое-то с ростом 180-190 см и т.д. Так что же, получается, что с точки зрения математической статистики эти группы одинаковые?

Одного взгляда на этот рисунок достаточно, чтобы понять, что группы различаются по рассеянию значений. Поэтому в статистике есть более точный инструмент для оценки рассеивания – дисперсия . Дисперсию исчисляют так: находят среднее арифметическое, потом для каждого случая находят отклонение от среднего, возводят это значение в квадрат, в конце делят на общее количество случаев. Из значения дисперсии легко получить стандартное отклонение : оно есть квадратный корень из дисперсии. Стандартное отклонение обозначает, что понятно, стандартное отклонение: то есть мера того, насколько в среднем значения вообще отклоняются.

Стандартное отклонение измеряется в тех же самых единицах, что и сам параметр. В первой нашей гипотетической группе, где почти все студенты одинаковы, стандартное отклонение будет крайне малым (менее 1 см). Во второй группе будет значительно больше – сантиметров 10-15. Если нам скажут, что средний рост студентов составляет 175 см при стандартном отклонении 12 см, мы будем знать, что большинство студентов (примерно 2/3) находится в диапазоне от 163 до 187 см.

t-критерий Стьюдента

Предположим, мы решили провести эксперимент такого рода. Мы взяли группу испытуемых. Перед началом эксперимента протестировали их, скажем, на уровень креативности. Далее они целый месяц занимались по часу в день рисованием. В конце эксперимента мы опять проверили их на уровень креативности. Был замечен результат, но довольно малый, и скептики стали нам заявлять, что уровень креативности не повысился, небольшое повышение средней арифметической это всего лишь случайность.

Для таких ситуаций придумали разные критерии. Один из них – наиболее популярный – это t-критерий Стьюдента. В числителе у него разница средних арифметических. В знаменателе – корень из суммы квадратов дисперсий (имеется в виду первый и второй случай тестирования). Чем больше разница между средними арифметическими, тем лучше (наш труд не остался напрасным), и чем меньше разброс значений в обоих случаях диагностики, тем тоже лучше: когда разброс значений больше, тогда и случайные колебания тоже больше.

Для применения данного критерия есть существенное ограничение – распределение показателей должно быть близко к так называемому нормальному (колоколообразному).

Существуют специальные критерии для определения степени нормальности распределения.

Корреляция

В психологии, как наверное ни в одной другой науке, любят находить коэффициенты корреляции. Существует несколько разных подходов, в том числе и для нормального, и для не нормального распределения. Все они показывают степень зависимости одного параметра от другого. Если один параметр (например, вес человека) сильно зависит от другого параметра (например, рост человека), тогда коэффициент корреляции будет близок к +1. Если зависимость обратная (например, чем человек выше, тем менее ловок он), тогда коэффициент корреляции будет стремиться к -1. Если зависимости нет (скажем, удачливость при игре в карты не зависит от роста человека), тогда коэффициент корреляции будет около 0.

Если взять группу испытуемых, зафиксировать их рост и вес, а потом результаты перенести на двухмерный график, то получится примерно следующая картина, которая свидетельствует о том, что корреляция положительная, примерно на уровне +0.5.

Факторный анализ

Наиболее, пожалуй, таинственный анализ. Некоторая загадочность его объясняется тем, что сам он предназначен для того, чтобы найти новый параметр, который многое объясняет, но при этом непосредственно в ходе эксперимента не исследовался. Как правило, в ходе факторного анализа находятся наиболее влиятельные параметры, от которых зависят более мелкие, частные.

Допустим, мы проводили исследование со школьниками. В числе прочих фиксировались следующие параметры: общая успеваемость, успеваемость по точным предметам, успеваемость по гуманитарным предметам, объем кратковременной памяти, объем и распределение внимания, активность мышления, пространственное воображение, общая осведомленность, общительность, тревожность. Если применить корреляционный анализ и составить так называемую матрицу корреляций (где отражена связь каждого параметра с каждым), то можно увидеть, что большинство этих параметров между собой хорошо коррелирует. Исключение составляет последние два, которые с другими связаны слабо. Уже глядя на эту матрицу можно предположить, что за большинством параметров стоит некий один общий (сверх-параметр), который на них на всех влияет. Мы проводим процедуру факторного анализа, и после этого в нашей матрице появляется еще один столбец – столбец без названия. Этот загадочный параметр очень хорошо коррелирует со всеми (кроме общительности и тревожности). После некоторого творческого раздумья психолог приходит к единственно возможной здесь интерпретации – загадочный параметр это есть интеллект. Он и влияет на все остальное, влияние его сильное, хотя и не стопроцентное.

Существуют методы факторного анализа, которые помогают выявить не один, а несколько факторов, которые влияют на другие параметры. Часто так бывает, конечно, что загадочный параметр оказывается не таким уж и загадочным, а полностью совпадает с одним из тех параметров, которые фиксировались. Но иногда бывает и так, что придется долго поломать голову прежде, чем удастся интерпретировать этот секретный фактор.

Факторный анализ применяется в основном учеными для глубокого понимания предмета исследования. При этом следует учитывать, что для точности результата необходимо довольно большое количество испытуемых: желательно, чтобы количество испытуемых в разы превышало количество параметров.

С помощью факторного анализа можно изучать качество психологических тестов. Если взять, например, какой-нибудь личностный опросник с несколькими параметрами, подвергнуть эти параметры факторному анализу, то может всплыть некий странный общий фактор, влияющий на все параметры. Значимого психологического смысла он может не иметь – это просто тенденция испытуемого отвечать так или иначе по формальному признаку (кто-то отвечает вдумчиво, кто-то склонен выбирать первые пункты из вариантов, кто-то последние). Большое влияние этого общего фактора может говорить о недостаточно качественной проработке заданий.

Литература

Ермолаев О. Ю. Математическая статистика для психологов: Учебник. - 2-е изд. испр. - М.: МПСИ, Флинта, 2003. - 336 с.

Как известно, связь психологии и
математики в последние годы становится
все более тесной и многоплановой.
Современная практика показывает, что
психолог должен не только оперировать
методами математической статистики, но и
представлять предмет своей науки с точки
зрения ""царицы наук"", в противном случае
он будет носителем тестов, выдающих
готовые результаты без их осмысления.

Математические методы – это
обобщающее название комплекса
математических дисциплин, объединенных
для изучения социальных и
психологических систем и процессов.

Основные математические методы, рекомендуемые к
преподаванию студентам-психологам:
Методы математической статистики. Сюда
входят корреляционный анализ, однофакторный
дисперсионный анализ, двухфакторный дисперсионный анализ, регрессионный анализ и факторный
анализ.
Математическое моделирование.
Методы теории информации.
Системный метод.

Психологические измерения

В основе применения математических
методов и моделей в любой науке лежит
измерение. В психологии объектами
измерения являются свойства системы
психики или ее подсистем, таких, как
восприятие, память, направленность
личности, способности и т.д.
Измерение - это приписывание
объектам числовых значений, отражающих
меру наличия свойства у данного объекта.

Назовем три важнейших свойства
психологических измерений.
1. Существование семейства шкал,
допускающих различные группы
преобразований.
2. Сильное влияние процедуры измерения на
значение измеряемой величины.
3. Многомерность измеряемых
психологических величин, т. е. существенная
их зависимость от большого числа
параметров.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Вопросы:
1. Методы первичной статистической

2. Методы вторичной статистической
обработки результатов эксперимента

МЕТОДЫ ПЕРВИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Методами статистической обработки
результатов эксперимента называются
математические приемы, формулы,
способы количественных расчетов, с
помощью которых показатели,
получаемые в ходе эксперимента, можно
обобщать, приводить в систему, выявляя
скрытые в них закономерности.

Некоторые из методов математикостатистического анализа позволяют вычислять
так называемые элементарные
математические статистики,
характеризующие выборочное распределение
данных, например
*выборочное среднее,
*выборочная дисперсия,
*мода,
*медиана и ряд других.

10.

Иные методы математической статистики,
например:
дисперсионный анализ,
регрессионный анализ,
позволяют судить о динамике изменения
отдельных статистик выборки.

11.

С
помощью третьей группы методов:
корреляционного анализа,
факторного анализа,
методов сравнения выборочных данных,
можно достоверно судить о
статистических связях,существующих
между переменными величинами, которые
исследуют в данном эксперименте.

12.

Все методы математико-статистического анализа условно
делятся на первичные и вторичные
Первичными называют методы, с помощью
которых можно получить показатели,
непосредственно отражающие результаты
производимых в эксперименте измерений.
Вторичными называются методы
статистической обработки, с помощью
которых на базе первичных данных выявляют
скрытые в них статистические
закономерности.

13. Рассмотрим методы вычисления элементарных математических статистик

Выборочное среднее значение как
статистический показатель представляет
собой среднюю оценку изучаемого в
эксперименте психологического качества.
Выборочное среднее определяется при помощи
следующей формулы:
n
1
x k
n k 1

14.

Пример. Допустим, что в результате
применения психодиагностической методики
для оценки некоторого психологического
свойства у десяти испытуемых мы получили
следующие частные показатели степени
развитости данного свойства у отдельных
испытуемых:
х1= 5, х2 = 4, х3 = 5, х4 = 6, х5 = 7, х6 = 3, х7 = 6, х8=
2, х9= 8, х10 = 4.
10
1
50
х xi
5.0
10 k 1
10

15.

Дисперсия как статистическая, величина
характеризует, насколько частные
значения отклоняются от средней
величины в данной выборке.
Чем больше дисперсия, тем больше
отклонения или разброс данных.
2
S
1
2
(xk x)
n k 1
n

16. СТАНДАРТНОЕ ОТКЛОНЕНИЕ

Иногда вместо дисперсии для выявления
разброса частных данных относительно
средней используют производную от
дисперсии величину, называемую
стандартное отклонение. Оно равно
квадратному корню, извлекаемому из
дисперсии, и обозначается тем же
самым знаком, что и дисперсия, только без
квадрата
n
S
S
2
2
x
k x)
k 1
n

17. МЕДИАНА

Медианой называется значение изучаемого
признака, которое делит выборку, упорядоченную
по величине данного признака, пополам.
Справа и слева от медианы в упорядоченном ряду
остается по одинаковому количеству признаков.
Например, для выборки 2, 3,4, 4, 5, 6, 8, 7, 9
медианой будет значение 5, так как слева и справа
от него остается по четыре показателя.
Если ряд включает в себя четное число признаков,
то медианой будет среднее, взятое как полусумма
величин двух центральных значений ряда. Для
следующего ряда 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 медиана
будет равна 3,5.

18. МОДА

Модой называют количественное
значение исследуемого признака,
наиболее часто встречающееся в выбор
К примеру, в последовательности значений
признаков 1, 2, 5, 2, 4, 2, 6, 7, 2 модой
является значение 2, так как оно
встречается чаще других значений -
четыре раза.

19. ИНТЕРВАЛ

Интервалом называется группа упорядоченных по
величине значений признака, заменяемая в процессе
расчетов средним значением.
Пример. Представим следующий ряд частных
признаков: О, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7,
7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Этот ряд включает в
себя 30 значений.
Разобьем представленный ряд на шесть подгрупп
по пять признаков в каждом
Вычислим средние значения для каждой из пяти
образованных подгрупп чисел. Они соответственно
будут равны 1,2; 3,4; 5,2; 6,8; 8,6; 10,6.

20. Контрольное задание

Для следующих рядов вычислить среднее,
моду, медиану, стандартное отклонение:
1) {3, 4, 5, 4, 4, 4, 6, 2}
2) {10, 40, 30, 30, 30, 50, 60, 20}
3) {15, 15, 15, 15, 10, 10, 20, 5, 15}.

21. МЕТОДЫ ВТОРИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

С помощью вторичных методов
статистической обработки
экспериментальных данных непосредственно
проверяются, доказываются или
опровергаются гипотезы, связанные с
экспериментом.
Эти методы, как правило, сложнее, чем
методы первичной статистической обработки,
и требуют от исследователя хорошей
подготовки в области элементарной
математики и статистики.

22.

Регрессионное исчисление -
это метод математической
статистики, позволяющий
свести частные, разрозненные
данные к некоторому
линейному графику,
приблизительно отражающему
их внутреннюю взаимосвязь, и
получить возможность по зна
чению одной из переменных
приблизительно оценивать
вероятное значение другой
переменной.

Математические методы в психологии используются для обработки данных исследований и установления закономерностей между изучаемыми явлениями. Даже простейшее исследование не обходится без математической обработки данных.

Обработка данных может осуществляться вручную, а может - с применением специального программного обеспечения. Итоговый результат может выглядеть как таблица; методы в психологии позволяют и графически отображать полученные данные. Для разных (количественных, качественных и порядковых) применяются разные инструменты оценки.

Математические методы в психологии включают в себя как позволяющие установить числовые зависимости, так и методы статистической обработки. Остановимся подробнее на наиболее распространенных из них.

Для того чтобы измерить данные, прежде всего, необходимо определиться со шкалой измерений. И здесь используются такие математические методы в психологии, как регистрация и шкалирование , заключающиеся в выражении исследуемых явлений в числовых показателях. Выделяют несколько типов шкал. Однако для математической обработки пригодны лишь некоторые из них. Это, главным образом, количественная шкала, которая позволяет измерять степень выраженности конкретных свойств у исследуемых объектов и в числовом отношении выражать разницу между ними. Простейший пример - измерение коэффициента интеллекта. Количественная шкала позволяет проводить операцию ранжирования данных (см. далее). При ранжировании данные из количественной шкалы переводятся в номинальную (например, низкое, среднее или высокое значение показателя), при этом обратный переход уже невозможен.

Ранжирование - это распределение данных в порядке убывания (возрастания) признака, который оценивается. При этом используется количественная шкала. Каждому значению присваивается определенный ранг (показателю с минимальным значением - ранг 1, следующему значению - ранг 2, и так далее), после чего становится возможным перевод значений из количественной шкалы в номинальную. Например, измеряемый показатель - уровень тревожности. Было протестировано 100 человек, полученные результаты проранжированы, и исследователь видит, сколько человек имеют низкий (высокий или средний) показатель. Однако такой способ представления данных влечет за собой частичную утрату информации по каждому респонденту.

Корреляционный анализ - это установление взаимосвязи между явлениями. При этом измеряется, как изменится одного показателя при изменении показателя, во взаимосвязи с которым он находится. Корреляция рассматривается в двух аспектах: по силе и по направлению. Она может быть положительной (при возрастании одного показателя возрастает и второй) и отрицательной (при возрастании первого второй показатель убывает: например, чем выше уровень тревожности у индивида, тем меньше вероятность, что он займет лидирующее положение в группе). Зависимость может быть линейной, или, что бывает чаще, выражаться кривой. Связи, которые помогают установить могут быть неочевидны на первый взгляд, если применяются иные методы математической обработки в психологии. В этом его главное достоинство. К недостаткам можно отнести большую трудоемкость в связи с необходимостью использования немалого числа формул и тщательных вычислений.

Факторный анализ - это еще один который позволяет прогнозировать вероятное влияние различных факторов на исследуемый процесс. При этом все факторы воздействия изначально принимаются как имеющие равное значение, а степень их влияния вычисляется математически. Такой анализ позволяет установить общую причину изменчивости нескольких явлений сразу.

Для отображения полученных данных могут применяться методы табулирования (создания таблиц) и графического построения (диаграммы и графики, которые не только дают наглядное представление о полученных результатах, но и позволяют прогнозировать ход процесса).

Главным условиями, при которых вышеперечисленные математические методы в психологии обеспечивают достоверность исследования, являются наличие достаточной выборки, точность измерений и правильность производимых вычислений.