Болезни Военный билет Призыв

Определить среднее значение и показатели вариации. Средние величины и показатели вариации

Понятие средней величины большинству людей хорошо известно. Обычно среднюю величину воспринимают как отражение общего в значениях признака у множества единиц. Таковы, например, средний возраст жителя страны, средний размер семьи в районе, средний размер прибыли предприятия.

Действительно, средняя величина - это обобщающая оценка признака у множества объектов, которая отражает его характерное значение. Характерное значение фиксирует типическую величину признака, в котором находит выражение своеобразие данной группы объектов и ее отличие от значений признака у других групп.

Например, средняя заработная плата работников в разных видах деятельности в 2015 г. в России составила, тыс. руб. :

  • сельское хозяйство - 19,5;
  • добыча полезных ископаемых - 63,7;
  • обрабатывающие производства - 31,8;
  • строительство - 29,9.

В разном уровне оплаты, т.е. в разной средней заработной плате работника, проявляются особенности организации труда в разных видах деятельности и в конечном счете - общественное признание того или иного труда.

В приведенном примере даны средние, которые рассчитаны по группам, состоящим из объектов одного вида деятельности и которые в этом смысле могут быть названы однородными. Подобные средние называются групповыми. Они интересны тем, что связаны с конкретными объектами и условиями их существования. Когда производится расчет групповых средних, то при одинаковых, например, условиях труда происходит взаимное погашение влияния случайных причин на заработную плату. В то же время при расчете групповой средней усиливается влияние особых, специфических условий, поскольку они действуют постоянно и в одном направлении. В групповой средней отражаются особенности однородных объектов и погашается случайность. Именно но этим причинам групповые средние находят широкое практическое применение.

Когда речь заходит об общей средней но множеству, включающему несколько однородных групп, то при ее расчете погашается действие не только случайных, но и групповых особенностей. Так, общая средняя заработная плата занятого в экономике страны в 2015 г. составила 34 тыс. руб. В ней не отражаются особенности оплаты труда в разных видах деятельности, а показывается лишь общий уровень оплаты труда занятых в ЭКОНОМИКС.

Сравним среднюю заработную плату работников разных видов деятельности в 2010 и 2015 гг. в экономике РФ (табл. 6.1).

Таблица 6.1

Средняя заработная плата в разных видах деятельности и ее изменения,

Источник: Россия в цифрах. 2016. Табл. 7.7.

В темпах изменения средних по видам деятельности, т.е. в групповых средних, проявляются частные закономерности изменения заработной платы: в интервале от 1,41 до 1,82 раза. Сравнивая изменение общей средней, устанавливаем общую закономерность изменения уровня заработной платы в экономике страны: увеличение в 1,62 раза.

Всесторонний анализ предполагает совместное использование общих и групповых средних: это позволяет характеризовать общие закономерности развития и особенности их проявления в конкретных условиях.

Расчет средней выполняется в два этапа. На первом этапе производится обобщение индивидуальных значений изучаемого признаках, у множества, состоящего из п единиц: {х-}. На втором этапе полученный результат распределяется между множеством этих п единиц: {х,} + п - х.

При обобщении значений признака у п объектов множества {х,} происходит взаимное погашение влияния случайных причин и усиливается действия неслучайных систематических факторов. При распределении обобщенного значения признака между п единицами множества {х; -} п определяется средняя типическая его величина х у одной абстрактной единицы. В результате имеем либо групповую среднюю по группе однородных объектов: {х; }-н п = х, либо общую среднюю для всего изучаемого множества {х,} -г- п = х.

Для расчета средних существуют несколько способов, которые отличаются порядком обобщения и распределения.

Средняя арифметическая обобщает индивидуальные значения x f суммированием, а равномерное распределение - делением суммы дг, на число

единиц, участвующих в расчете:

Частое использование арифметической средней объясняется ее особыми свойствами, которые делают ее расчет более простым, а результат - легко проверяемым.

Сумма отклонений значений признака от арифметической средней равна нулю:

Если значения признака х, изменить на число Л, то арифметическая

средняя изменится на это же число:

Если значения признака х, увеличить в А раз, то арифметическая средняя увеличится в А раз:

Если значения признака Xj уменьшить в А раз, то арифметическая средняя также уменьшится в

Средняя гармоническая используется в тех случаях, когда расчет выполняется по значениям признака, который связан с изучаемым признаком обратной зависимостью, т.е. при условии, что V определяется по значениям признака

Например, показатель выработки продукции на работника:

Показатель трудоемкости единицы продукции:

Показатели выработки и трудоемкости находятся в обратной зависимости: . Поэтому при расчете средней выработки по значениям трудоемкости следует применять гармоническую среднюю

Средняя квадратическая применяется в случаях, когда при обобщении значений признака А/, необходимо избежать нулевого результата, так как квадратов рассчитывают среднюю: , а из полученной

средней извлекают квадратный корень:

Наиболее часто квадратическая средняя применяется при расчете показателей вариации и оценок различий структур множества.

Средняя геометрическая обобщает значения признака путем расчета

их произведения: , а из результата извлекается

корень п -й степени:

Наиболее логически оправдано применение геометрической средней при расчете из цепных темпов роста среднего темпа роста:

Разный порядок расчета средних объясняет разные значения результата. Свойство мажорантности средних величин устанавливает зависимость величины средней от показателя ее степени: чем выше показатель степени средней, тем больше ее значение. Каждая из рассмотренных средних представляет собой разновидность степенной средней (табл. 6.2).

Таблица 6.2

Формы средних величин

Форма средней

Расчетная формула

Показатель степени средней (с)

Квадратическая

Арифметическая

Геометрическая

Гармоническая

В качестве иллюстрации свойства мажорантности выполним по данным о численности населения федеральных округов РФ расчет разных средних (табл. 6.3).

Приведенный пример подтверждает, что с увеличением степени средней: от наименьшей - для гармонической, до наибольшей - для квадратической, величина средней увеличивается. Свойство мажорантности средних можно представить в виде неравенств: V

Из свойства мажорантности следует вывод о том, что выбор способа расчета средней не может быть произвольным. Он должен основываться на смысловом содержании исходных данных и на условиях применения конкретной формы средней.

Известно, что геометрическая средняя используется для обобщения темпов роста, а квадратическая - в тех случаях, когда сумма значений признака равна нулю. Поэтому наиболее востребованными практикой являются арифметическая и гармоническая формы средних.

По особым правилам проводится расчет средних из абсолютных и относительных значений изучаемых характеристик. Рассмотрим особенности расчета средних на примере данных но федеральным округам РФ за 2014 г. (табл. 6.4).

В табл. 6.4 использованы следующие признаки и их обозначения.

Численность занятых в экономике федерального округа, млн человек Р,.

Численность занятых в процентах от численности всего населения федерального округа, % - С,.

Приходится оборота розничной торговли за год в среднем на одного жителя федерального округа, тыс. руб. - Т г

Приходится инвестиций в среднем на одного занятого в экономике федерального округа, тыс. руб. - R r

Таблица 63

Расчет средней численности населения федеральных округов РФ с применением различных средних

Федеральный

Численность

населения

Центральный

Северо-Западный

Северо-Кавказский

Приволжский

Уральский

Федеральный

Численность населения на 01.01.2016

Сибирский

Дальневосточный

Крымский

И 196 529 418,1

Квадратическая средняя (см. формулу (6.1))

Арифметическая средняя (см. формулу (6.2))

Геометрическая средняя (см. формулу (6.3))

Гармоническая средняя (см. формулу (6.4))

Источник: Россия в цифрах. 2016. Табл. 1.3.

Особенность абсолютных значений признака в том, что они непосредственно относятся к единице совокупности и определяют ее абсолютные размеры. Например, для федерального округа как единицы множества абсолютными значениями будут численность населения, численность занятых, стоимость произведенной продукции, стоимость основного капитала, прибыль от реализации продукции и т.п. Приведенные признаки относятся непосредственно к федеральному округу, называются первичными и по их значениям можно определить размеры каждого изучаемого объекта. При обработке абсолютных значений этих признаков точно учитывается размер каждой единицы и поэтому нет никаких ограничений для обобщения их значений путем непосредственного суммирования. Средняя, при расчете которой обрабатываются значения единственного признака, называется простой. Например, простая средняя применяется для расчета средней численности занятых в экономике одного федерального округа (табл. 6.4).

Таблица 6.4

Расчет средних значений экономических показателей по федеральным

округам РФ, 2014 г.

Федеральный округ

Численность занятых в экономике, млн чел.

Численность занятых, % численности всего населения

Приходится оборота розничной торговли за год в среднем на одного жителя, тыс. руб.

Приходится инвестиций в среднем на одного занятого в экономике, тыс. руб.

Центральный

Северо-Запад! i ы й

Се всро - Ка в казс к и й

Приволжский

Уральский

Сибирский

Дальневосточный

Среднее значение

Источник: Россия в цифрах. 2016. Табл. 1.3.

Примечание : знак «х» означает, что данная ячейка не подлежит заполнению.

Расчет выполняется по следующей формуле:

В экономике федерального округа в среднем за 2014 г. было занято 8,5 млн человек.

Средние из относительных значений определяются но более сложной схеме. Особенность относительных значений в том, что они не связаны непосредственно с размерами изучаемых единиц, а без этого учета подсчет точной средней обычно невозможен. В подобных случаях в расчет должны включаться дополнительные значения характеристик, которые отражают абсолютные размеры каждой из изучаемых единиц. В расчете средней помимо изучаемой участвует дополнительная характеристика или вес , поэтому средняя называется взвешенной. При расчете взвешенной средней в качестве веса всегда выступает абсолютная характеристика или первичный признак. Вес позволяет учесть абсолютные размеры каждой единицы и обеспечивает расчет точного значения средней.

В приведенном примере характеристики С, Г, и являются относительными, поэтому прямое суммирование их значений недопустимо. Для определения схемы расчета их средних значений установим порядок расчета их индивидуальных значений.

Расчет процента занятых от численности всего населения выполняется но следующей формуле: В расчетной формуле

неизвестна по условию задачи численность населения. Для определения

ее значения выразим численность населения через численность занятых Р, и известные значения процента занятых от численности всего населения С,:

или

Чтобы определить численность населения в млн человек, необходимо разделить численность занятых в экономике Р, на их долю в численности всего населения С,. Поэтому необходимо значения С, перевести из процентов в доли единицы:

Рассчитаем неизвестное значение численности населения в дополнительной расчетной графе (табл. 6.5, гр. 2).

При известных значениях численности занятых Р, и численности всего

населения расчет процента занятых в буквенной форме имеет вид

Общая средняя С рассчитывается по той же схеме, что и индивидуальные значения характеристики С,-. Разница лишь в том, что при расчете общей средней С используются итоговые значения сравниваемых признаков: численности занятых, млн человек и численности всего населения, млн человек То есть расчет общей средней С но восьми

федеральным округам выполняется по формуле

Расчет средних значений относительных характеристик по экономике РФ в 2014 г.

Таблица 6.5

Федеральный округ

Среднегодовая численность занятых в экономике, млн чел.

Численность

% от численности всего населения

Численность всего населения, млн чел.

Приходится оборота розничной торговли за год в среднем на одного жителя, тыс. ov6.

Оборот розничной торговли за год, млрд руб.

Приходится инвестиций в среднем на одного занятого, тыс. руб.

Инвестиции в экономику за год, млрд руб.

Р г 100%

р г т г т%

Центральный

Северо-Западный

Северо-Кавказский

Приволжский

Уральский

Сибирский

Дальневосточный

Средняя арифметическая

Средняя гармоническая

Составлено и рассчитано по: Россия в цифрах. 2016. Табл. 1.3.

В Экономикс России в 2014 г. доля занятого населения составляла в среднем 47,2% численности всего населения. Расчет выполнен по гармонической средней взвешенной , в которой весом выступил первичный признак P t - численность занятых в экономике.

Аналогичные рассуждения лежат в основе расчета средних значений двух других относительных характеристик: средней стоимости оборота розничной торговли на одного жителя, Т тыс. руб., и средней стоимости инвестиций на одного занятого, R тыс. руб.

Индивидуальные значения стоимости оборота розничной торговли на одного жителя, тыс. руб., рассчитываются как результат сравнения оборота розничной торговли за год, млрд руб., с численностью всего населения, млн человек:

По условию задачи неизвестна стоимость оборота розничной торговли. Поэтому выразим неизвестные значения оборота розничной торговли через известные значения численности всего населения и заданные в условии задачи значения Т г Искомый оборот розничной торговли (товарооборот) есть произведение численности всего населения и величины товарооборота на одного жителя:


Величина оборота розничной торговли измеряется в млрд руб., так как при его расчете численность жителей в млн человек умножаем на товарооборот на одного жителя в тыс. руб.

Определим неизвестные значения оборота розничной торговли за год в гр. 5 табл. 6.5.

Расчет общего среднего значения оборота розничной торговли на одного жителя, тыс. руб., Т , выполним по итоговым значениям суммы оборота

розничной торговли, млрд руб., , и суммарной численности всего

населения, млн чел., . Расчетная формула имеет вид

В 2014 г. на одного жителя в Российской Федерации приходилось в среднем 181,5 тыс. руб. оборота розничной торговли. При расчете использована арифметическая взвешенная средняя, а весом выступают абсолютные значения общей численности населения:

Для расчета стоимости инвестиций на одного занятого необходимо стоимость инвестиций, млрд руб., сравнить с численностью занятых в экономике, млн человек:

По условию неизвестна стоимость инвестиций, поэтому для расчета ее значений следует выразить инвестиции через известные значения численности занятых Pj и через заданные в условии задачи величины инвестиций на одного занятого /?,:

Подсчет неизвестного значения общей суммы инвестиций выполним в гр. 7 табл. 6.5.

Рассчитанные значения общей суммы инвестиций позволяют определять индивидуальные значения инвестиций на одного занятого по формуле

Для РФ в целом среднее значение инвестиций в расчете на одного занятого К рассчитаем как отношение суммы инвестиций за год?/? Р к сумме численности занятых


В 2014 г. инвестиции в расчете на одного занятого составили в среднем 198,8 тыс. руб. При расчете использована средняя арифметическая взвешенная, весом являются абсолютные значения численности занятых.

Завершающим этапом расчета средних является проверка правильности результата. Логическая проверка основана на анализе схемы расчета индивидуальных значений характеристики и на определении смысла признака- веса. Счетный контроль устанавливает, находится ли средняя в интервале от минимального до максимального значения изучаемого признака. Если выполняется условие X mjn то расчет средней выполнен верно. Если данное условие не выполняется, то в расчете допущены ошибки, которые необходимо выявить и исправить.

В нашем примере (см. табл. 6.5) для всех значений рассчитанных средних данное условие выполняется:

простая арифметическая Р = 8,5, 3,3 Р

взвешенная гармоническая С = 47,2 , 36,3 С 53,2;

взвешенная арифметическая Т = 181,5, 134,7 Т

взвешенная арифметическая R = 198,8, 142,9 R 383,3 .

Это означает, что в определении средних значений не допущено расчетных ошибок, а использование взвешенных средних для расчета средних из относительных величин позволило учесть размеры изучаемых единиц - федеральных округов РФ.

Подводя итог, напомним основные правила построения средних величин.

По абсолютным значениям признака допустим расчет простой средней. Как правило, в большинстве случаев применяется арифметическая средняя. Например, расчет Р.

По относительным значениям расчет выполняется но взвешенной средней, в которой весом являются абсолютные значения первичного признака, связанного по смыслу с изучаемым признаком. Например, расчет С, Т и R.

В качестве веса используются значения признака, по отношению к которому рассчитаны относительные значения вторичного признака. Вес может отображаться весьма просто, как, например, при расчете С и R, где в качестве веса использована численность занятых Р г Но он может иметь и сложное отображение, как, например, при расчете Г, у которого весом

была численность всего населения. Каким бы образом ни отображался

признак-вес, он всегда должен представлять собой абсолютную оценку изучаемого объекта.

Выбор формы средней в большинстве случаев ограничен арифметической или гармонической, так как квадратическая и геометрическая применяются лишь в строго определенных случаях.

Арифметическая форма средней применяется в тех случаях, когда в условии поставленной задачи отсутствуют значения признака, который связан с изучаемым признаком прямой зависимостью, т.е. когда в расчетной формуле индивидуальных значений отсутствуют сведения о ее числителе. Примером могут быть расчеты Р, Т и R.

Если в расчетной формуле отсутствуют данные о знаменателе отношения, то используется гармоническая средняя. В этом случае изучаемый признак связан с неизвестным признаком обратной зависимостью, как, например, при расчете С.

Правильно выполненные расчеты позволяют получить точные средние значения, которые отражают характерную величину признака и представляют интерес при решении аналитических и прогнозных задач.

  • См.: Россия в цифрах. 2016. Табл. 7.7.

Вариация – это изменение (колеблемость) значений признака в пределах изучаемой совокупности при переходе от одного объекта (группы объектов), или от одного случая к другому. Абсолютные и относительные показатели вариации, характеризующие колеблемость значений варьирующего признака, позволяют, в частности, измерить степень связи и взаимозависимости между признаками, определить степень однородности совокупности, типичности и устойчивости средней, определить величину погрешности выборочного наблюдения, статистически оценить закон распределения совокупности и т. п.

В этой теме необходимо уяснить сущность (смысл), назначение и способы вычисления каждого показателя вариации, рассматриваемого в курсе теории статистики: размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсию), среднее квадратическое отклонение, относительные коэффициенты вариации (коэффициент осцилляции, коэффициент среднего линейного отклонения, коэффициент вариации).

Размах вариации (R ) представляет собой разность между максимальным (х max) и минимальным (х min) значениями признака в совокупности (в ряду распределения):

R = х max - х min. (5.1)

Мерой других показателей вариации является разность не между крайними значениями признака, а средняя разность между каждым значением признака и средней величиной этих признаков. Разность между отдельным значением признака и средней называют отклонением.

Среднее линейное отклонение вычисляется по следующим формулам:

по индивидуальным (несгруппированным) данным

; (5.2)

по вариационным рядам (сгруппированным данным)

. (5.3)

Так как алгебраическая сумма отклонений индивидуальных значений признака от средней (согласно нулевому свойству) всегда равна нулю, то при расчете среднего линейного отклонения используется арифметическая сумма отклонений, взятая по модулю, т.е.
.

Среднее линейное отклонение имеет ту же размерность, что и признак, для которого оно исчисляется.

Дисперсия и среднее квадратическое отклонение. Среднее линейное отклонение относительно редко применяется для оценки вариации признака. Поэтому обычно вычисляются дисперсия ( 2) и среднее квадратическое отклонение (). Эти показатели применяются не только для оценки вариации признака, но и для измерения связи между ними, для оценки величины ошибки выборочного наблюдения и других целей.

Дисперсия признака рассчитывается по формулам:

по первичным данным

; (5.4)

по вариационным рядам

. (5.5)

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

по первичным данным

; (5.6)

по вариационным рядам

. (5.7)

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, имеет ту же размерность, что и сам исходный признак.

Дисперсию можно определить и как разность между средним квадратом вариантов и квадратом их средней величины, т. е.
. (5.8)

В этом случае по первичным данным дисперсия равна:

(5.9)

Применительно к сгруппированным данным, расчет дисперсии этим способом в развернутом виде представим в таком виде:

. (5.10)

Для рядов распределения с равными интервалами значение дисперсии можно вычислить, применяя способ условных моментов, т. е.

, (5.11)

где
- первый условный момент; (5.12)

- второй условный момент. (5.13)

Среднее квадратическое отклонение по способу условных моментов определяется по формуле:

(5.14)

Преобразуя выражение расчета дисперсии по способу условных моментов, получим формулу вида:
(5.15)

На основе одних и тех же исходных данных получим одинаковое значение дисперсии.

Относительные показатели вариации вычисляются как отношение ряда абсолютных показателей вариации к их средней арифметической и выражаются в процентах:

коэффициент осцилляции -
; (5.16)

коэффициент относительного линейного отклонения -
; (5.17)

коэффициент вариации -
. (5.18)

Задача 1 . Рассмотрим способы расчета показателей вариации на основе данных табл. 5.1.

Таблица 5.1. Исходные данные для расчета показателей вариации

Затраты времени на производство деталей мин

Количество деталей, шт. (f)

Середина интервала (х)

; к = 2

Приведенный ряд распределения ранжированный, поэтому здесь легко найти минимальное значение признака, оно равно 8 мин. (10 - 2), и максимальное, равное 18 мин. (16 + 2). Значит, размах вариации признака в этом ряду составит 10 мин., т. е.

R = x max – x min = 18 – 8 = 10 мин.

Вычислим среднее линейное отклонение. Прежде всего необходимо вычислить среднюю величину . Все вычисления будем вести в табличной форме (табл. 5.1.), отводя для каждой вычислительной операции графу в таблице.

Поскольку исходные данные представлены рядом распределения, то

мин.

мин.

Покажем способы расчета дисперсии:

а) обычным способом (по определению):

;

б) как разность между средним квадратом и квадратом средней величины:

Для определения величины дисперсии по этой формуле необходимо вычислить средний квадрат вариантов признака по формуле:

;

 2 =178,6 – (13,2) 2 =4,36;

в) по способу условных моментов:

;

;

г) на основе преобразования формулы расчета дисперсии по способу условных моментов имеем:

Дисперсия – число отвлеченное, не имеющее единиц измерения.

Среднее квадратическое отклонение вычислим путем извлечения корня квадратного из дисперсии:

мин.

По способу условных моментов величину среднего квадратического отклонения определим так:

Вычислим относительные показатели вариации:

%;

%;

%.

Основным относительным показателем вариации является коэффициент вариации (V). Он используется для сравнительной оценки меры колеблемости признаков, выраженных в различных единицах измерения.

Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков (в частности альтернативной изменчивости качественных признаков). В этом случае каждая единица изучаемой совокупности либо обладает каким-то свойством, либо нет (например, каждый взрослый человек либо работает, либо нет). Наличие признака у единиц совокупности обозначают 1, а отсутствие –0; долю же единиц совокупности, обладающих изучаемым признаком, обозначают p, а не обладающих им – q. Дисперсия альтернативного признака определяется по формуле:

; (5.19)

p + q = 1 (5.20)

Если, например, доля поступивших в университет равна 30%, а не поступивших – 70%, то дисперсия равна 0,21(0,3 · 0,7). максимальное значение произведения pq равно 0,25 (при условии, когда одна половина единиц обладает данным признаком, а другая половина нет: (0,5 · 0,5 = 0,25).

Способ разложения общей дисперсии. Для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, воспользуемся разложением общей дисперсии на составляющие: на так называемую групповую дисперсию и среднюю из внутригрупповых дисперсий:

, (5.21)

где
– общая дисперсия, характеризующая вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.

Вариацию признака, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия  2 , которая является мерой колеблемости частных средних по группам
вокруг общей средней и исчисляется по формуле:

, (5.22)

где n j – число единиц совокупности в каждой группе;

j – порядковый номер группы.

Вариацию признака, обусловленную влиянием всех прочих факторов, кроме группировочного (факторного), характеризует в каждой группе внутригрупповая дисперсия:

, (5.23)

где i – порядковый номер x и f в пределах каждой группы.

По совокупности в целом средняя из внутригрупповых дисперсий определяется по формуле:

(5.24)

Отношение межгрупповой дисперсии  2 к общей
даст коэффициент детерминации:

(5.25)

который характеризует долю вариации результативного признака, обусловленную вариацией факторного признака, положенного в основание группировки.

Показатель, полученный как корень квадратный из коэффициента детерминации, называется коэффициентом эмпирического корреляционного отношения, т.е.:

(5.26)

Он характеризует тесноту связи между результативным и факторным (положенным в основу группировки) признаками. Численное значение коэффициента эмпирического корреляционного отношения имеет два знака: . При решении вопроса о том, с каким знаком его следует брать, необходимо иметь ввиду: если вариация факторного и результативного признаков идет синхронно в одном и том же направлении (возрастает или убывает), то корреляционные отношение берется со знаком плюс; если же изменение этих признаков идет в противоположных направлениях, то оно берется со знаком минус.

Для вычисления групповых и межгрупповых дисперсий можно применять любой из описанных выше способов исчисления среднего квадрата отклонений.

Задача 2. Вычислим все названные дисперсии по исходным данным табл. 5.2.

Таблица 5.2. Распределение посевной площади озимой пшеницы по урожайности

Номер участка

Урожайность, ц/га

Посевная площадь, га

Вычислим среднюю урожайность озимой пшеницы по всем участкам (общая средняя):

ц/га.

Общую дисперсию найдем по формуле:

В гр. 6 табл. 5.2. вычислим значения для расчета среднего квадрата вариантов признака:

.

Находим общую дисперсию:

Урожайность зависит от многих факторов (качество почвы, размер внесения органических и минеральных удобрений, качество семян, сроки сева, уход за посевами и др.) Общая дисперсия в данном случае измеряет колеблемость урожайности за счет всех факторов.

Задача 3. Разобьем совокупность участков на две группы: I группа – посевные площади, на которых не вносились органические удобрения; II – площади, на которых они вносились. К первой группе отнесем участки 1-4, а ко второй – 4-8. По данным этих групп рассчитаем остальные из необходимых нам дисперсий, используя уже произведенные в табл. 5.2. вычисления.

Таблица 5.3. Расчетные данные для вычисления межгрупповой и групповых дисперсий

Номер участка

Урожайность, ц/га (х)

Посевная площадь, га (f)

Номер участка

Урожайность, ц/га (х)

Посевная площадь, га (f)

Определяем:

для I группы:

для II группы:

а) групповую среднюю

а) групповую среднюю

ц/га;

ц/га;

б) средний квадрат вариантов признака

;

;

в) групповую дисперсию

в) групповую дисперсию

Определяем среднюю из групповых дисперсий:

.

Находим межгрупповую дисперсию:

Средняя из групповых дисперсий измеряет колеблемость признака за счет всех прочих факторов, кроме положенного в основание группировки (разграничения на группы), а межгрупповая – за счет именно этого фактора. Сумма этих дисперсий должна дать общую дисперсию, а именно:

Отношение межгрупповой дисперсии к общей в нашем примере даст следующее значение коэффициента детерминации:

, или 71,8%,

т. е. вариация урожайности озимой пшеницы на 71,8% зависит от вариации размеров внесения органических удобрений. Остальные же 28,2% вариации урожайности зависит от влияния всех остальных факторов, кроме размеров внесения органических удобрений.

Коэффициент эмпирического корреляционного отношения составит:

.

Это говорит о том, что внесение органических удобрений оказывает весьма существенное влияние на урожайность.

Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.

Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.

При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.

Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.

Средняя выработка отражает общее свойство всей совокупности.

Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.

Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

Существуют различные средние:

средняя арифметическая;

средняя геометрическая;

средняя гармоническая;

средняя квадратическая;

средняя хронологическая.

Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.

Средняя арифметическая

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через. Следовательно, средняя арифметическая простая равна:

По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х встречается в совокупности 2 раза, а варианта х-16 раз и т.д.

Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается символом n.

Вычислим среднюю заработную плату одного рабочего в руб.:

Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту, а сумма этих произведений дает общий фонд заработной платы всех рабочих.

Полученная формула называется средней арифметической взвешенной.

Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами. Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная.

Основные свойства средней арифметической.

Средняя арифметическая обладает рядом свойств:

1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.

Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.

  • 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:
  • 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:
  • 4. Если х = с, где с - постоянная величина, то.
  • 5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:

Средняя гармоническая

Наряду со средней арифметической, в статистике применяется средняя гармоническая величина, обратная средней арифметической из обратных значений признака. Как и средняя арифметическая, она может быть простой и взвешенной.

Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.

Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

где - начальное значение интервала, содержащего моду;

Величина модального интервала;

Частота модального интервала;

Частота интервала, предшествующего модальному;

Частота интервала, следующего за модальным.

Медиана - это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке).

1. Сущность и значение средних величин

2. Виды средних величин

2.1. Степенные средние

2.2. Структурные средние

3. Понятие и показатели вариации

Средняя величина – обобщающий показатель, характеризующий типичный уровень варьирующего (изменяющегося) признака в конкретных условиях места и времени.

Средняя величина всегда именованная, она имеет ту же размерность, что и признак у отдельных единиц совокупности.

Отличительной особенностью средних величин является то, что в них сглаживаются индивидуальные различия признака у отдельных единиц совокупности, в результате чего появляется возможность охарактеризовать общие черты и свойства массовых экономических явлений. Вместе с тем средние показатели иногда приводят к необъективным выводам при проведении экономико-статистического анализа, так как они игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Принципы применения средних величин:

1. Для расчета средних величин должны быть использованы массовые данные. В средней величине, рассчитанной на основе данных о большом числе единиц (массовых данных)колебания в величине признака, вызванные случайными причинами сглаживаются и проявляется типичный размер признака для всей совокупности.

2. Средние величины рассчитываются по однородным совокупностям. Для получения однородной совокупности необходима группировка данных, поэтому расчет средней величины должен сочетаться с методом группировки. Если исследуемое явление не является однородным, то его разбивают на группы, содержащие только однородные элементы. Для такого явления рассчитываются сначала средние по группам, которые называются групповые средние, они выражают наиболее типичную величину явления в каждой группе. Затем рассчитывается для всех групп общая средняя величина, характеризующая явление в целом. Она определяется как среднее значение из групповых средних, взвешенных по числу элементов совокупности, включенных в каждую группу.

На практике безусловное выполнение данного условия повлекло бы за собой ограничение возможностей статистического анализа общественных процессов, поэтому часто средние величины рассчитываются по неоднородным явлениям (например, средняя ЗП по Брянской области)

3. Общие средние величины должны подкрепляться групповыми средними, характеризующими части совокупности. Это обусловлено тем, что за средними показателями скрываются особенности различных частей изучаемой совокупности (например, средняя ЗП в каждом районе Брянской области).

4. Определение максимального и минимального значения признака в изучаемой совокупности. В случае больших отклонений между крайними значениями и средним необходимо проверить принадлежность экстремумов к исследуемой совокупности. Если сильная изменчивость признака вызвана случайными кратковременными факторами, то, возможно, крайние значения не характерны для совокупности, следовательно, их необходимо исключить из анализа, так как они оказывают влияние на размер средней величины (например, многие данные по Москве существенно отличаются от общероссийских).



Средние величины делятся на два класса: степенные средние и структурные средние

Степенные средние в зависимости от представления исходных данных рассчитываются в двух формах: простой и взвешенной. Простая средняя рассчитывается по не сгруппированным данным, а взвешаная средняя рассчитывается по сгруппированным данным, представленным в виде интервальных или дискретных рядов распределения.

Виды степенных средних.

Формулы расчета степенных средних величин смори в раздатке.

Средняя арифметическая простая применяется, когда количество вариантов по конкретному признаку встречается по одному или одинаковому числу раз.

Пример 1 . Имеются след данные о ЗП рабочих участка за сентябрь. Вычислить среднюю ЗП рабочих участка за сентябрь.

Решение: что требуется усреднить, то и признак – Х; f=1 (частота) для каждого значения признака, так как ничего не повторяется. Каждое значение признака (ЗП) встречается только один раз, поэтому применим формулу средней арифметической простой: x ср =(11700+11208+…+10870)/10=11366,5 руб.

Средняя арифметическая взвешаная применяется при условии повторения признака неодинаковое число раз.

Пример 2. Имеется распределение рабочих участка по величине ЗП за сентябрь.

Решение: Х – заработная плата; число рабочих – частота признака – f. Так как имеются повторяющиеся с разной частотой значения признака, применим формулу средней арифметической взвешенной: x ср =(10250*2+10750*6+11125*15+11575*7)/(2+6+15+7)=11097 руб.

Расчет средних величин по результатам группировки.

Часто исходные данные для анализа бывают представлены в сгруппированном виде – когда для каждого значения осредняемого Х сообщается частота его повторения. В этих случаях средняя величина рассчитывается по обычным формулам средних взвешенных (пример 2). Сложности возникают, когда в сгруппированных данных указывается не конкретное значение признака Х по каждой группе, а лишь интервал его изменения (пример 3). В данном случае правильный расчет общей средней величины возможен, если от интервалов перейти к их серединам. Таким образом, расчет средней арифметической делают по формуле: =(∑ i *f i)/∑f i , i =x min +((x max -x min)/2), где x max – верхняя граница, x min – нижняя граница. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам интервалов, примыкающих к ним (второго и предпоследнего).

Расчет среднего значения по данным группировки требует особого внимания при выборе взвевающего показателя (частоты). Часто величины f i – частоты повторения признака х – в исходных данных либо отсутствуют, либо не совсем очевидны.

Пример 3 : имеются след данные:

Определить среднюю себестоимость изделия.

Решение: себестоимость единицы – Х, частота повторений – если с определением серединного интервала сложностей не возникает i =x min +((x max -x min)/2); 1 =110+ =112,5; 2 =115+ =117,5; 3 =122,5; 4 =127,5, то при выборе взвешивающего показателя типичной ошибкой является выбор признака «Число предприятий»; умножения себестоимости одного изделия на число предприятий экономического смысла не имеет, тогда как умножение себестоимости одного изделия на объем продукции дает реальную экономическую величину–общую сумму затрат. Таким образом, в качестве взвешивающего показателя следует взять объем продукции (четвертый столбец – f).

Тогда средняя себестоимость изделия будет равна: = . = =123,15 руб.

Средняя гармоническая – величина, обратная средней арифметической. Средняя гармоническая простая рассчитывается, если имеются похожие объекты различные по какому либо признаку.

Пример 4: два автомобиля работают на одной марке бензина. Первый автомобиль имеет удельный расход 0,05 л/км, второй 0,08 л/км. Определить средний удельный расход бензина по двум автомобилям.

Решение: = .

Средняя гармоническая взвешенная рассчитывается в случае, если по условию дано произведение признака на частоту (x*f).

Пример 5 : определить среднюю продолжительность рабочего дня на предприятии по данным таблицы.

Решение: признак – средняя фактическая продолжительность, третий столбец – x*f. = .

Средняя геометрическая: применяется в основном простая для определения среднего коэффициента роста.

Годы Производство продукции, тыс. руб. Коэффициенты роста, цепные
-
1,081
1,05

Решение: для 2009 КР не будет (не с чем сравнивать); для 2010: 400/370=1,081; для 2011: 420/400=1,05. Условные обозначения: x – третий столбец. =

Средняя квадратическая применяется для расчета среднего квадратического отклонения, являющегося показателем вариации признаков, а также в технике и, например, при сооружении трубопроводов.

Пример 7: подача жидкого топлива для технологического процесса осуществляется в цехе тремя трубопроводами с диаметром 2, 5 и 6 см. При капитальном ремонте здания цеха эти трубопроводы будут заменены на три новых, одинакового диаметра при сохранении их общей пропускной способности. Определить средний диаметр трубы (диаметр новой трубы).

Решение: определяющий показатель пропускной способности труб – их радиус. = . Д=2 ч=4,66 см.

Резюме: значения степенных средних, рассчитанных на основе одних и тех же индивидуальных значений признака при разных показателях степени, не одинаковы. Чем выше степень средней, тем больше величина самой средней – правило мажорантности средних.

Мода – числовое значение признака, которое наиболее часто встречается в ряду распределения. Может определяться по несгруппированным данным, а также для дискретного и интервального ряда распределения.

Расчет моды по несгруппированным данным

Пример 8: известно, что семь сотрудников отдела кадров имеет след стаж работы, лет: 5, 2, 4, 3, 4, 2, 2.

Решение: ранжируем исходные данные: 2,2,2,3,4,4,5. Так как чаще всего встречается стаж работы два года, он является модальным.

Расчет моды по дискретному ряду распределения:

Особенности применения моды для дискретного ряда:

1. Если все значения вариационного ряда имеют одинаковую частоту, то этот вариационный ряд не имеет моды

2. Если два соседних варианта имеют одинаковую наибольшую частоту, то мода рассчитывается как среднее арифметическое из этих вариантов

3. Если два не соседних варианта имеют одинаковую наибольшую частоту, то вариационный ряд называется бимодальным

4. Если таких вариантов более двух, то ряд полимодальный

Пример 9: имеется ряд распределения рабочих по выработке деталей:

Определить моду.

Решение: вводим условные обозначения: выработка – признак, частота – число рабочих. Поскольку наибольшее число рабочих (5 человек) имеют выработку 20 деталей, мода равна 20.

Расчет моды по интервальному ряду распределения

Для интервальных рядов распределения мода рассчитывается по формуле: , где i – величина модального интервала, fм – частота модального интервала, fм-1 – частота интервала предшествующего модальному, fм+1 – частота интервала след за модальным.

Пример 10: имеются предприятия региона, распределенные на группы по стоимости основных производственных фондов. Определить моду.

Решение: признак – группы ОПФ, число предприятий – частота повторений признака. Модальный интервал 18-20, так как для него характерно наибольшая частота (10 предприятий). млн. руб.. Вывод: предприятие, имеющее величину ОПФ в размере 18,8 млн. руб., представляют собой наибольшую группу в общем объеме рассматриваемых предприятий.

На практике мода иногда используется вместо средней арифметической или вместе с ней, например, при определении наиболее ходовых размеров одежды и обуви, что учитывается при планировании их производства.

Медиана – это величина признака, которое делит упорядоченную последовательность его значений на две равные по численности части. Рассчитывается по несгруппированным данным, а также для дискретного и интервального ряда.

Расчет медианы по несгруппированным данным

В начале для определения медианы необходимо провести ранжирование (упорядочение). Если ряд состоит из нечетного количества вариантов, место медианы определяется по формуле: , где n – количество единиц совокупности. Для четного ряда медиана рассчитывается как средняя арифметическая простая из двух значений, находящихся в середине ряда.

Пример 11: по условию примера 8 найти медиану.

Решение: проведем ранжирование исходных данных: 2 2 2 3 4 4 5. Ряд нечетный, потому что семь элементов, поэтому место медианы. Медианный стаж 3 года, то есть половина работников имеют стаж менее трех лет, другая половина – более трех лет.

Расчет медианы по дискретному и интервальному ряду распределения:

Алгоритм нахождения медианы для дискретного ряда (медианного интервала для интервального ряда):

1. Определяем общую сумму и полусумму частот

2. Для каждого значения признака (интервала) определяем сумму накопленных частот

3. Медианным будет то значение признака (тот интервал), для которого сумма накопленных частот впервые будет равна или превысит их полусумму.

Для интервального ряда медиана рассчитывается по формуле . где Sм-1 – сумма частот накопленная до начала медианного интервала, fм – частота медианного интервала.

Пример 12: по данным примера 9 найти медиану.

Решение:

1. Определяем сумму частот – 15.полусумма – 7,5

2. Смотри в таблице (третий столбец)

3. Медианой является то значение признака, для которого сумма накопленных частот впервые будет равно или превысит полусумму (11>7,5)

Вывод: таким образом, медиана равна 20 деталей (первый столбец), то есть половина рабочих имеют выработку более 20 деталей, другая половина менее 20 деталей.

Пример 13: по данным примера 10 найти медиану.

Решение:

1. Определяем сумму частот – 25, полусумма – 12,5

2. Смотри третий столбец примера 10

3. Медиана находится в том интервале, в котором сумма накопленных частот впервые будет равна или превысит полусумму (18>12,5)

Таким образом, медианный интервал 18-20. Применим формулу: млн. руб.

Медиана всегда лежит в медианном интервале!

Вывод: половина предприятий имеют стоимость ОПФ менее 18,9 млн. руб., остальные – более 18,9 млн. руб.

Медиана используется при распределении семей по величине дохода, при проектировании оптимального положения остановок общественного транспорта, складских помещений и т.д.

Мода и медиана имеют преимущество перед средней арифметической для ряда распределения с открытыми интервалами.

Для исследования колеблемости средней величины в статистике возникает необходимость изучения признаков вариации ее измерения.

Вариация – это несовпадение уровней одного и того же признака у разных объектов, принадлежащих одной совокупности (например, вариация оценок по дисциплине ЭПП в группе 11-ПИ).

Вариацией называется изменчивость только тех явлений, на которые воздействуют внешние факторы и причины. Тогда, как о явлениях, изменяющихся в силу своей внутренней природы, нельзя говорить. Что они подвержены вариации (например, рост отдельного человека, меняющийся в течение жизни. Изучение изменчивости роста, который. Допустим, к году составляет 0,8 метра, а к 20 годам 1,79 метра, путем расчета среднего роста будет некорректным, так как в начале жизни рост был небольшой в силу естественных причин).

Не следует путать с вариацией изменения размера признака по одной и той же единице совокупности, наблюдаемой в разные моменты или периоды времени. Такое изменение называется изменение во времени или динамикой явления и исследуется с помощью специальных методов.

Задачи исследования вариации в статистике

1. Выявление изменчивости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов в свою очередь подверженных изменчивости, то есть оценить степень устойчивости явления к внешним воздействиям

2. Вариация предполагает оценку однородности изучаемого явления, то есть меру типичности, рассчитанной для этого явления статистической величины (прежде всего средней)

3. Вариация и методы ее исследования имеют важнейшее значение в изучении явлений, протекающих в обществе. Одной из главных проблем исследования общественных явлений и процессов является высокий уровень их изменчивости, так как участниками общественных процессов выступают люди, обладающие различными системами ценностей и интересов

Вариация измеряется при помощи абсолютных показателей (размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и дисперсия) и относительных показателей (коэффициент вариации).

Размах вариации определяется как разница между максимальным и минимальным значением признака: R=Xmax-Xmin.

Пример 14 . Определить средний размер страховых выплатах за год по договорам страхования от несчастных случаев. Проанализировать вариацию данных.

Х=(5*11+6*17+7*23+8*30+9*18)/99=7,3 тыс. руб

R=9-5=4 тыс. руб.

Среднее линейное отклонение точнее характеризует колеблемость и представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической. Рассчитывается как простое (для дискретных рядов), так и взвешенное (для интервальных).

где Xi - значение варианта;

X - среднее значение признака;

Fi – частота повторения призака;

n - число вариантов.

d= (I(5-7,3)*11+(6-7,3)*17+(7-7,3)*23+(8-7,3)*30+(9-7,3)*18I)/99=1,07 тыс. руб.

Дисперсия – среднее квадратическое отклонение в квадрате.

Среднее квадратическое отклонение – показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения.

Т.о. страховые выплаты отклонялись от их среднего размера в среднем на 1,25 тыс. руб.

Коэффициент вариации – наиболее часто применяемый показатель колеблемости относительно среднего значения, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

V=1,25/7,3*100%=17,1% (совокупность по рассматриваемому признаку можно считать однородной).


Рисуем этот столбец сами, расчет тоже производим сами

П - произведение

Мода всегда лежит в модальном интервале

5.1. Понятие средней величины

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.
1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.
2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.
3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.
4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;
m – показатель степени средней;
f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:


Средний возраст рассчитаем по формуле простой средней:

Сгруппируем исходные данные. Получим следующий ряд распределения:

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:
средняя гармоническая, если m = -1;
средняя геометрическая, если m –> 0;
средняя арифметическая, если m = 1;
средняя квадратическая, если m = 2;
средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 4.4.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Таблица 5.1

Виды степенных средних

Вид степенной
средней
Показатель
степени (m)
Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая 0
Арифметическая 1
Квадратическая 2
Кубическая 3

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,..., i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×...×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда

5.3. Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;
h Me – его величина;
(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

В нашем примере могут быть получены даже три медианных значения – исходя из признаков количества предприятий, объема продукции и общей суммы затрат на производство:

Таким образом, у половины предприятий уровень себестоимость единицы продукции превышает 125,19 тыс. руб., половина всего объема продукции производится с уровнем затрат на изделие больше 124,79 тыс. руб. и 50 % общей суммы затрат образуется при уровне себестоимости одного изделия выше 125,07 тыс. руб. Заметим также, что наблюдается некоторая тенденция к росту себестоимости, так как Ме 2 = 124,79 тыс. руб., а средний уровень равен 123,15 тыс. руб.

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

где Х Mo – нижнее значение модального интервала;
m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
m Mo -1 – то же для интервала, предшествующего модальному;
m Mo+1 – то же для интервала, следующего за модальным;
h – величина интервала изменения признака в группах.

Для нашего примера можно рассчитать три модальных значения исходя из признаков числа предприятий, объема продукции и суммы затрат. Во всех трех случаях модальный интервал один и тот же, так как для одного и того же интервала оказываются наибольшими и число предприятий, и объем продукции, и общая сумма затрат на производство:

Таким образом, чаще всего встречаются предприятия с уровнем себестоимости 126,75 тыс. руб., чаще всего выпускается продукция с уровнем затрат 126,69 тыс. руб., и чаще всего затраты на производство объясняются уровнем себестоимости в 123,73 тыс. руб.

5.4. Показатели вариации

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

H=X max - X min .

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

.

Показатель s, равный , называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

,

где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

.

2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

.

3. Коэффициент вариации:

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

Боярский А.Я. Теоретические исследования по статистике: Сб. Науч. Трудов.– М.: Статистика,1974. С. 19–57.

Предыдущая