Болезни Военный билет Призыв

Вторичная перегруппировка пример. Сводка и группировка статистических данных. Ряды распределения, их виды и графическое изображение

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московская академия им. С.Ю. Витте

Факультет «Экономика»

Контрольная работа

Работу выполнила:

студентка 1го курса,

дистанционной формы обучения

Висляева М.Н.

г. Москва

При выполнении контрольного задания Вы должны сделать вторичную перегруппировку для несложного примера (пример выбрать самостоятельно) и объяснить, как и при выполнении каких условий справедлив такой перерасчет. При использовании компьютерных программ и более сложного примера указать также эффект и особенности применения ИТ.

В письменном ответе на задание Вы должны:

1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.

2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.

3. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.

4. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Произвести укрупнение интервалов на основе данных таблицы 1:

Таблица 1

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2).

Таблица 2

Группы магазинов по размеру товарооборота за IV квартал, тыс. руб.

Число магазинов

Товарооборот за IV квартал, тыс. руб.

Товарооборот в среднем на 1 магазин, тыс. руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

1. По аналитической группировке можно измерить связь с помощью эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой з (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.

Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов. Эта дисперсия называется остаточной. Она определяется по формуле:

где у ij - значение признака у для i-й единицы в j-й группе;

J - среднее значение признака в j-й группе;

n j - число единиц j-й группе;

j = 1, 2, 3, ..., т.

Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:

Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле

Правило сложения дисперсий может быть записано:

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:

Этот показатель принимает значения в интервале : чем ближе к 1, тем теснее связь, и наоборот.

Таблица 3. Исходные данные

Таблица 4. Рабочая таблица

Средний товарооборот = ?X*f / f= 17370/51 = 340,58 тыс. руб.

Дисперсия равна:

G 2 =? f*(X-Xср) 2 / ? f = 38682,36/51 = 758,48

Среднее квадратическое отклонение:

Коэффициент вариации равен:

V = G / Xср = 27,54/758,48 = 0,081; 8,1%.

Коэффициент вариации меньше 33%, следовательно, совокупность однородна.

Таблица 5. Исходные данные

1) средние затраты времени на проезд к месту работы у рабочих = Х ср =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 мин.

2) расчет дисперсии

Дисперсия равна:

G 2 =? f отклонение:

3) Коэффициент*(X-Xср) 2 / ? f = 43160,8/420 = 102,8

Среднее квадратическое вариации равен:

V = G / Xср = 10,14/41,8 = 0,24; 24%

Коэффициент вариации меньше 33%, следовательно, рассмотренная совокупность однородна и средняя для нее достаточно типична.

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая, а во втором -- выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

Разности -- и W -- р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Исключительно важную роль для обоснования и применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.

Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения является установление необходимой численности выборочной совокупности, т.е. такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.

При этом должно быть учтено: 1) с какой степенью точности следует получить предельную ошибку выборки; 2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения; 3)степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.

Это значит, что необходимая численность выборки устанавливается в зависимости от размеров предельной ошибки выборки, от величины коэффициента доверия (t) и от размеров величины дисперсии.

Метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции, называется методом наименьших квадратов.

Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше - тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

МНК используется в математике, в частности - в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК - решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

Этапы проверки статистических гипотез:

Формулировка основной гипотезы H 0 и конкурирующей гипотезы H 1 . Гипотезы должны быть чётко формализованы в математических терминах.

Задание вероятности б, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.

Расчёт статистики ц критерия такой, что:

её величина зависит от исходной выборки;

по её значению можно делать выводы об истинности гипотезы H 0 ;

сама статистика ц должна подчиняться какому-то известному закону распределения, т.к. сама ц является случайной в силу случайности.

Построение критической области. Из области значений ц выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство. Это множество и называется критической областью.

Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику ц и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H 0 .

дисперсия корреляционный вариация

Размещено на Allbest.ru

...

Подобные документы

    Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа , добавлен 26.07.2012

    Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация , добавлен 01.11.2013

    Среднее значение показателя (среднее арифметическое). Показатели вариации - размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации. Максимальное и минимальное значение статистического показателя.

    контрольная работа , добавлен 14.11.2008

    Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.

    реферат , добавлен 13.06.2011

    Сущность выборочного исследования. Способы отбора единиц в выборочную совокупность. Средняя и предельная ошибка для показателей средней величины и показателей доли. Определение необходимого объема выборки при заданной предельной ошибке среднего значения.

    презентация , добавлен 16.03.2014

    Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.

    курс лекций , добавлен 29.11.2013

    Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.

    курсовая работа , добавлен 11.01.2012

    Диаграмма рассеивания как точки на плоскости, координаты которых соответствуют значениям случайных величин X и Y, порядок ее построения и назначение. Нахождение коэффициентов и построение графика линейного приближения, графика квадратичного приближения.

    курсовая работа , добавлен 03.05.2011

    Упорядочение исходной выборки наработок до отказа. Проверка статистической гипотезы о соответствии экспоненциальному распределению и распределению Вейбулла. Оценивание параметров распределений и показателей безотказности, его главные методы и приемы.

    курсовая работа , добавлен 22.01.2012

    Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.

Вопрос 10. Вторичная группировка, методы ее проведения.

Группировка - это расчленение изучаемой статистической совокупности на части по одному или нескольким группировочным признакам. Правильно проведенная группировка в значительной мере обеспечивает достоверность всего статистического исследования.

Первичная группировка производится на основе сортировки первичных исходных данных.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. В таком случае необходима перегруппировка данных с помощью вторичной группировки.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп.

1. наиболее простой и распространенный способ - изменение (чаще укрупнение) первоначальных интервалов.

2. Д олевая перегруппировка - способ состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

Пример. Необходимо провести перегруппировку данных, образовав новые группы с интервалами до 500, 500 - 1000,1000 - 2000, 2000 - 3000, свыше 3000 руб. по данным о распределении контрактов строительной фирмы по величине прибыли.

Таблица. Распределение контрактов строительной фирмы по величине прибыли¹

В первую новую группу войдет полностью 1-я группа контрактов и часть 2-й группы. Чтобы образовать группу до 500 тыс. руб., необходимо от интервала 2-й группы взять 100 тыс. руб. Величина интервала этой группы составит 600 тыс. руб. Следовательно, необходимо взять от нее 1/6 (100: 600).Аналогичную же часть во вновь образуемую новую группу надо взять и от числа контрактов, т. е. 20 1/6 - 3 контракта. Тогда в 1-й группе будет контрактов 16 + 3 = 19 контрактов. Вторую новую группу образуют контракты 2-й группы за вычетом отнесенных к 1-й, т. е, 20 - 3 = 17 ед. Во вновь образованную третью группу войдут все контракты 3-й группы и часть контрактов 4-й. Для определения этой части от интервала 1800 -3000 (ширина интервала равна 1200 тыс. руб.) нужно добавить к предыдущему 200 тыс. руб. (чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала, равную 200:1200, т. е. 1/6. В этой группе 74 контракта, значит, надо взять 74 ¦ (1: 6) = 12 ед. В третью новую группу войдет: 44 Н-12 - 56 контрактов. Во вновь образованную четвертую группу войдет: 74 - 12 =62 контракта, оставшихся от прежней 4-й группы. Пятую, вновь образованную группу составят контракты 5-й и б-й прежних групп: 37 + 9 = 46 контрактов. Техника перегруппировки показана в таблице.

Распределение совокупности на группы, однородные в том или ином отношении, связано с такими действиями, как систематиза­ция, типология, классификация, группировка. Традиционно такое распределение выполняют по следующей схеме: из множества признаков, описывающих явление, выбирают группировочные, а затем совокупность делят на группы и подгруппы в соответствии со значениями этих признаков.

В каждом конкретном исследовании решаются три вопроса:

1) что взять за основу группировки;

2) сколько групп, позиций необходимо выделить;

3) как разделить группы.

Основой группировки может быть любой атрибутивный или ко­личественный признак, имеющий градации.

Промежуток изменений (область существования) признака статистической совокупности

(R=хmах - xmin)

принято называть размахом вариации. Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN

где К - число групп (интервалов); N - объем статистической со­вокупности.

Формула Стерджесса пригодна при условии, что рас­пределение единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления (процесса).

Интервалы представляют собой каркас группировки. На прак­тике их образовывают, придерживаясь трех формальных при­нципов: равности интервалов, кратности интервалов, равности частот. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы могут быть равные и неравные . Неравные интер­валы используются, если диапазон вариации признака слишком широкий и распределение значений неравномерно. Формируются они на основе принципа кратности, когда ширина каждого последу­ющего интервала в к раз больше (меньше) предыдущего. Равные интервалы целесообразно применять в тех случаях, когда вариа­ция проявляется в сравнительно узких границах и распределение является практически равномерным. Для группировок с равными интервалами величина интервала

Сравнимость статистических группировок. Вторичная группировка

Иногда возникает необходимость проведения вторичных группировок - образования новых групп на основе ранее осу­ществленной группировки. Такая необходимость может возник­нуть, если имеющиеся группировки не удовлетворяют требова­ниям проводимого анализа (несопоставимы из-за разного числа выделенных групп или неодинаковых границ интервалов). Полу­чение новых групп на основе имеющихся возможно двумя спосо­бами перегруппировки: объединением первоначальных интерва­лов (путем их укрупнения) и долевой перегруппировки (на основе закрепления за каждой группой определенной доли единиц сово­купности).

Пример:

Таблица 2 – Распределение сотрудников предприятия ив уровню дохода

Произведем перегруппировку данных, образовав новые труппы с интервалами до5, 5-10,10-20,20-30, свыше 30 тыс. руб. В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть надо взять от числа работников, т.е. . В первой группе число работающих: 16+3=20 человек. Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3=17-чел. Во вновь образованную третью группу войдут все со­трудники третьей группы и часть сотрудников, четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо, взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6)=12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12= 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел. В результате получим следующие новые группы:

Таблица 3 – Новая группировка

4 Закрепление знаний _______

1 В чем заключается процесс группировки

2 Перечислите и охарактеризуйте основные виды группировок

3 Интервал. Виды и формула

4 Формула Стерджесса

5 Перегруппировка

5 Выдача домашнего задания ______

Повторить пройденный материал

Подведение итогов занятия


План занятия №(7) 4

по учебной дисциплине «Статистика»

Группа Дата
Э2-1
Зм2-5

Тема занятия Проведение сводки статистических данных. Группировка и перегруппировка данных

Метод группировок.

Тип занятия урок совершенствования знаний

Вид занятия урок-практическая работа №1

Дидактические цели

Образовательные

знают понятие группировки, виды, цели и задачи, порядок проведения группировки, умеют проводить группировку, перегруппировку статистических данных

Развивающие

классифицируют различные виды группировок, формулируют выводы по результатам проведенной группировки

Воспитывающие

содействуют формированию профессиональной культуры.

Межпредметные связи:

Обеспечивающие дисциплины: АФХД

Обеспечиваемые дисциплины: математика

Методы обучения: практического обучения

Методическое обеспечение занятия: раздаточный материал

Литература:

1 Н.В. Толстик Статистика

2 Е.М. Ефимова Статистика

ХОД УЧЕБНОГО ЗАНЯТИЯ

Организационный момент

Работа с журналом, рапортичкой, проверка готовности группы к уроку

Изучение нового материала

1 Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называютсягруппировочными признаками.

Классификация группировок:

Структурная группировка характеризует состав однород­ной совокупности по определенным признакам. Например, состав населения региона по месту проживания, по размеру среднедушевого дохода, группировка хозяйств по объему выпущенной продук­ции, структура депозитов по срокам их привлечения.

Типологическая группировка - это распределение качес­твенно неоднородных совокупностей на классы, социально-эко­номические типы, однородные группы. Примером может служить группировка сек­торов экономики, хозяйствующих субъектов по формам собственности: государственная, федеральная, муниципальная, частная, смешанная.

Аналитические группировки предназначены для выявления зависимости между признаками.

Основой группировки может быть любой атрибутивный или ко­личественный признак.

Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой. Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN (1)

где К - число групп (интервалов);

N - объем статистической со­вокупности.

Интервалы представляют собой каркас группировки. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы групп могут быть закрытыми (когда указана ниж­няя и верхняя границы) и открытыми (когда указана только одна граница - верхняя или нижняя).

где х min , max – минимальное и максимальное значение признака

n – число групп

h – щаг интервала

Задача 1

Произведите группировку 30 магазинов одного из регионов РФ на 1.01.05, применяя метод группировок.

Таблица 1 – Исходные данные

Среднесписочная численность, чел. Товарооборот, млн. руб.

Решение :

Вкачестве группировочного признака выбираем товарооборот.

Теперь необходимо образовать 4 группы с равными интервалами. Величина интервала определяется по формуле:

где h - шаг интервала

n - число групп

Обозначим границы групп:

2100-7350 – 1-ая группа (2100+5250)

7350-12600 – 2-я группа (7350+5250)

12600-17850 – 3-ая группа (17850+5250)

17850-23100 – 4-ая группа (17850+5250)

После того, как определено число групп и группировочный признак, необходимо определить показатели, которые характеризуют группы и их величины. Показатели разноситься по группам и подсчитываются итоги.

Таблица 2 – Группировка магазинов по величине товарооборота

Таблица 3 – Группировка магазинов по величине товарооборота (% к итогу)

Вывод : из таблицы 3 видно, что преобладает группа с товарооборотом в интервале 2100-7350 – 60%.

Провести группировку коммерческих банков одного из регионов РФ на 1.01.06

Таблица 4 – Исходные данные

Номер банка Капитал Рабочие активы Уставный капитал
207,7 2,48 1,14
200,3 2,40 1,10
190,2 2,28 1,05
323,0 3,88 1,88
247,1 2,96 1,36
177,7 2,12 0,97
242,5 2,90 1,33
182,9 2,18 0,99
315,6 3,78 1,73
183,2 2,20 1,01
320,2 3,84 1,76
207,3 2,48 1,14
181,0 2,17 0,99
172,4 2,06 0,94
234,3 2,81 1,29
189,5 2,27 1,04
187,7 2,24 1,03
166,9 1,99 0,91
157,7 1,88 0,86
168,3 2,02 0,93
224,4 2,69 1,23
166,5 1,99 0,91
198,5 2,38 1,09
240,4 2,88 1,32
229,3 2,75 1,26
175,2 2,10 0,96
156,8 1,87 0,86
160,1 1,92 0,88
178,7 2,14 0,98
171,6 2,05 0,94

Решение:

В качестве группировочного признака возьмем капитал банка.

Образуем четыре группы банков с разными интервалами. Величину интервала определяем по формуле:

где h - шаг интервала

х max , x min – минимальное и максимальное значение группировочного признака

n - число групп

Теперь обозначим границы групп:

1 – я группа 156,0-197,8
2 – я группа 1297,8-239,6
3 – я группа 239,6-281,4
4 – я группа 281,4-323,2

После того, как определен группировочный признак – капитал, шаг интервала и образованы группы, мы определим показатели, которые характеризуют группы и их величины по каждой группе.

Таблица 5 –– Группировка коммерческих банков по величине капитала

Группы банков по величине капитала Число банков Капитал Активы Работающие активы
156,0-197,8 2699,5 35,48 16,25
197,8-239,6 1501,8 17,99 8,25
239,6-281,4 730,0 8,74 4,01
281,4-323,2 958,8 11,5 5,37
Итого 6157,1 73,71 33,88

Структурная группировка коммерческих банков будет иметь вид:

Таблица 6 – Группировка коммерческих банков по величине каритала (% к итогу)

Группы банков по величине капитала Число банков, % к итогу Капитал,% к итогу Активы, % к итогу Работающие активы, % к итогу
156,0-197,8 56,7 48,2 48,1 48,0
197,8-239,6 23,3 24,4 24,4 24,3
239,6-281,4 10,0 11,9 11,9 11,8
281,4-323,2 10,0 15,5 15,6 15,9
Итого

Вывод:

Из таблицы 6 видно, что в основном преобладают мелкие банки – 56,7 %, на их долю приходится 48,2% капитала. Крупные и средние банки занимают по 10%, доля их капитала составила 15,5 и 11,9 % соответственно.

Закрепление знаний

1 В чем состоит значение метода группировок в анализе статистических данных?

2 Что представляет собой группировка?

3 Виды группировок

4 Охарактеризуйте каждый вид группировки

5 Понятие интервала

6 Виды интервалов

7 Формула интервала

4 Выдача домашнего задания

Записать в тетрадь примеры количественных и качественных признаков, которые могут быть положены в основание группировки для предприятия (3-5 примеров)

Доделать практическую работу

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

    По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка .Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.

    По способу разработки сводки делятся нацентрализованные , когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). Придецентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).

    По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация . Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

    В основу кладется качественный признак.

    Они стандартны.

    Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

    Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные , не имеющие количественного выражения (профессия, образование);

количественные : 1)дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2)непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные , которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lgN,

где N-количество элементов совокупности.

Согласно этой формуле, выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (). Он рассчитывается

где - среднее значение признака по совокупности, которое определяется по формуле;

    Е значение варьирующего признака;

    среднее квадратическое отклонение.

Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Хмах - Хmin

h= ---------------- ;

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. (0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min= 80, п= 5.

h= (Хмах - Хmin) / п;

h= (180 - 80) / 5 = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые , когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

    180 и более - исключительно - 180 входит в последний

    свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

    Суммируем верхнюю и нижнюю границу интервала и делим на 2.

    Середина 2-го интервала плюс величина интервала.

    Середина 2-го интервала минус величина интервала (для открытого).

    К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

    Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Еслиатрибутивный признак , то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основеколичественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Группировка по формам собственности в 1998 г.

    Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов.

Группировка населения России по месту проживания

за 1959-1994 гг.

    Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

50000 и более

    Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

    Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.

    Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Например, дискретный ряд.

Количество студентов

В % к итогу

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве . Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения , т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250-450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называетсясложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

    Четкость заголовков.

    Указываются единицы измерения в отдельных графах.

    Повторяющиеся термины выносятся в общие заголовки.

    Графы и строки необходимо нумеровать.

    В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.

    Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.

    В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.

    Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.

    При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.

    Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...» - отсутствуют сведения;

в) «-» - отсутствует само явление;

г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

    Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.

    Графический образ - это символические знаки, с помощью которых изображаются статистические данные.

    Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

    Экспликация графика - это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.