Типы группировок в статистике. Виды статистических группировок

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Группировки в уголовно -- правовой статистике позволяют дать наиболее полную и всестороннюю криминологическую и уголовно-правовую характеристику по самым разнообразным признакам (по видам -- статьям УК, по объекту посягательства, по территориальному признаку -- район, область, край, республика, соотношение корыстных и насильственных преступлений, по времени совершения преступлений и т.д.), личности преступников (по полу, возрасту, образованию, социальному положению, месту жительства и т.д.), причин и условий, способствующих совершению преступлений, а также мер социально-правового контроля над ними. При этом очень важно различные группировки из уголовно-правовой статистики сопоставлять не только друг с другом, но и с группировками из иных отраслей статистики (демографической, социально-экономической и др.), отражающих взаимосвязанные явления.

Различия в целевом назначении группировки, задачах, которые они решают в статистическом анализе, выражаются в существующей их классификации: типологические, структурные, аналитические.

Важнейшая задача группировок в статистике заключается в том, чтобы изучаемую массу единиц совокупности подразделить на характерные типы, т.е. на группы, однородные по существенным признакам. Эта задача решается с помощью типологической группировки.

3.1 Типологические группировки

Типологические группировки -- это разграничение изучаемой совокупности на однородные группы, типы по существенному качественному признаку.

Основная цель типологической группировки -- отграничение одного типа явлений от другого статистическими средствами. Этот вид группировок в значительной степени определяется сложившимися представлениями о том, какие типы явлений составляют содержание изучаемой совокупности. В правовой статистике это три типа правоотношений: уголовно-правовые, административно-правовые и гражданско-правовые, которыми и определяются ее разделы. В уголовно -- правовой статистике, в частности, это может быть, например, распределение по полу лиц, совершивших преступления

Данная группировка по качественному признаку, когда имеются всего лишь два значения этого признака, причем одно из них исключает другое, в статистке именуется альтернативной.

Последовательность действий проведения этого типа группировки элементарна:

1) определяется тип явления, которое должно быть выделено -- в нашем случае зарегистрированные преступления;

2) выбирается группировочный признак как основание описания типа -- в нашем случае пол лиц, совершивших преступления;

3) устанавливаются границы интервалов (в нашем случае по всем лицам, выявленным в совершении преступлений);

4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы и определяется численность (удельный вес) каждого из них.

При типологической группировке, т.е. при подытоживании единиц в качественно-однородные категории, эти категории должны, как отмечалось, определяться на основании положений соответствующей науки и норм закона. Например, группировка наказаний по видам осуществляется уголовно -- правовой (судебной) статистикой в полном соответствии со ст. 43--59 УК, устанавливающих с исчерпывающей полнотой точные качественные признаки их отдельных видов (штраф, исправительные работы, лишение свободы и т.д.

3.2 Структурные группировки

Структурные группировки -- это распределение типически однородных групп по количественным признакам, которые могут изменяться (варьировать). В научной литературе этот вид группировок иногда называют вариационным. С их помощью в уголовно-правовой статистике изучают, например, структуру преступников по варьирующему признаку: по возрасту, числу судимостей, по срокам лишения свободы, размерам заработной платы и другим количественным признакам.

Структурная, или вариационная, группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений, правонарушителей, гражданских исков и других показателей. Для структурной группировки материала необходимо наличие однородных совокупностей, расчленяемых по величине изменяющегося (варьирующего) признака. Если в основе типологической группировки лежат качественные признаки, то в основу вариационной положены количественные (удельные веса преступлений, лиц, дел, возраст правонарушителей, сроки наказания, число судимостей, число оконченных классов, суммы ущерба, суммы иска, сроки расследования и рассмотрения уголовных или гражданских дел и т.д.).

Количественные сдвиги в структуре изучаемых явлений за несколько лет свидетельствуют об изменении объективных тенденций и закономерностей, следственной или судебной практики, о результативности деятельности правоохранительных или других юридических органов. Взяв, например, абсолютные и относительные показатели судимости за много лет, мы выявим тенденции в судебной практике и ее связь с реальной преступностью. Изучив динамику абсолютных чисел учтенных преступлений какого-то вида, динамику его удельного веса в структуре всей преступности, мы обнаружим тенденции развития этого деяния.

Структурные группировки могут быть построены на основе долевого распределения преступлений по сферам и объектам преступного посягательства, субъектам Федерации, регионам и территориям

Структурные различия в этом случае могут раскрывать особенности криминологической обстановки в том или ином регионе.

К структурным (вариационным) группировкам примыкают ряды распределения единиц совокупности по варьирующим признакам.

Например, доли преступлений по образовательному признаку в 70-ые годы. Так, 79% всех правонарушителей имели образование в пределах четырех -- семи классов, а среди дезертиров и членовредителей их насчитывалось соответственно 91,2% и 88,8%, и не было ни одного с законченным средним образованием. Различия между Структурными группировками и рядами распределения в наших примерах заключаются в том, что первые вскрывают закономерности изменения структуры во времени или пространстве, а вторые -- закономерности в характере распределения данных.

3.3 Аналитическая группировка

Аналитические группировки -- это распределение по зависимости, взаимосвязи между двумя или несколькими разнородными группами явлений или их признаками (например, распределение краж по месту и времени их совершения; осужденных за автотранспортные преступления -- по стажу работы водителя и т.д.).

Аналитические группировки имеют большое значение для всех отраслей юридической статистики. Они дают возможность выявить многие скрытые зависимости и взаимосвязи, что имеет важное значение для принятия практических решений и развития юридической науки. Аналитический потенциал есть и у других видов группировок, а также иных статистических приемах, но собственно аналитическая группировка прямо преследует установление зависимостей между исследуемыми явлениями.

По характеру своих задач к аналитической группировке близко стоят группировки корреляционные, когда зависимость между исследуемыми явлениями или процессами может быть относительно точно измерена.

Все виды рассмотренных группировок при анализе социально-правовых, деликтологических и криминологических аспектов, как правило, применяются вместе. Например, для установления общественной опасности и тяжести совершаемых преступлений мы можем расчленить их совокупность по категориям деяний и формам вины (типологическая группировка). Для определения результативности борьбы с преступностью различных правоохранительных органов (внутренних дел, наркоконтроля, таможенной службы, прокуратуры, службы безопасности) мы можем исследовать варьирование раскрываемости преступлений в упомянутых ведомствах (вариационная группировка). Для того чтобы установить причины и условия роста или (снижения преступности в городе, регионе, стране) следует применить целый ряд аналитических группировок.

3.4 Виды аналитических группировок

На основе рассмотренных базовых группировок могут формироваться группировки сложные, комбинированные, многомерные, вторичные и другие.

Сложные группировки обычно отражают разнородность изучаемых явлений, когда последние имеют несколько противоречивых тенденций динамики и распределения. Наиболее распространенный вид сложных группировок -- комбинированные, которые формируются не по одному, а многим признакам, нередко иерархизированным между собой.

Комбинированные группировки помогают решать многие задачи -- и выделения типов, и выявления структурных сдвигов, и изучения взаимосвязей.

Многомерные группировки формируются на основе одного из методов статистической теории распознавания образов -- кластерного анализа (от англ. cluster -- скопление, группа элементов, характеризуемые каким-то общим свойством). Кластерный анализ включает в себя большое количество вычислений и обязательно связан с использованием быстродействующих ЭВМ, что в настоящее время не является препятствием. Эти вычисления производятся не последовательно по отдельным признакам (как при комбинированной группировке), а одновременно по большому набору признаков. Этот набор образует так называемое признаковое пространство.

Каждому признаку придается смысл координаты. Если в наборе Г большое число (обозначим его символом п) признаков, то каждый объект рассматривается как точка в n-мерном пространстве. Задача многомерной группировки сводится к выделению сгущений точек (группы объектов) в этом пространстве. Геометрическая близость двух или нескольких точек (объектов) в этом пространстве означает как бы их количественную однородность по описываемым признакам. Мерой близости (сходства) между объектами могут служить различные критерии: коэффициент корреляции, евклидово расстояние между объектами и др. Чем меньше это расстояние, тем больше сходства.

Задача многомерной группировки сводится к выделению сгущений точек объектов в образуемом пространстве. Группы объектов (кластеры), сформированные на основе "близости", описывают объект одновременно по всему комплексу признаков. На основании многомерных группировок совокупность статистических признаков расчленяют на однородные группы таким образом, что различия между признаками, попавшими в одну группу, оказываются менее значительными, чем между признаками, попавшими в разные группы. Освоение многомерных группировок юридическими статистиками на основе современных компьютерных программ поможет решить многие сложные проблемы в криминологии, деликтологии и социологии права в тех случаях, когда число различных факторов (объектов) исчисляется сотнями и даже тысячами, а их взаимосвязи при обычных статистических методах выявляются с трудом.

Вторичные группировки представляют собой образование новых группировок на основе имеющихся. Это осуществляется путем изменения (укрупнения) интервалов в вариационных группировках или путем долевых перегруппировок имеющихся показателей в типологических и аналитических группировках. Такая необходимость возникает при преобразовании группировок, построенных на основе количественных признаков, в качественные однородные группировки; при Приведении двух и более группировок с различными интервалами к одной сопоставимой; при образовании более укрупненных групп, в которых яснее проявляются реальные тенденции.

Вторичные группировки могут решать и более сложные задачи. Нидерландский криминолог Берг, не владея закрытой в 80-е гг. уголовной статистикой СССР, на основе огромного числа открытых советских публикаций (отдельных сведений и таблиц), в которых приводились абсолютные и относительные (в процентах) показатели об уровне, структуре и динамике преступности и судимости в СССР, рассчитал и построил единый статистический ряд данных о судимости в СССР за 1920--1982 гг. Нельзя признать, что его вторичное обобщение было абсолютно точным, но полученные сведения близки к данным официальной статистики и относительно полно раскрывали уровень и тенденции судимости в нашей стране, где они в эти годы имели гриф "совершенно секретно".

Вторичные группировки осуществляются путем сглаживания, укрупнения и смыкания ряда дробных показателей.

Сглаживание рядов динамики различными методами предполагает, когда из данных первичной группировки вычисляются средние и иные показатели, в связи с чем ряд принимает плавный, сглаженный вид, что способствует более четкому выявлению основных тенденций. Например, динамический ряд преступности по среднепятилетним арифметическим данным устраняет случайные колебания в отдельные годы и выявляет главную тенденцию сокращения или роста преступных проявлений в городе, регионе или стране.

Укрупнение ряда представляет собой суммирование данных за более продолжительные отрезки времени, что постоянно практикуется в правоохранительных и других юридических органах. Например, месячные юридически значимые сведения суммируются по кварталам и по годам без усреднения данных, как при сглаживании. Иногда такое укрупнение идет по нарастающей. Например, в 1996г. в России в январе месяце учтенная преступность увеличилась по сравнению с аналогичным периодом предыдущего года на 6,9%. В январе -- феврале прирост составил 3,2%. Затем началось снижение преступности. В январе-марте этот показатель составил --0,1; в январе -- апреле 0,8; в январе--мае -- 1,8 и далее: --3,1; -- 3,2; -- 4,1; -- 4,5; -- 4,4; -- 4,8; -- 4,7. Таким образом, за 1996г. в целом преступность сократилась на 4,7%. Последовательное укрупнение показателей на каждом этапе раскрывало реальный совокупный прирост за прошедшие месяцы года.

Смыкание рядов динамики применяется при наличии несопоставимости анализируемых показателей. Например, в какие-то годы преступность учитывалась в уголовных делах или в осужденных, а затем -- в преступлениях. В подобных случаях берут год, за который могут быть получены данные в прежнем и измененном объемах. Каждый из объемов принимается за базу (100%), и от нее вперед и назад строится непрерывный (сомкнутый) динамический ряд. Предположим, что до 1990г. преступность учитывалась в осужденных и с этого же года стала учитываться в преступлениях. В 1990г. было осуждено 897 299 человек и зарегистрировано 1 839 451 преступление. Число осужденных принимается за 100%, и все предыдущие данные процентируются от этой базы. В 1989г. оказалось 94,5%, в 1988г. -- 93,0% и т.д. Число учтенных преступлений в 1990г. также принимается за 100%, и все последующие данные рассчитываются в процентах, исходя из этой базы. В 1991г. оказалось 117,9%, в 1992г. -- 150,1 и т.д. С непрерывным рядом показателей далее возможны любые операции. Полученные данные будут не совсем точными, но они более или менее правильно отражают имеющиеся закономерности единого ряда статистических величин.

Статистика располагает и более сложными приемами преобразования, такими как аналитическое выравнивание ряда динамики по прямой и другими математическими методами, которые требуют специальной подготовки.

Подсчет данных статистического наблюдения и группировка показателей -- это третий элемент рассматриваемого метода. Раньше он, как правило, производился вручную, в 70-е гг. -- на счетно-перфорационных машинах, а ныне идет интенсивный переход на ЭВМ с большой памятью и быстродействием. Однако ручная сводка материала в социально-правовых и криминологических изучениях еще достаточно широко применятся в настоящее время.

Если статистическое наблюдение было ограничено официальной отчетностью, то сводка его упрощается, поскольку уже сами отчеты представляют собой сложную и разнообразную группировку показателей с подсчетом итогов. Сводка данных в этом случае ограничивается работой с месячными и квартальными (годовыми) отчетами, выбором из них необходимых данных и последующих вторичных и комбинационных группировок, необходимых для решения тех или иных задач.

В случаях, когда статистическое наблюдение проводилось в форме специально организованного обследования, то в итоге наблюдения изучающий получает огромную массу рабочих карточек, анкет, записей, несущих в себе разнообразную информацию. Сводка полученного материала, если он не переносится на перфокарты или магнитные носители, может производиться только вручную путем разметки карточек и сортировки их каждый раз на отдельные группы для непосредственного подсчета показателей по каждой группе и совокупности в целом.

Применение перфокартных систем, которые ныне себя изжили, в недалеком прошлом позволяло относительно быстро находить информационные данные, несмотря на то, что карты в массиве расположены бессистемно, и это значительно облегчало сводку показателей. Перфокартная система была большим шагом вперед по сравнению с ручной обработкой Данных. Для их подсчета существовали счетно-перфорационные машины, машины-табуляторы и нехитрые приспособления для ручной обработки. Это позволяло относительно легко работать с ними с помощью буквенных и числовых ключей и некоторых механических приспособлений. Там, где не представляется возможным использовать ЭВМ, можно воспользоваться перфокартными системами.

Широкое внедрение ЭВМ и разнообразного программного обеспечения для решения практически любых статистических задач серьезно облегчает сводку и обработку данных статистического наблюдения, распечатку их в нужных таблицах и графиках, проведение сложной и объемной аналитической работы.

Сводка статистических данных

Сводка и группировка материалов статистического наблюдения

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет средних и относительных показателей.

Статистическая сводка осуществляется по специально составленной программе, в которой указываются методы сбора и обработки информации. Содержание сводки чаще всего отражается в системе обоснованных макетов таблиц. Результаты сводки позволяют достаточно полно охарактеризовать весь изучаемый объект и отдельные его части с помощью многочисленных показателей.

Выполнение статистической сводки состоит из следующих этапов:

1) Определение задачи сводки в соответствии с целью экономико-статистического исследования.

2) Построение необходимых группировок.

3) Проверка достоверности и полноты собранной информации. Расчет показателей, необходимых для характеристики изучаемого явления и формулировки выводов.

Если по изучаемой совокупности производится только подсчет общих итогов без какой-либо предварительной систематизации собранного материала, то сводка называется простой.

Центральное место в статистической сводке отводится группировке. Группировка является важнейшим методом статистического иссле­дования, позволяющим уловить переход количественных изменений в качественные, выявить закономерности развития изучаемого явления или процесса.

Статистическая группировка - это процесс образования однород­ных групп на основе расчленения статистической совокупности на части (группы, подгруппы) по существенным для единиц этой совокупнос­ти признакам.

В экономико-статистических исследованиях применяются группировки трех видов:

1) типологические группировки;

2) структурные группировки;

3) аналитические группировки.

Типологическая группировка используется для выявления и характеристики социально-экономических типов явлений. Примером такой группировки может служить деление совокупности предприятий на ча­сти в соответствии с их формой собственности, деление экономически активного населения региона на занятых и безработных.

Структурная группировка позволяет охарактеризовать состав явления, процесса или совокупности. Например, группировка населения по полу, возрасту или душевому доходу. Анализ результатов таких груп­пировок, выполненных за несколько периодов, позволяет оценить изменение структуры явлений во времени, что отражает важнейшие закономерности их развития.

Аналитическая группировка используется для установления взаимо­связи между отдельными явлениями и их признаками. В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного призна­ка. Например, с помощью группировки предприятий по фондовооруженности труда (факторный признак) можно установить наличие зави­симости от него производительности труда (результативного признака): в группах с более высокой фондовооруженностью труда будет наблюдаться и более высокая его производительность (хотя по отдельным предприятиям это соотношение может и не наблюдаться).



Признак , на основе которого производится деление единиц совокупности на группы, называется группировочным признаком или основанием группировки.

Если группы образуются по одному признаку, то группировка называется простой (например, деление населения на возрастные группы). Группировка по двум или нескольким признакам называется сложной или комбинационной. Например, возрастные группы населения делятся на подгруппы по полу и т.д. Как правило, даже при достаточно большом объеме совокупности при построении статистических группировок огра­ничиваются двумя-четырьмя группировочными признаками.

Выбор группировочного признака сравнительно прост, если группировка производится по атрибутивному признаку. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Например, группировки населения по полу или социальному положению.

В случае, если атрибутивные (качественные) признаки имеют большое количество разновидностей, разрабатываются классификации разновидностей.

Классификации - это особый вид группировок, представляющих собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемой совокупности. Классификации выступают в качестве статистического стандарта, устанавливаемого на определенный период. Например, ОКВЭД - Общероссийский классификатор видов экономической деятельности, продукции и услуг, классификатор основных фондов и т.д.

количественному дискретному признаку, то число групп соответствует числу вариант (значений признака), если оно не очень велико. Например, распределение рабочих по тарифному разряду или студентов по оценкам, полученным на экзамене. При большом числе вариант дискретного признака их объединяют в группы.

Когда группировка производится поколичественному непрерывному признаку, весь диапазон его изменения разбивается на интервалы «от - до». Например, при группировке предприятий по объему производства: 1-й интервал - (100-200 тыс. рублей), 2-й интервал - (200-300 тыс. рублей) и т.д., последний интервал - (800 тыс. рублей - 1 млн. рублей).

Интервал, в котором указана лишь одна граница, называется открытым. Интервал, имеющий верхнюю и нижнюю границу, называется закрытым. Длина интервала - это разница между его верхней и нижней гра­ницей. Интервалы бывают равные, неравные и специализированные. Неравные интервалы применяются в аналитических группировках для того, чтобы число единиц совокупности в группе было достаточно вели­ко, и чтобы они были приблизительно одинаково заполнены. Специали­зированные интервалы используются в типологических группировках. Границы устанавливаются там, где намечается переход от одного качества к другому.

Величина интервала и число групп при выполнении группировки по непрерывному количественному признаку определяется, исходя из целей исследования, особенностей изучаемого признака, объема и качества имеющейся информации. Количество групп и длина интервала группировки взаимосвязаны: чем больше образовано групп, тем меньше длина интервалов и наоборот.

Ориентировочно число групп с равными интервалами можно определить по формуле американского ученого Стерджесса:

где N - объем совокупности.

Логари́фм числа b по основанию a определяется как показатель степени, в которую надо возвести основание a , чтобы получить число b . Обозначение: .

Формула (3.1) устанавливает следующие соотношения между числом групп (n) и объемом статистической совокупности (N), на базе которой строится группировка:

N 15–24 25–44 45–89 90–179 180–359 360–719
n

Соответственно, формула Стерджесса для определения длины интервала группировки по непрерывному количественному признаку выглядит следующим образом:

где и соответственно, наибольшее и наименьшее значение группировочного признака.

Все сказанное позволяет выделить следующие основные стадии в последовательности выполнения статистических группировок:

1. Обоснование группировочного признака и показателей, с помощью которых предполагается характеризовать выделенные группы.

2. Определение числа групп и длины интервалов.

3. Составление макета групповой вспомогательной таблицы и выполнение необходимых расчетов.

4. Составление макета итоговой таблицы и расчет необходимых показа­телей.

5. Анализ полученных результатов и формулировка выводов.

Задачи группировок состоят в следующем:

  • выделение социально-экономических типов;
  • изучение структуры совокупности;
  • исследование связи между признаками.

В соответствии с указанными задачами различают три вида группировок:

  • типологические;
  • структурные (вариационные);
  • аналитические (факторные).

Типологическая группировка – это разделение разнородной совокупности на однокачественные группы (частные совокупности), которые отличаются типом явлений.

Структурная группировка предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку.

Аналитическая группировка является средством изучения связи между признаками.

Особенность типологической группировки состоит в том, что перечень типов, которые могут встречаться в изучаемой совокупности, предварительно устанавливается экспертным путем в соответствии с поставленной целью исследования. Например, в целях регламентации банковской деятельности контролирующие органы США делят банки по объему собственных средств на пять типов:

Банк, который переходит в более низкую категорию, не может без разрешения регулирующих органов увеличивать активы, выплачивать дивиденды держателям акций.

В России в целях изучения деловой активности банков на основе соответствующего мониторинга, проводимого Центром экономической конъюнктуры при Правительстве РФ, их делят по такому же признаку, но только на три группы: малые, средние и крупные.

Экспертным путем осуществляется и выбор признаков для разграничения выделяемых типов явлений. Так, разделение банков по размеру возможно и по другим признакам, например по объему суммарных активов.

Структурная группировка обеспечивает разграничение групп в соответствии с уровнем вариации по изучаемому признаку. Пример такой группировки представлен в табл. 2.1.

Таблица 2.1

Группировка кредитных организаций РФ по величине активов (%, к итогу")

Группа кредитных организаций по величине активов (г), млн руб.

Количество филиалов

Собственные средства

Объем вкладов физических лиц

Объем кредитов, предоставленных банкам и другим клиентам

Пример показывает, что указанные различия между типологической и структурной группировками во многом являются условными. С одной стороны, выделенные типы отражают структуру совокупности. С другой – если задать границы интервалов суммы активов, соответствующие типам банков по размеру (малые, средние, крупные), то можно будет назвать группировку типологической.

Аналитическая группировка в силу характера решаемых задач отличается тем, что при ее построении признаки делятся на факторные и результативные. Единицы совокупности группируются по факторному признаку, а затем каждая группа характеризуется средними величинами результативного признака.

Сопоставляя изменения средних значений результативного признака по группам с изменением фактора, можно сделать вывод о наличии или отсутствии связи, ее форме и направлении (линейная или нелинейная, прямая или обратная). Пример аналитической группировки представлен в табл. 2.2.

Таблица 2.2

Характеристика зависимости соотношения вложенных и израсходованных сбережений населения региона в зависимости от состава семьи

В приведенном примере средний уровень соотношения вложенных и израсходованных сбережений населения изменится от группы к группе семей; наблюдается нелинейная зависимость между показателем, характеризующим размер семьи, и средним уровнем соотношения суммы вложенных и израсходованных сбережений: в семьях большего размера это соотношение ниже.

Использование структурных группировок позволяет не только раскрыть соотношение отдельных частей изучаемой совокупности, но и через сопоставление во времени проанализировать наметившиеся в ней структурные сдвиги. В качестве сводной характеристики интенсивности изменений можно использовать интегральные показатели структурных сдвигов, в частности линейный и квадратический коэффициенты абсолютных структурных сдвигов.

Для оценки усиления или снижения интенсивности структурных сдвигов целесообразно проводить их расчет по нескольким периодам. Достаточно распространенным сводным показателем структурных сдвигов, имеющим не только нижнюю, но и верхнюю границы изменения, является индекс различий. Он колеблется от нуля до единицы. Чем ближе его величина к единице, тем значительнее степень изменений в составе анализируемой группы статей.

Формулы расчета:

1) линейный коэффициент абсолютных структурных сдвигов:

2) квадратический коэффициент абсолютных структурных сдвигов:

Примером такого использования структурной группировки могут служить данные о прогнозе изменений в экономике, предусмотренные в приложении 2 к Концепции долгосрочного социально-экономического развития Российской Федерации на период до 2020 года (табл. 2.3).

Таблица 2.3

Прогноз изменения структуры добавленной стоимости по основным секторам экономики (в ценах 2007 г.)

Сектор экономики

Удельный вес в общей сумме добавленной стоимости, %

2007 г. (d 0)

2020 г. (d 1)

Инновационный

Нефтегазовый

Сырьевой сектор

Транспорт

Оптовая и розничная торговля

Для данных, представленных в таблице, линейный коэффициент абсолютных структурных сдвигов равен 2,6 процентного пункта (п. п.); квадратичный коэффициент абсолютных структурных сдвигов равен 3,6 п. п.; индекс различий равен 0,08.

Данные, приведенные в табл. 2.3, и показатели интенсивности структурных сдвигов свидетельствуют о прогнозируемых заметных изменениях в составе добавленной стоимости по основным секторам экономики за 2007–2020 гг.

Группировка может быть произведена по одному или нескольким признакам. Если группы образуются по одному признаку, группировка называется простой.

Группировка, в которой разделение совокупности на группы производится по двум или более признакам, взятым в сочетании, называется комбинационной. В этом случае каждая группа, выделенная по одному (первому) признаку, разбивается на подгруппы по второму, а последние – на подгруппы по третьему признаку и т.д.

Одновременное использование нескольких группировочных признаков позволяет выявить качественные различия, структурные особенности и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков. Однако комбинация группировочных признаков резко увеличивает число групп, отсюда при использовании комбинационных группировок предполагается достаточно большое число наблюдений.

Основанием группировки может служить как неколичественный (атрибутивный), так и количественный признак.

Атрибутивные признаки выражают свойства явления в виде их наименования. Отсюда выбор группировочного признака предопределяет иногда и количество групп. Так, при группировке населения по полу возможны только две группы, а при изучении профессионального состава рабочих может быть образовано несколько групп с учетом разных профессий.

В целом атрибутивный характер признака не снимает вопроса о числе выделяемых групп, так как при обилии атрибутивных вариантов создается чрезмерная раздробленность изучаемого явления. В результате для образования групп по таким признакам приходится объединять ряд их значений. Рекомендуется, например, объединять родственные профессии в группы, охватывающие тот или иной вид труда (токари, фрезеровщики могут быть объединены в группу станочников), либо рабочие различных профессий вспомогательного производства могут быть распределены на следующие укрупненные группы: ремонтную, технического контроля, транспортную и т.д.

Разграничение групп и подгрупп по количественным группировочным признакам, как правило, связано с образованием интервалов по этим признакам. Лишь тогда, когда дискретный признак изменяется в небольших пределах, группировка совпадает со значением признака (например, семьи – по числу членов и т.д.).

Интервалы группировки – это количественные значения признака, на основе которых исследуемые явления разбиваются на группы. Разность между верхней и нижней границами интервала составляет его величину. Интервалы бывают равными (когда их величина одинакова во всех группах) или неравными (когда их величина изменяется от одной группы к другой).

Равные интервалы применяются в тех случаях, когда изменение признака происходит в сравнительно узких границах и носит более или менее равномерный характер. Они дают возможность шире применять математические приемы анализа.

Для группировки с равными интервалами величина интервала определяется по формуле

где i – величина отдельного интервала; и – наибольшее и наименьшее значения признака в исследуемой совокупности; п – число групп.

Неравные интервалы иногда применяют как прогрессивно возрастающие или убывающие. Использование таких интервалов при изучении социально-экономических явлений обусловлено тем, что для большей их части количественное изменение размера признака имеет неодинаковое значение в высших и низших группах. Так, разница в товарообороте, составляющая 10 тыс. руб., для мелких магазинов имеет существенное значение, а для крупных – несущественное.

И наконец, интервалы группировки могут быть замкнутыми (с указанием нижней и верхней границ) и открытыми (с указанием одной из границ). Открытые интервалы применяют только для крайних групп.

Порядок выбора группировочного признака, приемы образования, смысл и значение интервалов и групп – все эти вопросы конкретизируются применительно к каждому виду группировок.

Число интервалов при типологической группировке определяется числом выделенных типов, а величина каждого из них зависит от содержания отграничиваемого с его помощью типа. При этом используют, как правило, открытые и неравные интервалы.

В аналитических и структурных группировках анализ проводится в рамках однокачественных совокупностей, отграниченных в результате типологической группировки. В связи с этим объективного единого принципа определения числа групп нет. В каждом конкретном случае необходимо принимать во внимание объем изучаемой совокупности и характер изменчивости признака. Чем значительнее совокупность единиц, чем интенсивнее меняется признак, тем больше может быть образовано групп. С целью определения границ вариации и непосредственного сопоставления изменения взаимосвязанных признаков в структурных и аналитических группировках применяют чаще всего закрытые, равные интервалы. Однако требование, связанное с обеспечением достаточной заполненности групп, приводит к необходимости использования в ряде случаев группировки но неравным интервалам.

Ориентировочно количество групп при группировке с равными интервалами можно рассчитывать по формуле, предложенной американским ученым Стерджессом:

где N – число единиц совокупности; п – число групп.

Статистические группировки, как правило, формируют на основе первичного статистического материала. Такие группировки называют первичными. Иногда для образования новых групп приходится пользоваться уже имеющимися группировками. Такие группировки называют вторичными.

Необходимость в перегруппировке данных возникает в тех случаях, когда произведенные ранее группировки не удовлетворяют целям исследования по двум основным причинам:

  • число имеющихся групп больше (или меньше), чем это требуется для характеристики типических отношений и связей;
  • первичная группировка проведена по разным группировочным признакам или разным интервалам с точки зрения сопоставимости данных, относящихся к различным периодам времени или различным территориям.

Новые группы могут быть получены следующими способами:

  • 1) перегруппировкой по величине интервалов первичной группировки;
  • 2) перегруппировкой по удельному весу отдельных групп в общем их итоге.

Для достижения единообразия в обработке статистических данных на практике часто используют классификации.

Классификация рассматривается как разновидность типологической группировки. Она представляет собой систематизированные распределения явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Примерами могут служить ОКВЭД, классификация секторов экономики и экономических активов в системе национальных счетов и др.

Классификация является своеобразным стандартом, установленным на определенный промежуток времени. В основе классификации, как правило, лежит атрибутивный признак, который может иметь множество разновидностей. Они дополняются и конкретизируются в номенклатуре. Под номенклатурой понимается стандартный перечень объектов и групп, входящих в определенную классификацию.

Четко разделить группировки и классификации довольно трудно, поскольку они выполняют однотипные функции. Классификации рассчитаны на длительное применение, однако с течением времени их пересматривают и корректируют.

В отличие от классификации группировки производят для целей данного конкретного исследования, рассмотрения в нем какого-либо отдельного вопроса. Например, при разработке концепции жизненного цикла домохозяйства американскими маркетологами использовались следующие границы возраста: молодость – до 35 лет; средний возраст – 35–64 года; старший возраст – 65 лет и старше.

В отечественной практике для анализа поведенческой модели различных групп населения на потребительском рынке согласно методике регулярных опросов потребительского поведения населения в России, которые проводятся Росстатом ежеквартально, используются другие возрастные границы: молодость – 16–29 лет; средний возраст – от 30–49 лет; старший возраст – 50 лет и старше.

В настоящее время с целью группировки объектов, характеризующихся большим количеством признаков, широко используются методы многомерной группировки, или методы многомерной классификации.

По существу, здесь сохраняется реализуемый при типологической группировке принцип сходства и различия единиц совокупности. Сходство – это однородность единиц в группах, различие – это их существенное расхождение по группам. Иными словами, во-первых, в один класс объединяются объекты, сходные между собой в некотором отношении, а во-вторых, степень сходства объектов, принадлежащих к одному классу, должна быть больше, чем степень сходства объектов, относящихся к разным классам. В типологической группировке понятия сходства и степени сходства не формализованы, а в процедурах многомерной классификации они формализованы и выражаются рядом функциональных соотношений.

В случае многомерной классификации при распределении единиц па однородные группы одновременно используются все группировочные признаки, т.е. реализуется политетический подход к образованию групп.

Объекты объединяются в один класс в соответствии с выбранным типом мер их сходства (коэффициенты связи, показатели расстояния, коэффициенты подобия). Например, данный метод статистического анализа приобретает особое значение в связи с введением системы управления предприятиями и организациями, обеспечивающей своевременное изменение параметров их деятельности в условиях нестабильности внешней среды, для адаптации к запросам конъюнктуры рынка. Сложность решения такого рода задач заключается в том, что в этом случае необходимо проводить анализ не изолированно, а в сравнении с другими субъектами хозяйственной деятельности.

Переход к широкому использованию методов многомерной классификации связан с накоплением достаточно большого объема систематизированной информации. В связи с этим неслучайно сферой активного приложения метода многомерной классификации стал финансовый сектор. Отчетность институциональных единиц этого сектора, прежде всего банков, в силу специфики их деятельности как финансовых посредников формируется с учетом

потребностей различных категорий внешних пользователей, например классификация коммерческих банков по уровню их деловой активности, ресурсообеспеченности, кредитоориентированности, инвестиционной активности, финансовой устойчивости.

Простейшим вариантом многомерной классификации является группировка на основе многомерной средней. Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. В силу несопоставимости абсолютных значений разных признаков многомерная средняя вычисляется из относительных величин, рассчитанных по этим признакам. Формула многомерной средней следующая:

где i – номер единицы совокупности; j – номер признака; – многомерная средняя для i -й единицы совокупности; т – число признаков; – значение признака для i -й единицы; – среднее значение признака , рассчитанное по всей совокупности единиц.

Пример группировки на основе многомерной средней представлен в табл. 2.4.

Таблица 2.4

Группировка банков по показателям эффективности управления активными и пассивными операциями

Доходность активов (x 1)

Маржа прибыли, т.е. отношение прибыли к доходам 2)

Средние значения

Рассчитанные многомерные средние позволяют сравнить банки и сделать вывод, что два банка имеют примерно одинаковый уровень эффективности управления активами и пассивами, один банк – средний уровень, два банка отстают от остальных и имеют примерно одинаковую величину Р, (0,58 и 0,50).

Группировкой называется разбиение общей совокупности единиц объекта наблю-дения по одному или нескольким существенным признакам на однородные группы, раз-личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи-ровать связи между отдельными признаками. Группировки являются важнейшим стати-стическим методом обобщения статистических данных, основой для правильного исчис-ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати-стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос-новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения соста-ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна-ками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки не-обходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются дру-гие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе-ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

Единицы статистической совокупности группируются по факторному признаку;

Каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).


Сначала группы формируются по одному признаку, затем группы делятся на под-группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно-сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь-ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про-изводить группировку по атрибутивным признакам, значения которых имеют ярко выра-женные качественные различия.

Принципы построения статистических группировок и классификаций.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери-зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится раз-биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп-пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест-венные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отрас-левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе-стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос-нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно-сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распреде-ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко-леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце-нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R = Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на-блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве-сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче-ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно-стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль-но-математический способ предполагает использование формулы Стерджесса :
n = 1 + 3,322 × lgN, (3.1)

n - число групп;

N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово-купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред-него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп-ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп-ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето-дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных гра-ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

Равные и неравные;

Открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про-грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при-знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/n = Xmax - Xmin/n (3.2)

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини-мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели-чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це-лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи-руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав-ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по-сле построения равных интервалов по изучаемому признаку образуются группы, содер-жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо-димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес-сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва-лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле-дующим образом:

h i+1 = h i + a,

а в геометрической прогрессии:

h i+1 = h i x q,

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь-шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа-телю численности работающих, который варьирует от 500 человек до 3500 человек, неце-лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп-нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор ис-следователя в построении равных или неравных интервалов зависит от степени заполне-ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су-щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно-сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос-тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин-тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны-ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна-чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю-чать единицы наблюдения, значения признака у которых совпадают с границами интерва-лов. Например, во вторую или третью группу должна войти строительная фирма с объе-мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про-тивном случае - ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель-ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди-ниц совокупности, значения которых являются граничными, к той или иной группе реша-ется на основе анализа последнего открытого интервала.

Возможны два случая обозначе-ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин-тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интерва-лы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло-виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес-сивно-убывающими. Такие интервалы называются произвольнымии , как правило, ис-пользуются при группировке предприятий, например, по уровню рентабельности.