Статистическая группировка. Классификация и группировка в статистике

10. Виды группировок

В зависимости от степени сложности изучаемого явления и от поставленных задач статистические группировки могут выполняться по одному или нескольким группировочным признакам.

Группировка называется простой (одномерной) , если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

структурные – предназначены для выявления состава изучаемого явления;

типологические – предназначены для выделения в статистической совокупности различных социально-экономических типов явлений;

аналитические (факторные) – используются для изучения связей и зависимости между варьирующими признаками.

Структурные группировки

Структурные группировки используются для изучения внутреннего строения статистической совокупности и характеристики структурных сдвигов. Они дают информацию о текущем состоянии массовых явлений и применяются в целях оперативного управления.

Структурная группировка выполняется в несколько этапов:

выбор группировочного признака;

определение необходимого числа групп;

определение параметров групп;

распределение единиц наблюдения по выделенным группам;

расчет структурных характеристик;

формулировка выводов.

Выбор группировочного признака осуществляется в соответствии с целями статистического исследования. В качестве группировочного обычно выступает существенный признак. Обязательным условием выполнения любой группировки, в том числе и структурной является упорядочение статистической совокупности по значениям группировочного признака.

Определение необходимого числа групп . Число групп должно быть достаточным для объективного представления изучаемой совокупности. При большом числе групп различия между ними становятся малозаметными, а в самих группах в виду их малой наполняемости перестает действовать закон больших чисел и возможно проявления случайности. При малом же их числе в одну группу могут попасть статистические единицы с существенно различающимися значениями признака.

На количество выделяемых групп влияют следующие факторы:

уровень колеблемости группировочного признак - чем значительнее вариация признака, тем большее количество групп необходимо выделять при прочих равных условиях;

размер изучаемой статистической совокупности - чем больше размер исследуемой совокупности, тем большее количество групп необходимо выделять.

Выделенные группы должны быть достаточно заполненными. Наличие пустых групп или малое число статистических единиц в них свидетельствуют о неправильном определении их числа.

Ориентировочно число групп можно определить использую эмпирическую зависимость, называемую формулой Стерджесса:

m ≈ 1 + 3,322 × lg N ,

где m – количество групп;

N - число единиц статистической совокупности.

Зависимость Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близкое к нормальному, и при этом используются равные интервалы.

Существует еще один способ определения количества выделяемых групп, он связан с применением среднеквадратичного отклонения равными и неравными σ : если ширина интервала равна 0,5σ , то выделяется 12 групп, если 2/3σ ,то 9 групп, если σ – то 6 групп.

В каждой выделенной группе рассчитываются следующие параметры:

верхняя граница интервала x i в

нижняя граница интервала x i н

ширина интервала а i ;

середина интервала b i .

Нижней границей интервала x i н называется наименьшее значение признака в группе.

Верхней границей интервала x i в называется наибольшее значение признака в группе.

Интервалы группировки бывают равными и неравными (прогрессивно возрастающими, прогрессивно убывающими, произвольными, специализированными).

Если вариация признака проявляется в сравнительно узких границах, и распределение статистических единиц носит достаточно равномерный характер, то строят группировку с равными интервалами.

Для равноинтервальной группировки ширина интервала а i определяется по формуле:

а i = (X max – X min ) / m = R / m

где R – размах вариации,

R = X max - X min

При определении размаха вариации R из наблюдения исключаются аномальные значения признака. Полученное значение ширины интервала а i округляется в бóльшую сторону. На основе рассчитанной ширины интервала а i последовательно определяется границы интервалов x i н и x i в .

Определение границ начинается с первой группы. Ее нижняя граница принимается равной минимальному значению признака в совокупности, т. е. х 1 н min , верхняя граница определяется как x 1 в = х 1 н + а i

Для второй группы нижняя граница принимается равной верхней границе первой группы, т. е. x 2 н 1 в , верхняя определяется как x 2 в = х 2 н + а i и так далее.

В целом границы интервалов определяются формулами:

x i н = x i -1 в .

x i в = x i н + а i

Середина интервала (центральная варианта) b i определяется как полусумма верхней и нижней границ, т.е. по формуле:

b i = ( x i в + x i в )/2

Параметр середина интервала используется при расчете обобщающих характеристик изучаемой совокупности. Достаточно часто при выполнении группировки используются открытые интервалы. В открытых интервалах указывается только одна граница: верхняя - у последнего интервала, нижняя – у первого.

Для закрытия таких интервалов необходимо предварительно определить их ширину. Проблема ширины открытых интервалов решается следующим образом:

    при равноинтервальной группировке она есть величина постоянная;

    при неравноинтервальной - предварительно определяется закономерность изменения ширины интервала для некрайних групп, выявленная закономерность позволяет определить ширину соответствующего интервала и рассчитать недостающую границу.

Распределение единиц совокупности по группам.

Основной задачей данного этапа является подсчет числа единиц, попавших в каждую из выделенных групп n i .

При распределении единиц наблюдения по выделенным группам, особенно если группировочный признак является непрерывным, имеет место неопределенность: к какой группе относить единицы со значениями признака, совпадающими с границами интервалов? Для устранения неопределенности используют принцип единообразия – такие единицы включаются в группу, в которой нижняя граница совпадает со значением признака.

Например , имеются группы предприятий по объему производства, млн. руб.: 400 – 450; 450 – 500; 500 – 550; 550 – 600; 600 – 650.

К какой группе следует отнести предприятия с объемом производства 500млн. руб.? В соответствии с принципом единообразия - ко второй группе.

Расчет структурных характеристик.

Расчет заключается в определении для каждой группы удельного веса (доли) ее единиц в общем объеме статистической совокупности. Как и любая относительная величина этот показатель может быть определен в виде коэффициентов:

d i = n i / N

или в виде процентов

d i = ( n i / N ) ×100%

Рассчитав такие доли для всех групп, мы получаем структуру изучаемой статистической совокупности, равную полному набору долей, т.е. сумма d i = 1

или

сумма d i = 100%

На основе анализа показателей структуры делаются соответствующие выводы.

Формулировка выводов о составе совокупности

Для структурных группировок в выводах отражаются два положения:

Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

Каков характер изменения структуры в зависимости от изменения значения признака. С увеличением x доля может увеличиваться, либо уменьшаться. Это довольно типично для экономических показателей.

Выводы должны быть сделаны обязательно, иначе пропадает смысл группировки. Данные структурных группировок обычно представляются в форме соответствующей таблицы.

Типологическая группировка

Ее цель состоит в изучении распространенности различных типов экономических явлений в статистической совокупности. Типологические группировки применяются, как правило, к неоднородной совокупности и осуществляются посредством сложных неравноинтервальных группировок.

Результатом типологических группировок является разделение совокупности на классы, социально- экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная, смешанная) или группировка секторов экономики.

При выполнении типологических группировок важно правильно выбрать основание группировки. Для этого необходимо предварительно выявить возможные типы явления на основе анализа сущности и закономерностей его развития. Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Аналитические группировки

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы:

    факторные

    результативные.

Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Сложные группировки

К сложным группировкам относятся группировки, выполняемые по двум и более основаниям. Сложные группировки делятся на-

    комбинационные

    многомерные.

Комбинационные группировки выполнятся по нескольким признакам последовательно. Последовательность устанавливается исходя из логики взаимосвязи показателей. Как правило, группировку начинают с атрибутивного признака. При комбинационной группировке совокупность логически последовательно разбивается на однородные части по отдельным признакам: на группы - по одному признаку, затем внутри каждой группы по второму признаку - на подгруппы и т.д. Такие группировки предназначены для более глубокого анализа изучаемого явления, позволяют выявить и сравнить различия и связи между исследуемыми признаками, которые невозможно установить на основе изолированных группировок по каждому из исследуемых признаков. Однако следует иметь в виду, что при изучении влияния большого числа признаков применение комбинационных группировок невозможно, так как это приводит к дроблению информации, а значит, к затушевыванию проявлений закономерности. Даже при наличии больших объемов информации приходится ограничиваться двумя – четырьмя признаками.

Комбинационная группировка по двум признакам (X, Y ) оформляется в виде шахматной таблицы, в которой значения одного признака X откладываются по строкам, а значения второго признака Y – по столбцам. На пересечении j –ого столбца и i -ой строки (в теле таблицы) находятся частоты совместного проявления значения признака Y в j- ом столбце и значения признака X в i -ой строке.

К многомерным группировкам относятся группировки, выполненные по нескольким группировочным признакам одновременно.

Цель многомерных группировок – классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно.

В процессе такой группировки решаются, например, задачи типизации – выделяются самостоятельные экономические или социальные типы явлений.

Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д. Можно выделить типы предприятий по финансовому положению на основе таких показателей как размер прибыли, уровень рентабельности производства, уровень капитализации, уровень ликвидности ценных бумаг и т.д.

В психологии многомерные группировки используются для выделения типов людей по степени их профессиональной пригодности, в медицине – для диагностики болезней на основе множества симптомов.

При выполнении многомерных группировок могут быть использованы два основных подхода:

Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.

Второй подход состоит в использовании методом кластерного анализа.

Основой статистической группировки является группиро- вочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2.

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды но ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена но национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы но одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным. Типичным примером является группировка населения по полу.

Группировки в уголовно -- правовой статистике позволяют дать наиболее полную и всестороннюю криминологическую и уголовно-правовую характеристику по самым разнообразным признакам (по видам -- статьям УК, по объекту посягательства, по территориальному признаку -- район, область, край, республика, соотношение корыстных и насильственных преступлений, по времени совершения преступлений и т.д.), личности преступников (по полу, возрасту, образованию, социальному положению, месту жительства и т.д.), причин и условий, способствующих совершению преступлений, а также мер социально-правового контроля над ними. При этом очень важно различные группировки из уголовно-правовой статистики сопоставлять не только друг с другом, но и с группировками из иных отраслей статистики (демографической, социально-экономической и др.), отражающих взаимосвязанные явления.

Различия в целевом назначении группировки, задачах, которые они решают в статистическом анализе, выражаются в существующей их классификации: типологические, структурные, аналитические.

Важнейшая задача группировок в статистике заключается в том, чтобы изучаемую массу единиц совокупности подразделить на характерные типы, т.е. на группы, однородные по существенным признакам. Эта задача решается с помощью типологической группировки.

3.1 Типологические группировки

Типологические группировки -- это разграничение изучаемой совокупности на однородные группы, типы по существенному качественному признаку.

Основная цель типологической группировки -- отграничение одного типа явлений от другого статистическими средствами. Этот вид группировок в значительной степени определяется сложившимися представлениями о том, какие типы явлений составляют содержание изучаемой совокупности. В правовой статистике это три типа правоотношений: уголовно-правовые, административно-правовые и гражданско-правовые, которыми и определяются ее разделы. В уголовно -- правовой статистике, в частности, это может быть, например, распределение по полу лиц, совершивших преступления

Данная группировка по качественному признаку, когда имеются всего лишь два значения этого признака, причем одно из них исключает другое, в статистке именуется альтернативной.

Последовательность действий проведения этого типа группировки элементарна:

1) определяется тип явления, которое должно быть выделено -- в нашем случае зарегистрированные преступления;

2) выбирается группировочный признак как основание описания типа -- в нашем случае пол лиц, совершивших преступления;

3) устанавливаются границы интервалов (в нашем случае по всем лицам, выявленным в совершении преступлений);

4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы и определяется численность (удельный вес) каждого из них.

При типологической группировке, т.е. при подытоживании единиц в качественно-однородные категории, эти категории должны, как отмечалось, определяться на основании положений соответствующей науки и норм закона. Например, группировка наказаний по видам осуществляется уголовно -- правовой (судебной) статистикой в полном соответствии со ст. 43--59 УК, устанавливающих с исчерпывающей полнотой точные качественные признаки их отдельных видов (штраф, исправительные работы, лишение свободы и т.д.

3.2 Структурные группировки

Структурные группировки -- это распределение типически однородных групп по количественным признакам, которые могут изменяться (варьировать). В научной литературе этот вид группировок иногда называют вариационным. С их помощью в уголовно-правовой статистике изучают, например, структуру преступников по варьирующему признаку: по возрасту, числу судимостей, по срокам лишения свободы, размерам заработной платы и другим количественным признакам.

Структурная, или вариационная, группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений, правонарушителей, гражданских исков и других показателей. Для структурной группировки материала необходимо наличие однородных совокупностей, расчленяемых по величине изменяющегося (варьирующего) признака. Если в основе типологической группировки лежат качественные признаки, то в основу вариационной положены количественные (удельные веса преступлений, лиц, дел, возраст правонарушителей, сроки наказания, число судимостей, число оконченных классов, суммы ущерба, суммы иска, сроки расследования и рассмотрения уголовных или гражданских дел и т.д.).

Количественные сдвиги в структуре изучаемых явлений за несколько лет свидетельствуют об изменении объективных тенденций и закономерностей, следственной или судебной практики, о результативности деятельности правоохранительных или других юридических органов. Взяв, например, абсолютные и относительные показатели судимости за много лет, мы выявим тенденции в судебной практике и ее связь с реальной преступностью. Изучив динамику абсолютных чисел учтенных преступлений какого-то вида, динамику его удельного веса в структуре всей преступности, мы обнаружим тенденции развития этого деяния.

Структурные группировки могут быть построены на основе долевого распределения преступлений по сферам и объектам преступного посягательства, субъектам Федерации, регионам и территориям

Структурные различия в этом случае могут раскрывать особенности криминологической обстановки в том или ином регионе.

К структурным (вариационным) группировкам примыкают ряды распределения единиц совокупности по варьирующим признакам.

Например, доли преступлений по образовательному признаку в 70-ые годы. Так, 79% всех правонарушителей имели образование в пределах четырех -- семи классов, а среди дезертиров и членовредителей их насчитывалось соответственно 91,2% и 88,8%, и не было ни одного с законченным средним образованием. Различия между Структурными группировками и рядами распределения в наших примерах заключаются в том, что первые вскрывают закономерности изменения структуры во времени или пространстве, а вторые -- закономерности в характере распределения данных.

3.3 Аналитическая группировка

Аналитические группировки -- это распределение по зависимости, взаимосвязи между двумя или несколькими разнородными группами явлений или их признаками (например, распределение краж по месту и времени их совершения; осужденных за автотранспортные преступления -- по стажу работы водителя и т.д.).

Аналитические группировки имеют большое значение для всех отраслей юридической статистики. Они дают возможность выявить многие скрытые зависимости и взаимосвязи, что имеет важное значение для принятия практических решений и развития юридической науки. Аналитический потенциал есть и у других видов группировок, а также иных статистических приемах, но собственно аналитическая группировка прямо преследует установление зависимостей между исследуемыми явлениями.

По характеру своих задач к аналитической группировке близко стоят группировки корреляционные, когда зависимость между исследуемыми явлениями или процессами может быть относительно точно измерена.

Все виды рассмотренных группировок при анализе социально-правовых, деликтологических и криминологических аспектов, как правило, применяются вместе. Например, для установления общественной опасности и тяжести совершаемых преступлений мы можем расчленить их совокупность по категориям деяний и формам вины (типологическая группировка). Для определения результативности борьбы с преступностью различных правоохранительных органов (внутренних дел, наркоконтроля, таможенной службы, прокуратуры, службы безопасности) мы можем исследовать варьирование раскрываемости преступлений в упомянутых ведомствах (вариационная группировка). Для того чтобы установить причины и условия роста или (снижения преступности в городе, регионе, стране) следует применить целый ряд аналитических группировок.

3.4 Виды аналитических группировок

На основе рассмотренных базовых группировок могут формироваться группировки сложные, комбинированные, многомерные, вторичные и другие.

Сложные группировки обычно отражают разнородность изучаемых явлений, когда последние имеют несколько противоречивых тенденций динамики и распределения. Наиболее распространенный вид сложных группировок -- комбинированные, которые формируются не по одному, а многим признакам, нередко иерархизированным между собой.

Комбинированные группировки помогают решать многие задачи -- и выделения типов, и выявления структурных сдвигов, и изучения взаимосвязей.

Многомерные группировки формируются на основе одного из методов статистической теории распознавания образов -- кластерного анализа (от англ. cluster -- скопление, группа элементов, характеризуемые каким-то общим свойством). Кластерный анализ включает в себя большое количество вычислений и обязательно связан с использованием быстродействующих ЭВМ, что в настоящее время не является препятствием. Эти вычисления производятся не последовательно по отдельным признакам (как при комбинированной группировке), а одновременно по большому набору признаков. Этот набор образует так называемое признаковое пространство.

Каждому признаку придается смысл координаты. Если в наборе Г большое число (обозначим его символом п) признаков, то каждый объект рассматривается как точка в n-мерном пространстве. Задача многомерной группировки сводится к выделению сгущений точек (группы объектов) в этом пространстве. Геометрическая близость двух или нескольких точек (объектов) в этом пространстве означает как бы их количественную однородность по описываемым признакам. Мерой близости (сходства) между объектами могут служить различные критерии: коэффициент корреляции, евклидово расстояние между объектами и др. Чем меньше это расстояние, тем больше сходства.

Задача многомерной группировки сводится к выделению сгущений точек объектов в образуемом пространстве. Группы объектов (кластеры), сформированные на основе "близости", описывают объект одновременно по всему комплексу признаков. На основании многомерных группировок совокупность статистических признаков расчленяют на однородные группы таким образом, что различия между признаками, попавшими в одну группу, оказываются менее значительными, чем между признаками, попавшими в разные группы. Освоение многомерных группировок юридическими статистиками на основе современных компьютерных программ поможет решить многие сложные проблемы в криминологии, деликтологии и социологии права в тех случаях, когда число различных факторов (объектов) исчисляется сотнями и даже тысячами, а их взаимосвязи при обычных статистических методах выявляются с трудом.

Вторичные группировки представляют собой образование новых группировок на основе имеющихся. Это осуществляется путем изменения (укрупнения) интервалов в вариационных группировках или путем долевых перегруппировок имеющихся показателей в типологических и аналитических группировках. Такая необходимость возникает при преобразовании группировок, построенных на основе количественных признаков, в качественные однородные группировки; при Приведении двух и более группировок с различными интервалами к одной сопоставимой; при образовании более укрупненных групп, в которых яснее проявляются реальные тенденции.

Вторичные группировки могут решать и более сложные задачи. Нидерландский криминолог Берг, не владея закрытой в 80-е гг. уголовной статистикой СССР, на основе огромного числа открытых советских публикаций (отдельных сведений и таблиц), в которых приводились абсолютные и относительные (в процентах) показатели об уровне, структуре и динамике преступности и судимости в СССР, рассчитал и построил единый статистический ряд данных о судимости в СССР за 1920--1982 гг. Нельзя признать, что его вторичное обобщение было абсолютно точным, но полученные сведения близки к данным официальной статистики и относительно полно раскрывали уровень и тенденции судимости в нашей стране, где они в эти годы имели гриф "совершенно секретно".

Вторичные группировки осуществляются путем сглаживания, укрупнения и смыкания ряда дробных показателей.

Сглаживание рядов динамики различными методами предполагает, когда из данных первичной группировки вычисляются средние и иные показатели, в связи с чем ряд принимает плавный, сглаженный вид, что способствует более четкому выявлению основных тенденций. Например, динамический ряд преступности по среднепятилетним арифметическим данным устраняет случайные колебания в отдельные годы и выявляет главную тенденцию сокращения или роста преступных проявлений в городе, регионе или стране.

Укрупнение ряда представляет собой суммирование данных за более продолжительные отрезки времени, что постоянно практикуется в правоохранительных и других юридических органах. Например, месячные юридически значимые сведения суммируются по кварталам и по годам без усреднения данных, как при сглаживании. Иногда такое укрупнение идет по нарастающей. Например, в 1996г. в России в январе месяце учтенная преступность увеличилась по сравнению с аналогичным периодом предыдущего года на 6,9%. В январе -- феврале прирост составил 3,2%. Затем началось снижение преступности. В январе-марте этот показатель составил --0,1; в январе -- апреле 0,8; в январе--мае -- 1,8 и далее: --3,1; -- 3,2; -- 4,1; -- 4,5; -- 4,4; -- 4,8; -- 4,7. Таким образом, за 1996г. в целом преступность сократилась на 4,7%. Последовательное укрупнение показателей на каждом этапе раскрывало реальный совокупный прирост за прошедшие месяцы года.

Смыкание рядов динамики применяется при наличии несопоставимости анализируемых показателей. Например, в какие-то годы преступность учитывалась в уголовных делах или в осужденных, а затем -- в преступлениях. В подобных случаях берут год, за который могут быть получены данные в прежнем и измененном объемах. Каждый из объемов принимается за базу (100%), и от нее вперед и назад строится непрерывный (сомкнутый) динамический ряд. Предположим, что до 1990г. преступность учитывалась в осужденных и с этого же года стала учитываться в преступлениях. В 1990г. было осуждено 897 299 человек и зарегистрировано 1 839 451 преступление. Число осужденных принимается за 100%, и все предыдущие данные процентируются от этой базы. В 1989г. оказалось 94,5%, в 1988г. -- 93,0% и т.д. Число учтенных преступлений в 1990г. также принимается за 100%, и все последующие данные рассчитываются в процентах, исходя из этой базы. В 1991г. оказалось 117,9%, в 1992г. -- 150,1 и т.д. С непрерывным рядом показателей далее возможны любые операции. Полученные данные будут не совсем точными, но они более или менее правильно отражают имеющиеся закономерности единого ряда статистических величин.

Статистика располагает и более сложными приемами преобразования, такими как аналитическое выравнивание ряда динамики по прямой и другими математическими методами, которые требуют специальной подготовки.

Подсчет данных статистического наблюдения и группировка показателей -- это третий элемент рассматриваемого метода. Раньше он, как правило, производился вручную, в 70-е гг. -- на счетно-перфорационных машинах, а ныне идет интенсивный переход на ЭВМ с большой памятью и быстродействием. Однако ручная сводка материала в социально-правовых и криминологических изучениях еще достаточно широко применятся в настоящее время.

Если статистическое наблюдение было ограничено официальной отчетностью, то сводка его упрощается, поскольку уже сами отчеты представляют собой сложную и разнообразную группировку показателей с подсчетом итогов. Сводка данных в этом случае ограничивается работой с месячными и квартальными (годовыми) отчетами, выбором из них необходимых данных и последующих вторичных и комбинационных группировок, необходимых для решения тех или иных задач.

В случаях, когда статистическое наблюдение проводилось в форме специально организованного обследования, то в итоге наблюдения изучающий получает огромную массу рабочих карточек, анкет, записей, несущих в себе разнообразную информацию. Сводка полученного материала, если он не переносится на перфокарты или магнитные носители, может производиться только вручную путем разметки карточек и сортировки их каждый раз на отдельные группы для непосредственного подсчета показателей по каждой группе и совокупности в целом.

Применение перфокартных систем, которые ныне себя изжили, в недалеком прошлом позволяло относительно быстро находить информационные данные, несмотря на то, что карты в массиве расположены бессистемно, и это значительно облегчало сводку показателей. Перфокартная система была большим шагом вперед по сравнению с ручной обработкой Данных. Для их подсчета существовали счетно-перфорационные машины, машины-табуляторы и нехитрые приспособления для ручной обработки. Это позволяло относительно легко работать с ними с помощью буквенных и числовых ключей и некоторых механических приспособлений. Там, где не представляется возможным использовать ЭВМ, можно воспользоваться перфокартными системами.

Широкое внедрение ЭВМ и разнообразного программного обеспечения для решения практически любых статистических задач серьезно облегчает сводку и обработку данных статистического наблюдения, распечатку их в нужных таблицах и графиках, проведение сложной и объемной аналитической работы.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Введение

В практической статистике широко применяется метод классификаций и группировок. Классификация - это систематическое распределение явлений и объектов по определенным группам, классам, разрядам на основании их сходства и различия. Используют классификации: отраслевую; профессиональную; основных фондов; капитальных вложений; строительных машин.

Для дальнейшей обработки собранных в ходе статистического наблюдения первичных данных широко используют и метод группировки.

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.

Признаки, по которым проводится группировка, называют группировочными признаками. Группировочный признак иногда называют основанием группировки. Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.).

При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д.

Виды группировок. Статистическая таблица

Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей.

С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности (табл. 1), по формам хозяйствования, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы.

Таблица 1 - Группировка полиграфических предприятий одного из городов России по формам собственности

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть может решаться задача по изучению структурного состава той или иной однородной совокупности, структурных изменений по тому или иному группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений (табл. 2).

Таблица 2 - Группировка населения России по размеру среднедушевого дохода (условные цифры)

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы. Пример аналитической группировки представлен в табл. 3.

Таблица 3 - Группировка продолжительности договорных связей книжного магазина и качества продукции

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими.

Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам. Статистическая таблица содержит два элемента: подлежащее и сказуемое.

Подлежащее статистической таблицы есть перечень групп или единиц, составляющих исследуемую совокупность единиц наблюдения.

Сказуемое статистической таблицы - это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц.

Различают простые, групповые и комбинационные таблицы.

В простых таблицах , как правило, содержится справочный материал, где дается перечень групп или единиц, составляющих объект изучения. При этом части подлежащего не являются группами одинакового качества, отсутствует систематизация изучаемых единиц. Сказуемое этих таблиц содержит абсолютные величины, отражающие объемы изучаемых процессов.

Групповые и комбинационные таблицы предназначены для научных целей, где, в отличие от простых таблиц, в сказуемом - средние и относительные величины на основе абсолютных величин.

Групповая таблица - это таблица, где статистическая совокупность разбивается на отдельные группы по какому-либо одному существенному признаку, при этом каждая группа характеризуется рядом показателей. Примером такой группировки может быть разделение российских семей на группы по месту проживания (сельское и городское), где образуются подгруппы семей по количеству детей. Анализ этих группировок по материалам переписи 1989 года позволил сделать вывод, что большинство семей, независимо от принадлежности к городскому или сельскому населению, имеют только по одному ребенку.

Комбинационная таблица - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Примером комбинационной группировки может быть распределение полиграфических предприятий по трем существенным признакам: степени оснащенности современным полиграфическим оборудованием, степени применения современных технологий и уровню производительности труда. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.