Показатели центра распределения. Показатели распределения

Наиболее общим, а следовательно наиболее фундаментальным, является определение центра распределения согласно принципу симметрии, то есть как такой точки на оси х, слева и справа от которой вероятности появления случайной величины одинаковы и равны 0.5. Такой показатель центра распределения называется медианой. В отличие от других показателей центра, медиана существует у любого распределения. Медиану обычно обозначают как Me.  

математическое ожидание , то в качестве меры рассеяния случайной величины используют дисперсию. Дисперсия - это среднее значение квадратов отклонений случайной величины от ее математического ожидания . Дисперсия является вторым центральным моментом распределения.  

Если в качестве показателя центра распределения выбрано математическое ожидание , то коэффициент асимметрии рассчитывают, используя третий центральный момент распределения.  

Для представления обобщающих показателей, предположим, доходности активов, цен активов или числа финансовых операций , мы используем показатели центра распределения, показатели вариации , показатели скошенности (асимметрии) и показатели эксцесса.  

Как видно из табл. 15.2, три показателя, положение центра распределения для рассматриваемого нами примера, различны (среднее значение - 4,724 мода - 6,000 медиана - 5,000). И это неудивительно, поскольку каждый показатель определяет центр распределения по-разному. Какой же показатель использовать Если переменную измеряют по номинальной шкале , то лучше использовать моду. Если переменную измеряют по порядковой шкале , то больше подходит медиана. Если же переменную измеряют по интервальной или относительной шкале , то мода плохо отражает положение центра распределения . Это можно увидеть из табл. 15.2. Хотя значение моды, равное 6,000, отражает наивысшую частоту, оно представляет только 27,6% выборки. Медиана лучше подходит в качестве показателя , характеризующего положение центра распределения , для интервальной или относительной шкалы , хотя и она не учитывает имеющуюся информацию о переменной. Текущие значения переменной до и после медианы игнорируются. Самый лучший показатель для интервальной или относительной шкалы - среднее арифметическое . Он учитывает всю доступную информацию, поскольку для его вычисления используются все значения. Однако среднее арифметическое чувствительно к выбросам значений (экстремально малым или экстремально большим значениям). Если данные содержат выбросы, то среднее не будет хорошим показателем центра распределения и лучше использовать два показателя - среднее и медиану.  

Какие показатели центра распределения обычно вычисляют  

Из таблицы мы видим, что прибавка в заработной плате , которую давало образование, была невелика, а для некоторых видов образования отсутствовала вовсе. Наилучшим показателем центра распределения являлась в данном случае медиана, а не средняя. Сравнивая медианные заработки, мы можем заметить, что в 1989 г. в России мужчине высшее образование позволяло зарабатывать на 27 руб. в месяц больше, чем мужчине со средним специальным, аналогичная же прибавка у женщин составляла 37 руб. в месяц. Со средним специальным образованием и мужчины, и женщины зарабатывали почти столько же, сколько и со средним общим. Среднее общее образование не принесло женщинам ничего в сравнении с неполным средним, а мужчинам - только 11 руб. в месяц.  

Таким образом, при составлении сегментарной отчетности по центрам прибыли наиболее удачным показателем для распределения постоянных общехозяйственных издержек между центрами ответственности (операционных расходов) следует признать прибыль сегментов. Этот метод никак не искажает реальную картину эффективности работы центров ответственности.  

Выполненный анализ позволяет сделать следующий вывод при составлении отчетности по центрам прибыли наиболее объективным показателем для распределения операционных затрат организации между ее отдельными сегментами является их прибыль. Этот метод не искажает реальную картину эффективности работы структурных подразделений.  

Разумеется, все вышесказанное о соотношении показателей центра, справедливо только для тех распределений, у которых существует мода и/или математическое ожидание . Напомним, что понятие медианы применимо к любому распределению.  

Имея представление о точке центра распределения , мы часто хотим знать, как данные рассеяны вокруг нее. Нам предстоит изучить следующие показатели рассеяния (вариации)  

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями . Оба этих вида статистических методов анализа подробно описаны в по-  

Сервис неразрывно связан с распределением и представляет собой комплекс услуг, оказываемых в процессе заказа, покупки, поставки и дальнейшего обслуживания продукции. Показатель, характеризующий оценку такого сервиса, принято называть уровнем сервиса обеспечения потребительского спроса . Объектом сервиса являются потребители материального потока производственные предприятия , различные распределительные центры и конечные потребители . Осуществляется сервис либо самим предприятием -производителем, либо некоторым отдельным самостоятельным предприятием , участвующим в производственно -сбытовом процессе и специализирующимся в области сервисного обслуживания материальных потоков . Поэтому в качестве объектов деятельности предприятий выделяются  

Рассмотрим затраты, связанные с имуществом (в данном случае служебными помещениями). Несложно определить основополагающую причину таких накладных затрат (ею будет облагаемая налогом стоимость недвижимости) и количественно определить ее величину (это ставка налогового платежа за 1 ф.ст. стоимости недвижимости). Но как использовать эту информацию для распределения затрат по отдельным центрам затрат , размещенным внутри помещений В таких случаях, когда в качестве базы распределения использовать носитель затрат невозможно, вместо него необходимо найти другой показатель, учитывающий характер затрат и доступность информации.  

Достоинство общезаводской ставки распределения состоит в простоте ее расчета достаточно совокупные накладные затраты разделить на соответствующий показатель объема деятельности производственных центров затрат . Отпадает необходимость в первичном и вторичном распределении , что позволяет экономить время и средства, а также, возможно, повышает объективность ставки распределения, поскольку не предполагает заведомо произвольного выбора баз распределения/перераспределения по отделам.  

Однако на практике возможен и более углубленный подход к составлению отчетов по центрам прибыли . В этом случае отчетность расширяется до показателя операционной прибыли сегментов, рассчитываемой как разность между его валовой прибылью и частью операционных затрат вуза, отнесенной на данный центр прибыли . В нашем примере составление такого отчета предполагает прежде всего распределение операционных расходов вуза (1576 тыс. руб.) между отдельными филиалами, но подобное распределение следует производить весьма осторожно, чтобы не исказить реальные результаты деятельности подразделений.  

Необходимо отметить, что показатель остаточный доход до косвенных издержек позволяет достовернее оценить вклад подразделения, чем показатель остаточный доход подразделения, так как он снимает произвольность распределения косвенных издержек, заложенных в производственной себестоимости продукции подразделения (например, в производственную себестоимость продукции центра прибыли могут входить распределенные на основе нормативов или иных принципов затраты обслуживающих и обеспечивающих производственных центров).  

Выбор показателя вариации диктуется используемым показателем центра распределения. При применении медианы как меры "средней"

При проведении эмпирического исследования ряда распределения рассчитываются и анализируются следующие группы показателей:

Показатели положения центра распределения; "" ^формат:

Показатели степени его однородности; показатели формы распределения.

Показатели положения центра распределения.

К ним относятся степенная средняя в виде средней арифметической и структурные средние - мода и медиана.

Средняя арфметическая для дискретного ряда распределения рассчитывается по формуле:

где Xi - варианты значений признака, nt - частота повторения данного признака.

В интервальном вариационном ряду средняя арифметическая определяется по формуле:

где bi - середина соответствующего интервала.

В отличие от средней арифметической, рассчитываемой на основе всех вариант, мода и медиана характеризует значение признака у статистической единице, занимающей определенное положение в вариационном ряду.

Медиана (Me) - значение признака у статистической единицы, стоящей в середине ранжированного ряда и делящей совокупность на две равные по численности части. Мода (Mo) - наиболее часто встречаемое значение признак в совокупности. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и др.

Для дискретных вариационных рядов Mo и Me выбираются в соответствии с определениями: мода - как значение признака с наибольшей частотой nt: положение медианы при нечетном объеме

совокупности определяется ее номером

где N - объем

статистической совокупности. При четном объеме ряда медиана равна средней из двух вариантов, находящихся в середине ряда.

Медиану используют как наиболее надежный показатель типичного значения неоднородной совокупности, так как она нечувствительна к крайним значениям признака, которые могут значительно отличаться от основного массива его значений. Кроме этого, медиана находит практическое применение вследствие особого математического свойства:

У X - Me | ^ min .

Рассмотрим определение моды и медианы на следующем примере: имеется ряд распределения рабочих участка по уровню квалификации. Данные приведены в таблице 5.2.

Таблица 5.2

Распределения рабочих участка по уровню квалификации №

Разряд рабочих

Число рабочих

Накопленная частота 1

Всего Мода выбирается по максимальному значению частоты: при nmax = 14 Mo =4, т.е. чаще всего встречается 4-ый разряд. Для нахождения медианы N + 1 2

Это 25 и 26-ая единицы.

Me определяются центральные единицы По накопленным частотам определяется группа, в которую попадают эти единицы. Это 4-ая группа, в которой значение признака равно 4. Таким образом, Me = 4, это означает, что у половины рабочих разряд ниже 4-го, а у другой - выше четвертого.

В интервальном ряду значения Mo и Me вычисляются боле сложным путем.

Мода определяется следующим образом:

По максимальному значению частоты определяется интервал, в котором находится значение моды. Он называется модальным.

Внутри модального интервала значение моды вычисляется по формуле:

Т, Г Н n\4o nMo-1

Mo = xMo + aMo *

(nMo - n Mo-1) + (nMo + n Mo+1

где x^o - нижняя граница модального интервала, a

Ширина модального интервала, частоты

модального,

соответственно предмодального (предшествующего модальному) и постмодального (следующего за модальным) интервалов.

Для расчета медианы в интервальных рядах используется следующий подход:

По накопленным частотам находится медианный интервал. Медианным называется интервал, содержащий центральную единицу.

Внутри медианного интервала значение Me определяется по формуле: N ЛГ

Me = xMe + aMe

Me где x^e - нижняя граница медианного интервала,

aMe -ширина медианного интервала,

N - объем статистической совокупности,

NMe-1 - накопленная частота предмедианного интервала,

nMe - частота медианного интервала.

(?Mo - PMo-1) + (?Mo - PMo+1)

модального

где cpMo - абсолютная плотность распределения интервала,

В неравноинтервальных рядах при вычислении Mo используется другая частотная характеристика - абсолютная плотность распределения:

pMo-1 - абсолютная плотность распределения предмодального интервала,

(рМо+1 - абсолютная плотность распределения послемодального интервала.

Расчет моды и медианы для интервального ряда распределения рассмотрим на примере ряда распределения рабочих по стажу по стажу, приведенного в таблице 5.3.

Таблица 5.3

Распределение рабочих участка по стажу № Интервал a n группы J 1 0 4 4 6 6 2 4 8 4 8 14 3 8 12 4 11 25 4 12 16 4 13 28 5 16 20 4 6 44 6 20 24 4 4 48 7 24 28 4 2 50 Всего 0 28 28 50 - Расчет Mo:

Максимальная частота nmax = 13, она соответствует четвертой ф°рмат: группе, следовательно, модальным является интервал с границами 12 - 16 лет.

Моду рассчитаем по формуле:

Mo = XMo + aMo *

(nMo - П Mo-1) + (nMo + nMo+1)

12 + 4 = 12 + 4 = 12 + 4 0,22 « 13 лет.

(13 -11) + (13 - 6) 2 + 7

Чаще всего встречаются рабочие со стажем работы около 13 лет.

Мода не находится в середине модального интервала, она смещена к его нижней границе, связано это со структурой данного ряда распределения (частота предмодального интервала значительно больше частоты постмодального интервала).

Расчет медианы:

По графе накопленных частот определяется медианный интервал. Он содержит 25 и 26-ую статистические единицы, которые находятся в разных группах - в 3-ей и 4-ой. Для нахождения Me можно использовать любую из них. Расчет проведем по 3-ей группе:

Me = 8 + 4 ?-2 = 8 + 4 = 12 лет.

Такое же значение Me можно получить при её расчете по 4-ой

Me = 12 + 4 = 8 + 4 = 12 лет.

При сдвоенном центре Me всегда находится на стыке интервалов, содержащих центральные единицы. Вычисленное значение Me показывает, что у первых 25 рабочих стаж работы - менее 12 лет, а у оставшихся 25-ти, следовательно, - более 12 лет.

Моду можно определить графически по полигону распределения в дискретных рядах, по гистограмме распределения - в интервальных, а медиану - по кумуляте.

Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Для определение медианы высоту наибольшей ординаты кумуляты, соответствующей общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Кроме Mo и Me в вариантных рядах могут быть определены и другие структурные характеристики - квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения. Квантиль - это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:

квартили (Q1/4,Q2/4 = Me,Q3/4) - значения признака, делящие упорядоченную совокупность на 4 равные части;

децили (dj, d 2....d9) - значения признака, делящие совокупность на 10 равных частей;

перцентели - значения признака, делящие совокупность на 100 равных частей.

Если данные сгруппированы, то значение квартиля определяется по накопленным частотам: номер группы, которая содержит i -ый квантиль. Определяется как номер первой группы от начала ряда, в котором сумма накопленных частот равна или превышает i -N, где I - индекс квантиля. Если ряд интервальный, то значение квантиля определяется по формуле:

где xQ - нижняя граница интервала, в котором находится i -ый квантиль;

NQ -1 - сумма накопленных частот интервалов, предшествующих интервалу, в котором находится? -ый квантиль;

nQ - частота интервала, в котором находится? - ый квантиль.

Рассчитаем квартили для ряда распределения рабочих участка по стажу работы:

нижний квартиль Q1/4- соответствует 13-ой единице, верхний квартиль Q3/4- 38-ой. Это соответственно 2-ая и 4-ая группы.

Qi/4 = 4 + 4 = 4 + 4 0,8 И 7,2 лет;

Q3/4 = 12 + 4 -4 = 12 + 4 и 16 лет.

Следовательно, у четверти рабочих стаж менее 7 лет и у четверти - более 16 лет.

Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака, мода, медиана.

При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:

для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых x = Me = Mo;

для неустойчивых процессов положение центра распределения характеризуется с помощью Mo или Me. Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической и модой.

Средняя арифметическая взвешенная:

где - значения j-ой середины интервалов;

Частости j-го интервала.

В связи с тем, что в Excel отсутствует формула для вычисления средней арифметической взвешенной в ячейку В84 запишем выражение = СУММПРОИЗВ (V3:V7).

Мода и медиана относятся к структурным средним. Их значения находятся из выражений:

(17)

(18)

где - нижние границы модального и медианного интервалов;

Ширина модального и медианного интервалов;

Частость модального интервала;

Частость интервала, предшествующему модальному;

Частость интервала следующего за модальным;

Половина суммы накопленных частостей (равна 0,5);

Накопленная частость до медианного интервала;

Частость медианного интервала.

Формулы (15,16 и17) записаны в ячейках B84,В85 и В86 соответственно.

В первом пункте задания сделан вывод о правосторонней асимметрии, а по сгруппированным данным получается, что асимметрия левосторонняя, т.к. .

Противоречие объясняется некоторым произволом в выборе количества групп. Для каждой из 4-х представленных на рис. 5,6, 7, 9 диаграммах будут свои значения , отличающиеся друг от друга. Если существует возможность вычислить значения по несгруппированным данным, то ее необходимо использовать.

Показатели вариации

1. Размах вариации (формула 15, ячейка В76).

2. Среднее линейное отклонение (ячейка В87):

. (19)

3. Дисперсия (ячейка В88):

. (20)

4. Среднее квадратическое отклонение (ячейка В89):

. (21)

5. Коэффициент осцилляции (ячейка В90):

. (22)

6. Линейный коэффициент вариации (ячейка В91):

. (23)

7. Коэффициент вариации (ячейка В92):

. (24)

8. Относительный показатель квартильной вариации (ячейка В93):

;

;

Квартильное отклонение;

Соответственно первая и третья квартили распределения;

Нижние границы интервалов, в которых находятся первая и третья квартили;

Ширины интервалов первой и третьей квартили;

и - сумма накопленных частостей в интервалах предшествующих интервалам, в которых находятся первая и третья квартили;

Частости интервалов, в которых находятся первая и третья квартиль.

В практике из показателей вариации получили широкое применение дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Показатели дифференциации

1. Коэффициент фондовой дифференциации

, (26)

где - средние значения для 10% банков с наибольшими и для 10% с наименьшими значениями активов.

Формула (26) реализована в ячейке В94. Средние значения активов «богатых» банков превышают средние значения активов «бедных» в 1,5 раза.

2. Коэффициент децильной дифференциации

где - максимальное значение активов у 10% банков с наименьшими активами;

Минимальное значение активов у 10% банков с наибольшими активами;

; (28)

; (29)

Нижние границы интервалов, в которых находятся первая и девятая децили;

Ширины интервалов первой и девятой децили;

Сумма накопленных частостей в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили;

Частости интервалов, в которых находятся первая и девятая децили.

Выражения (27-29) реализованы в ячейке В95. Из двух показателей предпочтение следует отдать коэффициенту фондовой дифференциации. Его значение более устойчиво (при соблюдении правил округления) по сравнению с коэффициентом децильной дифференциации, зависящего от количества групп в структурной группировке. Кроме того, оба показателя являются ненормированными. Вследствие этого одно и тоже значение каждого из них можно толковать по-разному. Для устранения указанной неопределенности условимся вычислять значения и по формулам:

Оценку степени дифференциации можно осуществить по шкале Чеддока:

Учитывая, что расчетное значение , степень дифференциации банков по стоимости активов является слабой.

Показатели концентрации

1. Кривая Лоренца

В статистике для изучения степени неравномерности распределения определенного суммарного показателя между единицами отдельных групп вариационного ряда используется кривая Лоренца (или кривая концентрации). Для ее построения распределение единиц совокупности (числа банков) и распределение суммарного показателя (суммы активов в банках) должны быть представлены в долях или процентах, а затем для обоих распределений рассчитываются накопленные (кумулятивные) итоги. В данном примере суммы активов в j-ой группе банков приведены в ячейках Z2: Z7, которые рассчитаны с помощью функции СУММ. Их соответствующие частости помещены в ячейки АА2: АА7. Кумулятивные итоги в частостях размещены в ячейках Y2: Y7 и АВ2: АВ7, а в процентах – AD2: AD7, AE2: AE7. Кривая Лоренца приведена на рис.7. Она построена с помощью мастера диаграмм, тип «точечная». Диалоговое окно приведено на рис. 8.

Рисунок 7


Рисунок 8

2. Коэффициент Джини

Рассчитывается на основе кривой Лоренца

Формула (30) реализована в ячейке В96. Учитывая, что коэффициент Джинни равен 0,09, концентрация активов банков практически отсутствует.

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.

Выяснение общего характера распределения предполагает оценку степени его однородности, а также исчисление показателей асимметрии и эксцесса .

Ряды распределения могут иметь один и тот же центр группирования (показатели центра распределения) и одинаковые пределы варьирования признака (показатели вариации), однако при этом отличаться характером распределения единиц совокупности вокруг центра. Если большая часть совокупности расположена левее центра, имеет место левосторонняя асимметрия, если правее – правосторонняя.

Для оценки степени асимметричности применяют моментный и структурный коэффициенты асимметрии.

Моментный коэффициент асимметрии определяется по формуле:

А S = : σ 3 .

На направление асимметрии указывает знак коэффициента: если А S < 0, то это левосторонняя асимметрия (ее называют также отрицательной асимметрией), при правосторонней (положительной) асимметрии А S > 0, если А S = 0 – распределение симметричное. Чем больше абсолютная величина коэффициента, тем больше степень скошенности.

Рис. 2. А S < 0 левосторонняя асимметрия Рис. 3. А S > 0 правосторонняя асимметрия

Степень существенности асимметрии можно оценить с помощью средней квадратической ошибки коэффициента асимметрии,которая зависит от объема изучаемой совокупности и рассчитывается по формуле:

= ,

где п – число единиц в совокупности.

Если отношение > 3, асимметрия считается существенной и распределение признака в генеральной совокупности не является симметричным, если < 3, то асимметрия признается несущественной, вызванной влиянием случайных обстоятельств.

Структурные показатели асимметрии характеризуют асимметричность только в центральной части распределения, т. е. основной массы единиц, и в отличие от моментного коэффициента не зависят от крайних значений признака. Наиболее часто применяют структурный коэффициент асимметрии, предложенный английским статистиком К. Пирсоном:

А S = .

В симметричном распределении Для симметричных распределений рассчитывается показатель эксцесса (островершинности):

Е Х = (: σ 4) – 3.

Эксцесс может быть положительным и отрицательным. У островершинных распределений показатель эксцесса имеет положительный знак (+), а у плосковершинных – отрицательный знак (–). Предельным значением отрицательного эксцесса является значение Е Х = – 2; величина положительного эксцесса может быть величиной бесконечной. В нормальном распределении Е Х = 0.


Рис. 4. Е Х < 0 плосковершинное распределение Рис. 5 . Е Х > 0 островершинное распределение

Средняя квадратическая ошибка эксцесса исчисляется по формуле:

=

где п – число наблюдений.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения . Уравнение нормальной кривой:

,

где y t – ордината кривой нормального распределения;

t – нормированное отклонение, равное ;

– арифметическая средняя распределения;

– математические константы.

Рис. 6. Кривая нормального распределения

Нормальная кривая имеет огромное значение в теории выборочного метода, поскольку может быть показано, что средние стандартные отклонения, рассчитанные по случайным выборкам, тяготеют к нормальным в случае больших размеров выборок, если даже совокупность, из которой они взяты, сама не является нормально распределенной.

Для характеристики среднего значения признака в вариационном ряду используются средняя арифметическая, мода и медиана. Общие понятия о средних величинах и их свойствах даны в гл. 5. В данном параграфе рассмотрим расчет показателей центра распределения для вариационных рядов.

Средняя арифметическая рассчитывается по формуле1

где х, - варианты значений признака; ft - частота повторения данного варианта.

*

Пример расчета средней арифметической для интервального вариационного ряда приведен в табл\ 6.7. В отличие от средней арифметической, рассчитываемой на базе всех вариантов значений признака, мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду. Медиана (Me) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером #Ме=где « - число изучаемых единиц.

Используем данные примера, приведенного в табл. 6.1, для определения медианы и моды. Л^ме=-=10,5, т. е. медиана

равна средней арифметической из 10-го и 11-го значений признака. По накопленным частотам определяем, что 10-й и 11-й члены ряда имеют величину признака, равную 4-му разряду, т. е. медиана равна четвертому разряду. Мода (Мо) -наиболее часто встречающееся значение признака в совокупности - для данного ряда распределения также равна четвертому разряду. В интервальном ряду распределения сразу можно определить интервал, в котором будут находиться мода и медиана. Но для определения их величины используются следующие формулы2:

где хме - нижняя граница медианного интервала; i - величина интервала; 5ме- накопленная частота интервала, предшествующего медианному; /ме - частота медианного интервала.

Используя данные примера, приведенные в табл. 6.2, рассчитаем медиану. По накопленным частотам определяем, что медиана находится в интервале 5,5-6,4 и тогда

Me = 5,5+ 0,9--=6,025 руб.

1 В интервальном вариационном ряду средняя арифметическая определяется

по формуле *= ----, где к! - середина соответствующего интервала.

2 Формула медианы выведена исходя из предположения о том, что плотность внутри интервала остается постоянной.

Формула моды выведена из предположения, что в модальном и двух соседних интервалах кривая распределения представляет собой параболу второго порядка и мода является абсциссой вершины параболы.

.

Наибольшая частота соответствует интервалу 5,5-6,4, т. е. мода должна находиться в этом интервале и ее величину определяем по формуле

Мо=*мо+1-7;-т-TTTf-Г~Г "

(/ Мо /-l) + (/ м о /+0

где хмо - начало модального интервала; [мо - частота, соответствующая модальному интервалу; /_i - предмодальная частота; /+1 - послемодальная частота.

Приведенная формула моды может быть использована в вариационных рядах с равными интервалами:

Мо=5,5+0,9 (6_4) + (6^3) =5,86 руб.

Медиану и моду можно определить графически. Медиана определяется по кумуляте (см. рис. 6.3). Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумуля-той. Абсцисса точки пересечения является медианой. Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяем прямой с правым углом предыдущего прямоугольника. А левую вершину модального прямоугольника- с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения (см. рис. 6.2).

Основной характеристикой центра распределения является средняя арифметическая, опирающаяся на всю информацию об изучаемом явлении. Однако в ряде случаев средняя арифметическая должна быть дополнена и даже заменена модальным значением или медианой. Например, в статистическом контроле качества продукции удобнее пользоваться медианой, а не средней арифметической, так как определение медианы для ранжированного ряда данных не требует специального расчета; кроме того, она не чувствительна к крайним значениям данной пробы. В рядах с открытыми интервалами целесообразнее пользоваться в качестве характеристик центра распределения модой и медианой. Еще одним примером использования позиционных средних является применение моды при изучении спроса населения на товары народного потребления (например, на обувь, одежду и т. д.), когда интерес представляет определение модального размера, т. е. размера, пользующегося наибольшим спросом.

Еще по теме 6.4. ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ:

  1. 5.6. Моменты распределения. Показатели формы распределения
  2. Бюджетный федерализм в видении правительства лишь псевдоним для централизма1 Вопрос распределения средств между центром и регионами должен регулироваться «Программой развития бюджетного федерализма на период до 2005 года»