Какие средние используемые в статистике. Как найти среднее арифметическое и среднее геометрическое чисел


Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя величина это:

1) наиболее типичное для совокупности значение признака;

2) объем признака совокупности, распределенный поровну между единицами совокупности.

Признак, для которого рассчитывается средняя величина, в статистике называется «осредняемый».

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Важно отметить, что в процессе осреднения совокупное значение уровней признака или конечное его значение (в случае расчета средних уровней в ряду динамики) должно оставаться неизменным. Другими словами, при расчете средней величины объем исследуемого признака не должен быть искажен, и выражения, составляемые при расчетах средней, обязательно должны иметь смысл.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

,

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;

m – показатель степени средней;

f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Виды степенных средних

Вид степенной
средней

Показатель
степени (m)

Формула расчета

Простая

Взвешенная

Гармоническая

Геометрическая

Арифметическая

Квадратическая

Кубическая

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым. Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,…, i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×…×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда



Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;

h Me – его величина;

(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);

S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

,

где Х Mo – нижнее значение модального интервала;

m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);

m Mo-1 – то же для интервала, предшествующего модальному;

m Mo+1 – то же для интервала, следующего за модальным;

h – величина интервала изменения признака в группах.

ЗАДАЧА 1

Имеются следующие данные по группе промышленных предприятий за отчетный год


предприятия

Объем продукции, млн. руб.

Среднесписочное число работников, чел.

Прибыль, тыс. руб.

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Требуется выполнить группировку предприятий по обмену продукции, приняв следующие интервалы:

    до 200 млн. руб.

    от 200 до 400 млн. руб.

  1. от 400 до 600 млн. руб.

    По каждой группе и по всем вместе определить число предприятий, объем продукции, среднесписочное число работников, среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы. Сформулировать вывод.

    РЕШЕНИЕ

    Произведем группировку предприятий по обмену продукции, расчет числа предприятий, объема продукции, среднесписочного числа работников по формуле простой средней. Результаты группировки и расчетов сводим в таблицу.

    Группы по объему продукции


    предприятия

    Объем продукции, млн. руб.

    Среднегодовая стоимость основных средств, млн. руб.

    Среднеспи

    сочное число работников, чел.

    Прибыль, тыс. руб.

    Средняя выработка продукции на одного работника

    1 группа

    до 200 млн. руб.

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Средний уровень

    198,3

    24,9

    2 группа

    от 200 до 400 млн. руб.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Средний уровень

    282,3

    37,6

    1530

    64,0

    3 группа

    от 400 до

    600 млн.

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Средний уровень

    512,9

    34,4

    1421

    120,9

    Всего по совокупности

    5314,2

    419,4

    17131

    1113,4

    0,31

    В среднем по совокупности

    379,6

    59,9

    1223,6

    79,5

    Вывод. Таким образом, в рассматриваемой совокупности наибольшее число предприятий по объему продукции попало в третью группу – семь, или половина предприятий. Величина среднегодовой стоимости основных средств также в данной группе, как и большая величина среднесписочного числа работников – 9974 человек, наименее прибыльны предприятия первой группы.

    ЗАДАЧА 2

    Имеются следующие данные по предприятиям фирмы

    Номер предприятия, входящего в фирму

    I квартал

    II квартал

    Выпуск продукции, тыс. руб.

    Отработано рабочими человеко-дней

    Средняя выработка на одного рабочего в день, руб.

    59390,13

Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Например, средний возраст лиц, осужденных за кражу.

В судебной статистике средние величины используют для характеристики:

Средних сроков рассмотрения дел данной категории;

Среднего размера иска;

Среднего числа ответчиков, приходящихся на одно дело;

Среднего размера ущерба;

Средней нагрузки судей, и др.

Средняя всегда величина именованная и имеет ту же размерность, что и признак у отдельной единицы совокупности. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному варьирующему признаку, поэтому за всякой средней скрывается ряд распределения единиц этой совокупности по изучаемому признаку. Выбор вида средней определяется содержанием показателя и исходных данных для расчета средней величины.

Все виды средних величин, используемые в статистических исследованиях, подразделяются на две категории:

1) степенные средние;

2) структурные средние.

Первая категория средних величин включает: среднюю арифметическую, среднюю гармоническую, среднюю геометрическую и среднюю квадратическую . Вторая категория - это мода и медиана . При этом каждый из перечисленных видов степенных средних величин может иметь две формы: простую и взвешенную . Простая форма средней величины используется для получения среднего значения изучаемого признака, когда расчет осуществляется по несгруппированным статистическим данным, либо когда каждая варианта в совокупности встречается только один раз. Взвешенными средними называют величины, которые учитывают, что варианты значений признака могут иметь различную численность, в связи, с чем каждый вариант приходится умножать на соответствующую частоту. Иными словами, каждый вариант «взвешивают» по своей частоте. Частоту называют статистическим весом.

Средняя арифметическая простая - самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а N - число единиц совокупности.

Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:

где x i - значение i -й варианты признака; f i - частота i -й варианты.

Таким образом, каждое значение варианты взвешивается по своей частоте, поэтому частоты иногда называют статистическими весами.


Замечание. Когда речь идет о средней арифметической величине без указания ее вида, подразумевается средняя арифметическая простая.

Таблица 12.

Решение. Для расчета используем формулу средней арифметической взвешенной:

Таким образом, в среднем на одно уголовное дело приходится два обвиняемых.

Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х" i , после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, в которую вместо x i подставляют х" i .

Пример. Данные о возрасте преступников, осужденных за совершение кражи, представлены в таблице:

Таблица 13.

Определить средний возраст преступников, осужденных за совершение кражи.

Решение. Для того, чтобы определить средний возраст преступников на основе интервального вариационного ряда необходимо сначала найти серединные значения интервалов. Так как дан интервальный ряд с открытыми первым и последним интервалами, то величины этих интервалов принимаются равными величинам смежных закрытых интервалов. В нашем случае величина первого и последнего интервалов равны 10.

Теперь находим средний возраст преступников по формуле средней арифметической взвешенной:

Таким образом, средний возраст преступников, осужденных за совершение кражи, приближенно равен 27 лет.

Средняя гармоническая простая представляет собой величину, обратную средней арифметической из обратных значений признака:

где 1/x i - обратные значения вариантов, а N - число единиц совокупности.

Пример. Для определения средней годовой нагрузки на судей районного суда при рассмотрении уголовных дел провели обследование нагрузки 5 судей этого суда. Средние затраты времени на одно уголовное дело для каждого из обследованных судей оказались равными (в днях): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Найти средние затраты на одно уголовное дело и среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел.

Решение. Для определения средних затрат времени на одно уголовное дело, воспользуемся формулой средней гармонической простой:

Для упрощения расчетов в примере возьмем число дней в году равным 365, включая выходные (это не влияет на методику расчета, а при вычислении аналогичного показателя на практике необходимо вместо 365 дней подставить количество рабочих дней в конкретном году). Тогда средняя годовая нагрузка на судей данного районного суда при рассмотрении уголовных дел составит: 365(дней) : 5,56 ≈ 65,6 (дел).

Если бы мы для определения средних затрат времени на одно уголовное дело, воспользовались формулой средней арифметической простой, то получили бы:

365 (дней) : 5,64 ≈ 64,7 (дела), т.е. средняя нагрузка на судей оказалась меньше.

Проверим обоснованность такого подхода. Для этого воспользуемся данными о затратах времени на одно уголовное дело для каждого судьи и рассчитаем число уголовных, рассмотренных каждым из них за год.

Получим соответственно :

365(дней) : 6 ≈ 61 (дело), 365(дней) : 5,6 ≈ 65,2 (дел), 365(дней) : 6,3 ≈ 58 (дел),

365(дней) : 4,9 ≈ 74,5 (дела), 365(дней) : 5,4 ≈ 68 (дел).

Теперь вычислим среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел:

Т.е. средняя годовая нагрузка такая же, как и при использовании средней гармонической.

Таким образом, использование средней арифметической в данном случае неправомерно.

В тех случаях, когда известны варианты признака, их объемные значения (произведение варианты на частоту), но неизвестны сами частоты, применяется формула средней гармонической взвешенной:

,

где x i - значения вариантов признака, а w i - объемные значения вариантов (w i = x i · f i ).

Пример. Данные о цене единицы однотипного товара, произведенного различными учреждениями уголовно-исполнительной системы, и об объемах его реализации приведены в таблице 14.

Таблица 14

Найти среднюю цену реализации товара.

Решение. При расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам неизвестно количество реализованных единиц, но известны суммы реализаций товаров. Поэтому для нахождения средней цены реализованных товаров воспользуемся формулой средней гармонической взвешенной. Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

Средняя геометрическая вычисляется извлечением корня степени N из произведения всех значений вариантов признака:

,

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а

N - число единиц совокупности.

Этот вид средней используется для вычисления средних показателей роста рядов динамики.

Средняя квадратическая применяется для расчета среднеквадратического отклонения, являющегося показателем вариации, и будет рассмотрена ниже.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода , или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном (упорядоченном) ряду. Упорядочение единиц статистической совокупности может быть проведено по возрастанию или убыванию вариантов изучаемого признака.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Таким образом, медиана - это тот вариант ранжированного ряда, по обе стороны от которого в данном ряду должно находиться равное число единиц совокупности.

Для нахождения медианы сначала необходимо определить ее порядковый номер в ранжированном ряду по формуле:

где N - объем ряда (число единиц совокупности).

Если ряд состоит из нечетного числа членов, то медиана равна варианте с номером N Me . Если же ряд состоит из четного числа членов, то медиана определяется как среднее арифметическое двух смежных вариант, расположенных в середине.

Пример. Дан ранжированный ряд 1, 2, 3, 3, 6, 7, 9, 9, 10. Объем ряда N = 9, значит N Me = (9 + 1) / 2 = 5. Следовательно, Ме = 6, т.е. пятой варианте. Если дан ряд 1, 5, 7, 9, 11, 14, 15, 16, т.е. ряд с четным числом членов (N = 8), то N Me = (8 + 1) / 2 = 4,5. Значит медиана равна полусумме четвертой и пятой вариант, т.е. Ме = (9 + 11) / 2 = 10.

В дискретном вариационном ряду медиану определяют по накопленным частотам. Частоты вариант, начиная с первой, суммируются до тех пор, пока не будет превзойден номер медианы. Значение последней просуммированной варианты и будет медианой.

Пример. Найти медиану числа обвиняемых, приходящихся на одно уголовное дело, используя данные таблицы 12.

Решение. В данном случае объем вариационного ряда N = 154, следовательно, N Me = (154 + 1) / 2 = 77,5. Просуммировав частоты первой и второй варианты, получим: 75 + 43 = 118, т.е. мы превзошли номер медианы. Значит Ме = 2.

В интервальном вариационном ряду распределения сначала указывают интервал, в котором будет находиться медиана. Его называют медианным . Это первый интервал, накопленная частота которого превышает половину объема интервального вариационного ряда. Затем численное значение медианы определяется по формуле:

где x Ме - нижняя граница медианного интервала; i - величина медианного интервала; S Ме-1 - накопленная частота интервала, который предшествует медианному; f Ме - частота медианного интервала.

Пример. Найти медиану возраста преступников, осужденных за совершение кражи, на основе статистических данных, представленных в таблице 13.

Решение. Статистические данные представлены интервальным вариационным рядом, значит сначала определим медианный интервал. Объем совокупности N = 162, следовательно, медианным интервалом является интервал 18-28, т.к. это первый интервал, накопленная частота которого (15 + 90 = 105) превышает половину объема (162: 2 = 81) интервального вариационного ряда. Теперь численное значение медианы определяем по приведенной выше формуле:

Таким образом, половина осужденных за совершение кражи младше 25 лет.

Модой (Мо) называют значение признака, которое наиболее часто встречается у единиц совокупности. К моде прибегают для выявления величины признака, имеющей наибольшее распространение. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Например, для дискретного ряда, представленного в таблице 3 Мо = 1, так как этому значению варианты соответствует наибольшая частота - 75. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Его значение находят по формуле:

где x Mo - нижняя граница модального интервала; i - величина модального интервала; f Мо - частота модального интервала; f Мо-1 - частота интервала, предшествующего модальному; f Мо+1 - частота интервала, следующего за модальным.

Пример. Найтимодувозраста преступников, осужденных за совершение кражи, данные о которых представлены в таблице 13.

Решение. Наибольшая частота соответствует интервалу 18-28, следовательно, мода должна находиться в этом иртервале. Ее величину определяем по приведенной выше формуле:

Таким образом, наибольшее число преступников, осужденных за совершение кражи, имеет возраст 24 года.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако две совокупности, имеющие одинаковые средние значения, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Например, в одном суде были назначены следующие сроки лишения свободы: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 лет, а в другом - 5, 5, 6, 6, 7, 7, 7, 8, 8, 8 лет. В обоих случаях средняя арифметическая равна 6,7 лет. Однако эти совокупности существенно различаются между собой разбросом индивидуальных значений назначенного срока лишения свободы относительно среднего значения.

И для первого суда, где этот разброс достаточно большой, средняя величина срока лишения свободы плохо отражает всю совокупность. Таким образом, если индивидуальные значения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств данной совокупности. В противном случае средняя арифметическая будет ненадежной характеристикой этой совокупности и применение ее на практике малоэффективно. Поэтому необходимо учитывать вариацию значений изучаемого признака.

Вариация - это различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К основным показателям вариации относятся следующие:

1) размах вариации;

2) среднее линейное отклонение;

3) дисперсия;

4) среднее квадратическое отклонение;

5) коэффициент вариации.

Кратко остановимся на каждом из них.

Размах вариации R самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:

Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений индивидуальных значений признака от средней и определяется по формулам:

1) для несгруппированных данных

2) для вариационного ряда

Однако наиболее широко применяемым показателем вариации является дисперсия . Она характеризует меру разброса значений изучаемого признака относительно его среднего значения. Дисперсия определяется как средняя из отклонений, возведенных в квадрат.

Простая дисперсия для не сгруппированных данных:

.

Взвешенная дисперсия для вариационного ряда:

Замечание. На практике для вычисления дисперсии лучше использовать следующие формулы:

Для простой дисперсии

.

Для взвешенной дисперсии

Среднее квадратическое отклонение - это корень квадратный из дисперсии:

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем, однороднее совокупность и тем лучше средняя арифметическая отражает собой всю совокупность.

Рассмотренные выше меры рессеяния (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными показателями, судить по которым о степени колеблемости признака не всегда возможно. В некоторых задачах необходимо использовать относительные показатели рассеяния, одним из которых является коэффициент вариации.

Коэффициент вариации - выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации разных признаков или одного и того же признака в различных совокупностях, но и для характеристики однородности совокупности. Статистическая совокупность считается количественно однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному распределению).

Пример. Имеются следующие данныео сроках лишения свободы 50 осужденных, доставленных для отбывания назначенного судом наказания в исправительное учреждение уголовно-исполнительной системы: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2, 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6, 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Построить ряд распределения по срокам лишения свободы.

2. Найти среднее значение, дисперсию и среднее квадратическое отклонение.

3. Вычислить коэффициент вариации и сделать заключение об однородности или неоднородности изучаемой совокупности.

Решение. Для построения дискретного ряда распределения необходимо определить варианты и частоты. Варианта в данной задаче - это срок лишения свободы, а частоты - численность отдельных вариант. Рассчитав частоты, получим следующий дискретный ряд распределения:

Найдем среднее значение и дисперсию. Поскольку статистические данные представлены дискретным вариационным рядом, то для их вычисления будем использовать формулы среднего арифметического взвешенного и дисперсии. Получим:

= = 4,1;

= 5,21.

Теперь вычисляем среднее квадратическое отклонение:

Находим коэффициент вариации:

Следовательно, статистическая совокупность количественно неоднородна.

Что такое среднее арифметическое

Средним арифметическим нескольких величин является отношение суммы этих величин к их количеству.

Среднее арифметическое определенного ряда чисел называется сумма всех этих чисел, поделенная на количество слагаемых. Таким образом, среднее арифметическое является средним значением числового ряда.

Чему равно среднее арифметическое нескольких чисел? А равно они сумме этих чисел, которая поделена на количество слагаемых в этой сумме.

Как найти среднее арифметическое число

В вычислении или нахождении среднего арифметического нескольких чисел, нет ничего сложного, достаточно сложить все представленные числа, а полученную сумму разделить на количество слагаемых. Полученный результат и будет средним арифметическим этих чисел.


Рассмотрим этот процесс более подробно. Что же нам нужно сделать для вычисления среднего арифметического и получения конечного результата этого числа.

Во-первых, для его вычисления нужно определить набор чисел или их количество. В этот набор могут входить большие и маленькие числа, и их количество может быть каким угодно.

Во-вторых, все эти числа нужно сложить и получить их сумму. Естественно, если числа несложные и их небольшое количество, то вычисления можно произвести, записав от руки. А если же набор чисел впечатляющий, то лучше воспользоваться калькулятором или электронной таблицей.

И, в-четвертых, полученную от сложения сумму необходимо разделить на количество чисел. В итоге мы получим результат, который и будет средним арифметическим числом этого ряда.



Для чего нужно среднее арифметическое

Среднее арифметическое может пригодиться не только для решения примеров и задач на уроках математики, но для других целей, необходимых в повседневной жизни человека. Такими целями может служить подсчет среднего арифметического для расчета среднего расхода финансов в месяц, или для подсчета времени, которое вы тратите на дорогу, также для того чтобы узнать посещаемость, производительность, скорость движения, урожайность и много другого.

Так, например, давайте попробуем рассчитать, сколько времени вы тратите на дорогу в школу. Идя в школу или возвращаясь, домой вы каждый раз тратите на дорогу разное время, так как когда вы спешите, то вы идете быстрее, и поэтому дорога занимает меньше времени. А вот, возвращаясь, домой вы можете идти не спеша, общаясь с одноклассниками, любуясь природой и поэтому времени на дорогу займет больше.

Поэтому, точно определить время, затраченное на дорогу у вас не получиться, но благодаря среднему арифметическому вы сможете приблизительно узнать время, которое вы тратите на дорогу.

Припустим, что в первый день после выходных, вы потратили на путь от дома до школу пятнадцать минут, на второй день ваш путь занял двадцать минут, в среду вы прошли расстояние за двадцать пять минут, за такое же время составил ваш путь и в четверг, а в пятницу вы никуда не торопились и возвращались целых пол часа.

Давайте найдем среднее арифметическое, прибавив время, за все пять дней. Итак,

15 + 20 + 25 + 25 + 30 = 115

Теперь разделим эту сумму на количество дней

Благодаря такому способу вы узнали, что путь от дома до школы вы приблизительно тратите двадцать три минуты своего времени.

Домашнее задание

1.Путем нехитрых вычислений найдите среднее арифметическое число посещаемости учеников вашего класса за неделю.

2. Найдите среднее арифметическое:



3. Решите задачу:



В математике среднее арифметическое значение чисел (или просто среднее) — это сумма всех чисел в данном наборе, разделенная на их количество. Это наиболее обобщенное и распространенное понятие средней величины. Как вы уже поняли, чтобы найти нужно суммировать все данные вам числа, а полученный результат разделить на количество слагаемых.

Что такое среднее арифметическое?

Давайте рассмотрим пример.

Пример 1 . Даны числа: 6, 7, 11. Нужно найти их среднее значение.

Решение.

Для начала найдем сумму всех данных чисел.

Теперь разделим получившуюся сумму на количество слагаемых. Так как у нас слагаемых три, соответственно, мы будем делить на три.

Следовательно, среднее значение чисел 6, 7 и 11 — это 8. Почему именно 8? Да потому, что сумма 6, 7 и 11 будет такая же, как трех восьмерок. Это отлично видно на иллюстрации.

Среднее значение чем-то напоминает «выравнивание» ряда чисел. Как видите, кучки карандашей стали одного уровня.

Рассмотрим еще один пример, чтобы закрепить полученные знания.

Пример 2. Даны числа: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Нужно найти их среднее арифметическое значение.

Решение.

Находим сумму.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Делим на количество слагаемых (в этом случае — 15).

Следовательно, среднее значение данного ряда чисел равно 22.

Теперь рассмотрим отрицательные числа. Вспомним, как их суммировать. Например, у вас есть два числа 1 и -4. Найдем их сумму.

1 + (-4) = 1 - 4 = -3

Зная это, рассмотрим еще один пример.

Пример 3. Найти среднее значение ряда чисел: 3, -7, 5, 13, -2.

Решение.

Находим сумму чисел.

3 + (-7) + 5 + 13 + (-2) = 12

Так как слагаемых 5, разделим получившуюся сумму на 5.

Следовательно, среднее арифметическое значение чисел 3, -7, 5, 13, -2 равно 2,4.

В наше время технологического прогресса гораздо удобнее использовать для нахождения среднего значения компьютерные программы. Microsoft Office Excel — одна из них. Искать среднее значение в Excel быстро и просто. Тем более, эта программа входит в пакет программ от Microsoft Office. Рассмотрим краткую инструкцию, значение с помощью этой программы.

Для того чтобы посчитать среднее значение ряда чисел, необходимо использовать функцию AVERAGE. Синтаксис для этой функции:
= Average (argument1, argument2, ... argument255)
где argument1, argument2, ... argument255 — это либо числа, либо ссылки на ячейки (под ячейками подразумеваются диапазоны и массивы).

Чтобы было более понятно, опробуем полученные знания.

  1. Введите числа 11, 12, 13, 14, 15, 16 в ячейки С1 - С6.
  2. Выделите ячейку С7, нажав на нее. В этой ячейке у нас будет отображаться среднее значение.
  3. Щелкните на вкладке «Формулы».
  4. Выберите More Functions > Statistical для того, чтобы открыть
  5. Выберите AVERAGE. После этого должно открыться диалоговое окно.
  6. Выделите и перетащите туда ячейки С1-С6, чтобы задать диапазон в диалоговом окне.
  7. Подтвердите свои действия клавишей «ОК».
  8. Если вы все сделали правильно, в ячейке С7 у вас должен появиться ответ - 13,7. При нажатии на ячейку C7 функция (= Average (C1: C6)) будет отображаться в строке формул.

Очень удобно использовать эту функцию для ведения учета, накладных или когда вам просто нужно найти среднее значение из очень длинного ряда чисел. Поэтому ее часто используют в офисах и крупных компаниях. Это позволяет сохранять порядок в записях и дает возможность быстро посчитать что-либо (например, средний доход за месяц). Также с помощью Excel можно найти среднее значение функции.

Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.

Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.

При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.

Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.

Средняя выработка отражает общее свойство всей совокупности.

Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.

Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

Существуют различные средние:

    средняя арифметическая;

    средняя геометрическая;

    средняя гармоническая;

    средняя квадратическая;

    средняя хронологическая.

Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.

Средняя арифметическая

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через. Следовательно, средняя арифметическая простая равна:

По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х встречается в совокупности 2 раза, а варианта х-16 раз и т.д.

Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается символом n.

Вычислим среднюю заработную плату одного рабочего в руб.:

Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту, а сумма этих произведений дает общий фонд заработной платы всех рабочих.

В соответствии с этим, расчеты можно представить в общем виде:

Полученная формула называется средней арифметической взвешенной.

Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами.

Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная.

Основные свойства средней арифметической .

Средняя арифметическая обладает рядом свойств:

1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.

Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.

2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:

3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:

4. Если х = с, где с - постоянная величина, то
.

5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:

Средняя гармоническая.

Наряду со средней арифметической, в статистике применяется средняя гармоническая величина, обратная средней арифметической из обратных значений признака. Как и средняя арифметическая, она может быть простой и взвешенной.

Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.

Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

где
- начальное значение интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

Медиана - это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке).