Среднее значение, медиана и мода

Содержание:

Среднее против медианы против режима  

Среднее значение, медиана и мода являются основными меры центральной тенденции используется в описательной статистике. Они полностью отличаются друг от друга, и случаи, в которых они используются для обобщения данных, также различны.

Значит

Среднее арифметическое — это сумма значений данных, деленная на количество значений данных, т. Е.

Если данные взяты из выборочного пространства, это называется выборочным средним (), которая является описательной статистикой выборки. Хотя это наиболее часто используемый описательный показатель для выборки, это не надежная статистика. Он очень чувствителен к выбросам и колебаниям.

Например, рассмотрим средний доход жителей конкретного города. Поскольку все значения данных суммируются, а затем делятся, доход чрезвычайно богатого человека значительно влияет на среднее значение. Следовательно, средние значения не всегда являются хорошим представлением данных.

Кроме того, в случае переменного сигнала ток, проходящий через элемент, периодически изменяется от положительного направления к отрицательному и наоборот. Если мы возьмем средний ток, проходящий через элемент за один период, он даст 0, что означает, что ток не прошел через элемент, что, очевидно, неверно. Следовательно, и в этом случае среднее арифметическое не является хорошим показателем.

Среднее арифметическое — хороший показатель, когда данные распределены равномерно. Для нормального распределения среднее значение равно моде и медиане. Он также имеет самые низкие остатки при рассмотрении среднеквадратичной ошибки; следовательно, это лучший способ описания, когда требуется представить набор данных одним числом.

Медиана

Значения средней точки данных после упорядочивания всех значений данных в порядке возрастания определяются как медиана набора данных. Медиана — это 2-й квартиль, 5-й дециль и 50-й процентиль.

• Если количество наблюдений (точек данных) нечетное, то медиана — это наблюдение точно в середине упорядоченного списка.

• Если количество наблюдений (точек данных) четное, то медиана — это среднее значение двух средних наблюдений в упорядоченном списке.

Медиана делит наблюдение на две группы; т.е. группа (50%) значений выше и группа (50%) значений ниже медианы. Медианы специально используются в асимметричных распределениях и представляют данные намного лучше, чем среднее арифметическое.

Режим

Мода — это наиболее часто встречающееся число в наборе наблюдений. Режим набора данных рассчитывается путем нахождения частоты каждого элемента в наборе.

• Если значение не встречается более одного раза, значит, в наборе данных нет режима.

• В противном случае любое значение, которое встречается с наибольшей частотой, является режимом набора данных.

В наборе может быть более 1 режима; следовательно, режим не является уникальной статистикой набора данных. В равномерном распределении есть одна мода. Режим дискретного распределения вероятностей — это точка, в которой функция массы вероятности достигает своей наивысшей точки. Используя приведенные выше интерпретации, можно сказать, что глобальные максимумы это режимы.

Рассмотрим применение всех трех мер к следующему набору данных.

ДАННЫЕ: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15}

Среднее значение = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Медиана = 9 (13-й элемент)

Mode = 9 (частота 9 = 5)

В чем разница между средним, медианным и модой?

• Среднее арифметическое — это сумма значений (наблюдений), деленная на количество наблюдений. Это не надежная статистика, и она сильно зависит от природы нормального распределения в рассматриваемом распределении. Один выброс может вызвать значительный сдвиг среднего значения, что приведет к относительно неверным значениям. Концепция может быть расширена до среднего геометрического, среднего гармонического, средневзвешенного и так далее.

• Медиана — это средние значения набора наблюдений, и на нее относительно меньше влияют выбросы. Это может дать хорошую оценку в качестве сводной статистики в случаях с большим перекосом.

• Режим — это наиболее распространенные значения наблюдений в наборе данных. Если распределение положительно смещено, мода лежит слева от медианы, а при отрицательном смещении мода лежит справа от медианы.

• При положительном перекосе среднее значение соответствует медиане; в случае отрицательного перекоса среднее значение находится слева от медианы.

• В нормальном распределении все три: среднее, мода и медиана равны.

В чем проблема?

Под средним значением чаще всего подразумевается среднее арифметическое, которое очень сильно варьируется под воздействием единичных фактов или событий. И вы не получите реального представления о том, как именно распределены значения, которые вы изучаете.

Давайте обратимся к классическому примеру со средней зарплатой.

В какой-то абстрактной компании работает десять сотрудников. Девять из них получают зарплату около 50 000 рублей, а один 1 500 000 рублей (по странному совпадению он же является генеральным директором этой компании).

Средним значением в данном случае будет 195 150 рублей, что согласитесь, неправильно.

Пример медианы

Чтобы найти среднее значение в списке с нечетным количеством чисел, нужно найти число, которое находится в середине, с равным количеством чисел по обе стороны от медианы. Чтобы найти медиану, сначала расположите числа по порядку, обычно от наименьшего к наибольшему.

Например, в наборе данных {3, 13, 2, 34, 11, 26, 47} отсортированный порядок становится {2, 3, 11, 13, 26, 34, 47}. Медиана – это число в середине {2, 3, 11, 13 , 26, 34, 47}, которое в данном случае равно 13, поскольку с каждой стороны по три числа.

Чтобы найти среднее значение в списке с четным количеством чисел, нужно определить среднюю пару, сложить их и разделить на два. Опять же, расположите числа по порядку от наименьшего к наибольшему.

Например, в наборе данных {3, 13, 2, 34, 11, 17, 27, 47} отсортированный порядок становится {2, 3, 11, 13, 17, 27, 34, 47}. Медиана – это среднее значение двух чисел в середине {2, 3, 11, 13 , 17 , 26 34, 47}, которое в данном случае равно пятнадцати {(13 + 17) ÷ 2 = 15}.

Определение моды и медианы графическим методом

Моду и медиану в интервальном ряду можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Из точки их пересечения опускаем перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения (рис. 3). Рис. 3. Графическое определение моды по гистограмме. Рис. 3. Графическое определение моды по гистограмме. Рис. 4. Графическое определение медианы по кумуляте Для определения медианы из точки на шкале накопленных частот (частостей), соответствующей 50 %, проводится прямая, параллельная оси абсцисс до пересечения с кумулятой. Затем из точки пересечения опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Среднее значение

Часто так называют среднеарифметическое значение выборки (или множества чисел). Это, пожалуй, самый распространенный термин, из вышеперечисленных трех. Хотя бы потому, что почти каждый день мы слышим это слово в СМИ. Значение его тоже объясняет само название. Тем не менее, для тех, кому непонятен смысл этого слова, объясним “на пальцах”.

Это сумма данных чисел, деленное на количество. Если написать в виде формулы, это выглядит так.

Здесь $\bar{x}$ – среднее арифметическое значение. Если у Вас имеется $5$ чисел $\{10, 12, 5, 20, 8\}$, то их сумма будет $10+12+3+20+8=55$ . Так как количество равно $5$, то делим $55:5=11$. Это и есть среднеарифметическое значение.

Пример из практики

Допустим, у вас есть магазин, и вы торгуете чем то. В день, выручка составляет от $600$ до $1,200$ у.е. По итогам месяца вы наторговали на сумму $30,000$ у.е. Если условное количество дней в месяце $30$, значит, ваша средняя ежедневная выручка составляет $1,000$ у.е. ($30000:30 = 1000$).

Примеры расчета среднего арифметического

Пример 1. Вычислить среднее арифметическое 33,3 и 55,5.

Как решаем:

Чтобы найти среднее арифметическое двух чисел, надо сложить эти числа и результат разделить на 2: (33,3 + 55,5) : 2 = 88,8 : 2 = 44,4.

Пример 2. Посчитать среднее арифметическое 7,5 и 8 и 0,5.

Как решаем:

Чтобы найти среднее арифметическое трех чисел, надо сложить эти числа и результат разделить на 3: (7,5 + 8 + 0,5) : 3 = 16 : 3 = 5,33.

Пример 3. Найти среднее арифметическое 202, 105, 67 и 9.

Как решаем:

Чтобы найти среднее арифметическое трех чисел, надо сложить эти числа и результат разделить на 4: (202 + 105 + 67 + 9) : 4 = 383 : 4 = 95,75.

Пример 4. Сколько в среднем тратит школьник денег в неделю, если в понедельник он потратил 80 рублей, во вторник 75 рублей, в среду и четверг по 100 рублей, в пятницу 50 рублей.

Как решаем:

Чтобы найти сколько в среднем школьник потратил за пять дней, надо сложить эти суммы и результат разделить на 5: (80 + 75 + 100 + 100 + 50) : 5 = 405 : 5 = 81.

Ответ: школьник в неделю тратит в среднем 81 рубль.

В 5 классе можно искать среднее арифметическое с помощью онлайн-калькулятора. Пользуйтесь им, если уже разобрались с темой и щелкаете задачки легко и без помощников:

  • Калькулятор раз
  • Два
  • Три

Режим:

Значение, которое встречается чаще в данном наборе данных. Чтобы определить режим, вы можете снова упорядочить результаты, как показано выше, а затем подсчитать каждый. Наиболее часто встречающимся значением является режим.

ЕслиИксявляется дискретной случайной величиной, режим является значениемИкс(То есть,Икс= х) при которой функция вероятности принимает максимальное значение. Другими словами, это значение, которое наиболее вероятно для выборки.

Например, режим образца

Список 1: 1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17

Здесь режим 6.

Дан список данных:

Список 2: 1, 1, 2, 4, 4

Здесь режим не уникален — можно сказать, что набор данныхбимодальныйв то время как набор с более чем двумя режимами может быть описан какмультимодальные,

Обычно режим используется для категориальных данных, где мы хотим знать, какая категория является наиболее распространенной, как показано ниже:

Когда использовать что в описательной статистике для измерения центральной тенденции?

Ниже приводится краткое изложение, чтобы узнать, какова наилучшая мера центральной тенденции по отношению к различным типам переменных.

Тип VariableBest мера центральной тенденции:

Для номинального: режим

Для ординала: медиана

Для интервала / отношения (без перекоса): среднее

Для интервала / отношения (перекошено): Медиана

Случай перекошенного распределения:

Иногда данные обычно не распространяются. Обязательно, чтобы мы проверили наши наборы данных на их нормальное распределение, потому что это — общее предположение, лежащее в основе многих статистических анализов.

Когда у вас есть нормально распределенная выборка, вы можете использовать как среднее значение, так и медиану как показатель центральной тенденции. Фактически, при любом симметричном распределении среднее, медиана и мода равны. Однако в этой ситуации среднее значение широко предпочитается как наилучшая мера центральной тенденции, поскольку именно эта мера включает в себя все значения в наборе данных для его расчета.


источник

На рисунке выше: вы можете заметить, что с правой стороны имеется длинный хвост, и распределение данных не согласовано. Мы можем видеть, чтоозначают (10.1)перетаскивается в направлении перекоса. В этих ситуациях медиана обычно считается лучшим представителем центрального расположения данных.

Помнить:

B: Распространение данных (изменчивость данных)

Мера распространения, иногда также называемая мерой дисперсии, используется для описания изменчивости в выборке или популяции. Обычно он используется в сочетании с мерой центральной тенденции, такой как среднее значение или медиана, для общего описания набора данных.

Меры распространения включают в себя 3 важных классификации:

  1. Диапазон
  2. Квартили и межквартильный ассортимент,
  3. Дисперсия и стандартное отклонение

Давайте быстро покроем все это

Диапазон:

Диапазон — это разница между самым высоким и самым низким баллами в наборе данных и является наиболее простой мерой разброса.

Диапазон = максимальное значение — минимальное значение

Пример: 22,45,56,32,10,9,54

Здесь в приведенном выше наборе данных, Макс = 56, Мин = 9

Так что диапазон = Макс-Мин = 56–9 = 47

Диапазон как мера распространения используется не очень популярно, но он действительно устанавливает границы баллов. Это может быть полезно, если вы измеряете переменную, которая имеет критический низкий или высокий порог или оба, которые не должны пересекаться.

В статистическом анализе диапазон представлен одним числом. В финансовых данных этот диапазон чаще всего относится к максимальному и минимальному значению цены за данный день или другой период времени.

Диапазон Quartiles & Interquartiles:

межквартильный размах(IQR) — это показатель изменчивости, основанный на делении набора данных на квартили.

Давайте сначала поймем, что такое квартили, а затем на некоторых примерах мы углубимся в понимание концепции IQR.

Среднее геометрическое

Наш «репрезентативный элемент» зависит от того, что мы делаем с уже существующими элементами группы данных. В большинстве случаев элементы просто складываются и среднее арифметическое работает прекрасно. Но иногда нужно нечто большее. Например, когда мы анализируем инвестиции, площади и объёмы. В таких случаях между собой данные взаимодействуют именно путём умножения (ожидаемая доходность, объём или площадь фигуры вычисляются с помощью умножения), и это меняет подход к выявлению и смыслу средних значений.

Вот пример. Какой инвестиционный портфель вы предпочтёте? Иными словами, какой из них принесёт большую прибыль в течение типового года?

  • Портфель А: +10%, -10%, +10%, -10%
  • Портфель Б: +30%, -30%, +30%, -30%

Выглядят похоже. Повседневная логика, построенная на привычке к среднему арифметическому, говорит, что оба портфеля достаточно рискованны и оба в среднем приведут к убыткам или нулевой прибыли. Поэтому, вероятнее всего, надо выбрать портфель Б, поскольку в успешный год он принесёт больше прибыли.

Но это в корне неверно! На фондовом рынке с таким подходом мы с вами точно прогорим. Проценты с инвестиций умножаются, но не складываются. Мы не можем просто взять и использовать среднее арифметическое, нужно найти действительный коэффициент окупаемости. Коэффициент окупаемости считается достаточно просто: берём условные 100% нашего текущего капитала в качестве единицы. Далее представляем колебания доходности-убытка, представленные в описании портфелей, добавляя к нашей единице или вычитая из неё процентные показатели. Затем перемножаем полученные колебания и получаем коэффициент. Для расчёта среднегодового значения коэффициента окупаемости делим полученный коэффициент на 4 (поскольку элементов в нашем числовом ряду четыре).

Портфель А:

Коэффициент окупаемости: 1,1 \times 0,9 \times 1,1 \times 0,9 = 0,98 (2% убытка)

Среднегодовое значение: 0,98^{1/4} = 0,5\% годового убытка

Портфель Б:

Коэффициент окупаемости: 1,3 \times 0,7 \times 1,3 \times 0,7 = 0,83 (17% убытка)

Среднегодовое значение: 0,83^{1/4} = 4,6\% годового убытка

Выбор между 2% или 17%? Огромная разница! Конечно, только идиот, а не разумный человек будет делать выбор именно из этих двух портфелей, но если делать выбор, то из двух зол лучше выбрать Портфель А. И именно здесь среднее арифметическое не работает.

Несколько примеров, где работает среднее геометрическое:

  • Темпы инфляции: У вас есть показатели в 1%, 2% и 10%. Каков средний показатель инфляции за конкретный период времени? (1,01 \times 1,02 \times 1,10)^{1/3} = 4,3\%.
  • Скидки: У вас есть три скидочных купона на 50%, 25% и 35%. Какова средняя скидка? (0,5 \times 0,75 \times 0,65)^{1/3} = 37,5%.
  • Площадь: У вас есть участок земли 40х60 м. Вам нужно вычислить «усреднённую сторону» — иными словами, сторону квадрата примерно той же площади. (40 \times 60)^{0,5} = 49 м.
  • Объём: У вас есть коробка 12 х 24 х 48 см. Вам снова нужна усреднённая сторона, то есть сторона куба примерно того же объёма. (12 \times 24 \times 48)^{1/3} = 24 см.

Среднее геометрическое помогает найти «типичный элемент» среди группы элементов, взаимодействующих друг с другом путём умножения. И, как видим, у него есть множество практических применений.

Медиана

Медиана — та самая грань, которая отделяет наибольшие значения от наименьших. То самое «число в середине». Постойте-постойте, а разве среднее арифметическое делает не то же самое?

Вот вам простой пример. Какое число находится в середине этого ряда?

1, 2, 3, 4, 100

Число «3» находится в середине ряда. И хотя среднее арифметическое (22) является «средним», оно никак не отражает распределения этих чисел. Интуитивно (и абсолютно правильно!) мы считаем, что в середине этого ряда всё-таки 3, а не 22. Здесь среднее значение отошло от середины благодаря резко отклоняющемуся из общей массы значению, 100.

Медиана эту проблему решает. Медиана делит весь числовой ряд на две равные части по количеству значений, причём первая половина имеет значения меньше либо равные медиане, а вторая — больше либо равные. Если в середине числового ряда оказывается два числа то, тобы получить медиану мы просто берём среднее арифметическое этих двух чисел. В числовом ряду 1, 2, 3, 4 медианой станет число 2,5. Именно медиана позволяет выбивающимся из общей массы числам вроде 100 в нашем примере выше не влиять на общее впечатление о числовом ряде.

Прелести медианы:

  • Прекрасно справляется с резко отклоняющимися значениями, поэтому зачастую является самым репрезентативным значением для группы;
  • Разбивает данные на две группы, состоящие из одинакового количества элементов.

Изъяны медианы:

  • Немного усложняются вычисления: прежде чем разбить ряд на две равные части необходимо его упорядочить по возростанию или убыванию;
  • Медиана менее популярна и если вы скажете «среднее медианное значение», то люди зачастую принимают его за средне арифметическое. Отсюда возникает путаница.

Такие средние значения, как цены на недвижимость или, например, уровень дохода часто вычисляются именно по медиане, потому что нам важна именно средняя стоимость большей части домов в конкретном районе или средний уровень доходов большей части населения. В таком случае Билл Гейтс с годовым доходом в несколько миллиардов не испортит нам всю статистику. Видите, как много зависит от того, как мы работаем с имеющимися данными?

Выведенный статистика:

Инференциальная статистика касается выводов, основанных на отношениях, найденных в выборке, на отношениях в популяции. Статистические данные помогают нам, например, решить, достаточно ли сильны различия между группами, которые мы видим в наших данных, чтобы поддержать нашу гипотезу о том, что групповые различия существуют в целом по всему населению.

Мы рассмотрим это подробно, в нашей следующей части этогоПрикладная статистика для кандидата наукчто это такое, и как это помогает нам измерять и устанавливать надежность данных, чтобы делать интеллектуальные прогнозы в отношении совокупности данных / выборки.

Резюме:

Если вы хотите быть эффективным инженером по науке о данных, пожалуйста, убедитесь, что вы четко понимаете основы прикладной статистики. Прикладная статистика является фундаментом, который проложит вам успешную карьеру. Когда вы начнете уверенно понимать наборы данных, вы сможете измерить перекосы данных, найти пропущенные значения, измерить изменчивость данных, что, в свою очередь, поможет вам очистить ваши данные, чтобы сделать их надежными и полезными для моделирования данных.

Оставляя вас всех с этой пищей для размышлений:

Продолжайте читать, продолжайте поддерживать

Отличия определений

Формулировка и определение

Медиана делит последовательность пополам, причем 1 часть состоит из элементов, меньших этой величины, а 2 часть состоит из больших чисел. Среднее арифметическое — это сумма всех элементов, деленная на их количество.

Данные в некоторых случаях совпадают, однако чаще всего они имеют разные значения.

Точность вычислений

Среднее арифметическое дает неточный итог подведения статистики, особенно если данных слишком много. Некоторые статисты заменяют его модой — элемент, который чаще всего встречается в последовательности. В частных случаях необходимо использовать среднее геометрическое, так как арифметическое дает неточный результат. Оценить эффективность величины можно только после применения его на практике, изучения всех значений последовательности и вычисления других статистических характеристик.

Медиана является более точной величиной, чем другое множество.

Однако для эффективной статистики необходимо учитывать сразу несколько показателей.

Применение

Для большинства обывателей медиана — это не статистическая величина, а математическая. Она чаще применяется в геометрических задачах на треугольники, как отрезок или луч. Многие даже не знают, что данное определение применимо к статистике. Его используют только при специализированных отчетах, для подведения итога. В устных докладах переменную не озвучивают, однако в документации ее необходимо описывать.

Среднее арифметическое также применяется в математике, однако в статистике оно известно не меньше. Его часто используют в СМИ, политике и экономике. Эта переменная изучается на начальной стадии обучения статистике.

Для большинства обывателей среднее арифметическое — более понятная величина, несмотря на то, что она неточна во многих случаях.

Медиана в статистке

Медиана — это такое значение признака, которое разделяет ранжированный ряд распределения на две равные части — со значениями признака меньше медианы и со значениями признака больше медианы. Для нахождения медианы, нужно отыскать значение признака, которое находится на середине упорядоченного ряда.

Посмотреть решение задачи на нахождение моды и медианы Вы можете здесь

В ранжированных рядах несгруппированные данные для нахождения медианы сводятся к поиску порядкового номера медианы. Медиана может быть вычислена по следующей формуле:

где Хm — нижняя граница медианного интервала;
im — медианный интервал;
Sme— сумма наблюдений, которая была накоплена до начала медианного интервала;
fme — число наблюдений в медианном интервале.

Свойства медианы

  1. Медиана не зависит от тех значений признака, которые расположены по обе стороны от нее.
  2. Аналитические операции с медианой весьма ограничены, поэтому при объединении двух распределений с известными медианами невозможно заранее предсказать величину медианы нового распределения.
  3. Медиана обладает свойством минимальности. Его суть заключается в том, что сумма абсолютных отклонений значений х, от медианы представляет собой минимальную величину по сравнению с отклонением X от любой другой величины

Графическое определение медианы

Для определения медианы графическим методом используют накопленные частоты, по которым строится кумулятивная кривая. Вершины ординат, соответствующих накопленным частотам, соединяют отрезками прямой. Разделив поп олам последнюю ординату, которая соответствует общей сумме частот и проведя к ней перпендикуляр пересечения с кумулятивной кривой, находят ординату искомого значения медианы.

Определение моды в статистике

Мода — значение признака, имеющее наибольшую частоту в статистическом ряду распределения.

Определение моды производится разными способами, и это зависит от того, представлен ли варьирующий признак в виде дискретного или интервального ряда.

Нахождение моды и медианы в контрольных по статистике происходит путем обычного просматривания столбца частот. В этом столбце находят наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. В интервальном вариационном ряду модой приблизительно считают центральный вариант интервала с наибольшей частотой. В таком ряду распределения мода вычисляется по формуле:

где ХМо — нижняя граница модального интервала;
imo — модальный интервал;
fм0, fм0-1,, fм0+1 — частоты в модальном, предыдущем и следующем за модальным интервалах.

Модальный интервал определяется по наибольшей частоте.

Мода широко используется в статистической практике при анализе покупательного спроса, регистрации цен и т. д.

Соотношения между средней арифметической, медианой и модой

Для одномодального симметричного ряда распределения средняя арифметическая, медиана и мода совпадают. Для асимметричных распределений они не совпадают.

К. Пирсон на основе выравнивания различных типов кривых определил, что для умеренно асимметричных распределений справедливы такие приближенные соотношения между средней арифметической, медианой и модой:

Средний инвестор не получает средний доход

Посещает ли средний студент колледжа колледж среднего размера, растет ли среднее дерево в среднем лесу и получает ли средний инвестор средний доход? Нет.

В одном исследовании средний доход от инвестиции 100 долларов на срок 30 лет составил 760 долларов, или 7% в год. Звучит неплохо. Но эта статистика не показывает, что 9% инвесторов потеряли деньги, а огромному числу инвесторов, 69%, не удалось достигнуть показателя среднего дохода. Так случилось потому, что среднее арифметическое было смещено из-за нескольких человек, заработавших больше среднего.

Будьте осторожны со средними, а также с тем, как их интерпретируют. Усредняя данные по выборкам из несопоставимых совокупностей, игнорируя разброс значений, допуская экологические ошибки мы видим мир искаженным и принимаем неверные решения.

Материалы по теме:

Области применения


Среднее значение этой таблицы оценок — 3−. Чуть меньше половины результатов хуже; добавляя саму оценку 3-, она просто превышается наполовину.

В отличие от среднего арифметического, медиана также может использоваться для переменных с обычной шкалой, таких как классы, для которых нет количественной разницы. Но медиана может также использоваться для интервальных и ratio- масштабируемых данных , а затем имеет свои недостатки и преимущества по сравнению с средним арифметическим как мера позиции. Медиана не может использоваться только для номинально масштабируемых переменных, характеристики которых не имеют естественного ранжирования, таких как переменная страна рождения . Здесь значение режима — единственная мера положения, которую можно определить.

Медиана используется в статистике и теории вероятностей в трех различных значениях:

  1. в качестве меры по позиции в описательных статистиках для описания списка бетона выборки значений .
  2. в теории вероятностей как медиана распределения вероятностей или случайной величины . Здесь медиана является альтернативой ожидаемому значению для указания «среднего значения».
  3. в математической статистике как медиана случайной выборки для надежной оценки неизвестных распределений.