Среднее арифметическое

редактировать
Среднее арифметическое

В математике и статистике, среднее арифметическое (, ударение на первом и третьем слогах слова «арифметика»), или просто среднее или среднее (когда контекст ясно), представляет собой сумму набора чисел, деленную на количество чисел в коллекции. Коллекция часто представляет собой набор результатов эксперимента или наблюдательного исследования, или часто набор результатов опроса. Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других средств, таких как среднее геометрическое и среднее гармоническое.

Помимо математики и статистики, среднее арифметическое часто используется во многих различных областях, таких как экономика, антропология и история, и оно используется в в той или иной степени почти во всех академических областях. Например, доход на душу населения - это средний арифметический доход населения страны.

Хотя среднее арифметическое часто используется для сообщения основных тенденций, это не надежная статистика, а это означает, что на него сильно влияют выбросы (значения, которые намного больше или меньше большинства значений). Примечательно, что для асимметричных распределений, таких как распределение доходов, для которого доходы нескольких людей существенно больше, чем у большинства людей, среднее арифметическое может не совпадать с понятием «среднего», а надежная статистика, такая как медиана, может лучше описать центральную тенденцию.

Содержание
  • 1 Определение
  • 2 Мотивирующие свойства
  • 3 Контраст с медианой
  • 4 Обобщения
    • 4.1 Средневзвешенное значение
    • 4.2 Непрерывное распределение вероятностей
    • 4.3 Углы
  • 5 Символы и кодирование
  • 6 См. также
  • 7 Ссылки
  • 8 Дополнительная литература
  • 9 Внешние ссылки
Определение

Учитывая набор данных X = {x 1,…, xn} {\ displaystyle X = \ {x_ {1}, \ ldots, x_ {n} \}}{\ displaystyle X = \ {x_ {1}, \ ldots, x_ {n} \}} , среднее арифметическое (или означает или среднее ), обозначается x ¯ {\ displaystyle {\ bar {x}}}{\ bar {x}} (читается x {\ displaystyle x}x bar) - это среднее значение n {\ displaystyle n}n значений x 1, x 2,…, xn {\ displaystyle x_ {1}, x_ {2}, \ ldots, x_ {n}}x_ {1}, x_ {2}, \ ldots, x_ {n} .

Среднее арифметическое - это наиболее часто используемый и легко понимаемый показатель центральной тенденции в наборе данных. В статистике термин среднее относится к любому из показателей центральной тенденции. Среднее арифметическое набора наблюдаемых данных определяется как сумма числовых значений каждого и каждого наблюдения, деленная на общее количество наблюдений. Символически, если у нас есть набор данных, состоящий из значений a 1, a 2,…, an {\ displaystyle a_ {1}, a_ {2}, \ ldots, a_ {n}}a_ {1}, a_ {2}, \ ldots, a_ {n} , тогда среднее арифметическое A {\ displaystyle A}A определяется по формуле:

A = 1 n ∑ i = 1 nai = a 1 + a 2 + ⋯ + ann { \ Displaystyle A = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} a_ {i} = {\ frac {a_ {1} + a_ {2} + \ cdots + a_ { n}} {n}}}{\ displaystyle A = {\ frac {1} { n}} \ sum _ {i = 1} ^ {n} a_ {i} = {\ frac {a_ {1} + a_ {2} + \ cdots + a_ {n}} {n}}}

(объяснение оператора суммирования см. в разделе суммирование.)

Например, рассмотрим ежемесячную зарплату 10 сотрудников фирмы: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Среднее арифметическое

2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400 10 = 2530. {\ displaystyle {\ frac {2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400} {10}} = 2530.}{\ frac {2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400} {10}} = 2530.

Если набор данных статистическая совокупность (т. Е. Состоит из всех возможных наблюдений, а не только их подмножества), тогда среднее значение этой совокупности называется средним генеральным значением и обозначает редактируется греческой буквой μ {\ displaystyle \ mu}\ mu . Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), то мы называем статистику, полученную в результате этого вычисления, выборочным средним (что для набора данных X {\ displaystyle X}X обозначается как X ¯ {\ displaystyle {\ overline {X}}}{\ overline {X}} ).

Среднее арифметическое может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом. В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (сумма коэффициентов равна 1), оно может быть определено на выпуклом пространстве, а не только в векторном пространстве.

Мотивирующие свойства

Среднее арифметическое имеет несколько свойств, которые делают его полезным, особенно в качестве меры центральной тенденции. К ним относятся:

  • Если числа x 1,…, xn {\ displaystyle x_ {1}, \ dotsc, x_ {n}}x_ { 1}, \ dotsc, x_ {n} имеют среднее значение x ¯ {\ displaystyle { \ bar {x}}}{\ bar {x}} , затем (x 1 - x ¯) + ⋯ + (xn - x ¯) = 0 {\ displaystyle (x_ {1} - {\ bar {x) }}) + \ dotsb + (x_ {n} - {\ bar {x}}) = 0}(x_ {1} - {\ bar {x}}) + \ dotsb + (x_ {n} - { \ bar {x}}) = 0 . Поскольку xi - x ¯ {\ displaystyle x_ {i} - {\ bar {x}}}x_ {i} - {\ bar {x}} - это расстояние от заданного числа до среднего значения, один из способов интерпретировать это свойство - сказать что числа слева от среднего уравновешены числами справа от среднего. Среднее - это единственное число, для которого остатки (отклонения от оценки) равны нулю.
  • Если требуется использовать одно число в качестве «типичного» значения для набор известных чисел x 1,…, xn {\ displaystyle x_ {1}, \ dotsc, x_ {n}}x_ { 1}, \ dotsc, x_ {n} , тогда среднее арифметическое чисел делает это лучше всего в том смысле, что минимизации суммы квадратов отклонений от типичного значения: сумма (xi - x ¯) 2 {\ displaystyle (x_ {i} - {\ bar {x}}) ^ {2}}(x_ {i} - {\ bar {x}}) ^ {2} . (Отсюда следует, что выборочное среднее также является лучшим единственным предиктором в том смысле, что имеет наименьшую среднеквадратическую ошибку.) Если требуется среднее арифметическое совокупности чисел, тогда оценка этого несмещен - среднее арифметическое для выборки, взятой из генеральной совокупности.
Контраст с медианой

Среднее арифметическое может быть противопоставлено медиане. Медиана определяется таким образом, что не более половины значений больше и не более половины меньше медианы. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных 1, 2, 3, 4 {\ displaystyle {1,2,3,4}}{1,2,3,4} . Среднее значение равно 2,5 {\ displaystyle 2.5}2,5 , как и медиана. Однако, когда мы рассматриваем выборку, которую нельзя расположить так, чтобы увеличиваться арифметически, например 1, 2, 4, 8, 16 {\ displaystyle {1,2,4,8,16}}{1,2,4,8,16} , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое составляет 6,2, а медиана - 4. В общем, среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства из них.

Это явление можно найти во многих областях. Например, с 1980-х годов средний доход в США увеличивался медленнее, чем среднее арифметическое дохода.

Обобщения

Средневзвешенное значение

Средневзвешенное, или средневзвешенное значение - это среднее значение, в котором одни точки данных имеют больший вес, чем другие, поскольку им придается больший вес в расчетах. Например, среднее арифметическое 3 {\ displaystyle 3}3 и 5 {\ displaystyle 5}5 равно (3 + 5) 2 = 4 {\ displaystyle {\ frac {(3 + 5)} {2}} = 4}{\ frac {(3 + 5)} {2}} = 4 или, что эквивалентно, (1 2 ⋅ 3) ​​+ (1 2 ⋅ 5) = 4 {\ displaystyle \ left ({\ frac {1} {2}} \ cdot 3 \ right) + \ left ({\ frac {1} {2}} \ cdot 5 \ right) = 4}\ left ({\ frac {1} {2}} \ cdot 3 \ right) + \ left ({\ frac {1} {2}} \ cdot 5 \ right) = 4 . Напротив, средневзвешенное значение, при котором первое число получает, например, вдвое больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в генеральной совокупности, из которой были взяты эти числа), будет рассчитываться как (2 3 ⋅ 3) ​​+ (1 3 ⋅ 5) = 11 3 {\ displaystyle \ left ({\ frac {2} {3}} \ cdot 3 \ right) + \ left ({\ frac {1} {3}} \ cdot 5 \ right) = {\ frac {11} {3}}}\ left ({\ frac {2} {3}} \ cdot 3 \ right) + \ left ({\ frac {1} {3}} \ cdot 5 \ right) = {\ frac {11} {3}} . Здесь веса, которые обязательно составляют единицу, равны (2/3) {\ displaystyle (2/3)}(2/3) и (1/3) {\ displaystyle (1 / 3)}(1/3) , причем первое вдвое больше, чем второе. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай средневзвешенного значения, в котором все веса равны друг другу (равны 1 2 {\ displaystyle {\ frac {1} {2}}}{\ frac {1} {2}} в приведенном выше примере и равно 1 n {\ displaystyle {\ frac {1} {n}}}{\ frac {1 } {n}} в ситуации с усредненными числами n {\ displaystyle n}n ).

Непрерывные распределения вероятностей

Сравнение двух логнормальных распределений с равной медианной, но разной асимметрией, что приводит к разным означает режимы и

Если числовое свойство и любой образец данных из него может принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений может быть описана путем интегрирования непрерывного распределения вероятностей по этому диапазону, даже если наивная вероятность для номера выборки, принимающего одно определенное значение из бесконечного множества, равна нуль. Аналог средневзвешенного значения в этом контексте, в котором существует бесконечное количество возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей. Наиболее распространенное распределение вероятностей называется нормальным распределением ; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но также вышеупомянутую медиану и режим (три M), равны друг другу. Это равенство не выполняется для других распределений вероятностей, как показано для логнормального распределения здесь.

Углы

Следует соблюдать особую осторожность при использовании циклических данных, таких как фазы или углы. Наивное взятие среднего арифметического 1 ° и 359 ° дает результат 180 °. Это неверно по двум причинам:

  • Во-первых, угловые измерения определяются только до аддитивной константы 360 ° (или 2π, если измерения в радианах ). Таким образом, можно было бы так же легко назвать эти 1 ° и -1 ° или 361 ° и 719 °, так как каждый из них дает различное среднее значение.
  • Во-вторых, в этой ситуации 0 ° (эквивалентно 360 °) геометрически является лучшим средним значением: имеется меньшая дисперсия (точки находятся на расстоянии 1 ° от него и 179 ° от 180 °, предполагаемое среднее значение).

В общем случае такие недосмотр приведет к искусственному смещению среднего значения к середине числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации (, а именно, определить среднее значение как центральную точку: точку, относительно которой имеет наименьшую дисперсию), и переопределить разницу как модульное расстояние (т. Е., расстояние по окружности: поэтому модульное расстояние между 1 ° и 359 ° составляет 2 °, а не 358 °).

Доказательство без слов неравенства среднего арифметического и геометрического :. PR - диаметр окружности с центром в O; его радиус AO равен среднему арифметическому значений a и b. Используя теорему о среднем геометрическом, треугольник PGR высота GQ является средним геометрическим. Для любого отношения a: b AO ≥ GQ.
Символы и кодировка

Среднее арифметическое часто обозначается чертой, например, как в x ¯ {\ displaystyle {\ bar {x }}}{\ bar {x}} (прочтите x {\ displaystyle x}x bar).

Некоторое программное обеспечение (текстовые процессоры, веб-браузеры ) могут неправильно отображать символ x. Например, символ x̄ в HTML на самом деле представляет собой комбинацию двух кодов - базовой буквы x и кода для вышеприведенной строки (̄ или ¯).

В некоторых текстах такие как pdfs, символ x может быть заменен символом cent (¢) (Unicode ¢) при копировании в текстовый процессор, такой как Microsoft Word.

См. Также
Геометрическое доказательство без слов, что max (a, b)>среднее квадратичное или среднеквадратичное (QM)>среднее арифметическое (AM)>среднее геометрическое (GM)>среднее гармоническое (HM)>мин (a, b) двух положительных чисел a и b
Ссылки
Дополнительная литература
Внешние ссылки
Последняя правка сделана 2021-06-11 16:15:29
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте