Чебышевское неравенство в вероятности

Неравенство Чебышева говорит, что по крайней мере 1-1 /К2 данные из выборки должны попадать в К стандартные отклонения от среднего (здесь К есть какой-то положительный настоящий номер больше, чем один).

Любой набор данных, который обычно распределяется, или в форме кривая колокола, имеет несколько особенностей. Один из них касается разброса данных относительно количества стандартных отклонений от среднего. При нормальном распределении мы знаем, что 68% данных - одно стандартное отклонение от среднего, 95% - два стандартные отклонения от среднего, и примерно 99% находится в пределах трех стандартных отклонений от среднего.

Но если набор данных не распределен в форме кривой колокола, то в пределах одного стандартного отклонения может быть другое количество. Неравенство Чебышева дает возможность узнать, какая часть данных попадает в К стандартные отклонения от среднего для Любые набор данных.

Факты о неравенстве

Мы также можем сформулировать вышеупомянутое неравенство, заменив фразу «данные из выборки» на

instagram viewer
распределение вероятностей. Это потому, что неравенство Чебышева является результатом вероятности, которая затем может быть применена к статистике.

Важно отметить, что это неравенство является результатом, который был доказан математически. Это не похоже на эмпирические отношения между средним и модой, или практическое правило что связывает диапазон и стандартное отклонение.

Иллюстрация неравенства

Чтобы проиллюстрировать неравенство, мы рассмотрим несколько значений К:

  • За К = 2 имеем 1 - 1 /К2 = 1 - 1/4 = 3/4 = 75%. Таким образом, неравенство Чебышева говорит, что по крайней мере 75% значений данных любого распределения должны быть в пределах двух стандартных отклонений от среднего.
  • За К = 3 имеем 1 - 1 /К2 = 1 - 1/9 = 8/9 = 89%. Таким образом, неравенство Чебышева говорит, что по крайней мере 89% значений данных любого распределения должны быть в пределах трех стандартных отклонений от среднего.
  • За К = 4 имеем 1 - 1 /К2 = 1 - 1/16 = 15/16 = 93.75%. Таким образом, неравенство Чебышева говорит о том, что как минимум 93,75% значений данных любого распределения должны находиться в пределах двух стандартных отклонений от среднего.

пример

Предположим, что мы взяли образцы веса собак в местном приюте для животных и обнаружили, что наша выборка имеет среднее значение 20 фунтов со стандартным отклонением 3 фунта. Используя неравенство Чебышева, мы знаем, что, по крайней мере, 75% собак, которых мы отобрали, имеют веса, которые являются двумя стандартными отклонениями от среднего значения. Два раза стандартное отклонение дает нам 2 х 3 = 6. Вычтите и сложите это из среднего значения 20. Это говорит нам о том, что 75% собак имеют вес от 14 до 26 фунтов.

Использование неравенства

Если мы знаем больше о распределении, с которым мы работаем, то мы обычно можем гарантировать, что больше данных - это определенное количество стандартных отклонений от среднего значения. Например, если мы знаем, что у нас нормальное распределение, то 95% данных - это два стандартных отклонения от среднего. Неравенство Чебышева говорит о том, что в этой ситуации мы знаем, что по крайней мере 75% данных - это два стандартных отклонения от среднего. Как мы видим в этом случае, это может быть намного больше, чем эти 75%.

Значение неравенства состоит в том, что оно дает нам сценарий «в худшем случае», при котором единственное, что мы знаем о наших выборочных данных (или распределении вероятностей), - это среднее значение и среднеквадратичное отклонение. Когда мы ничего не знаем о наших данных, неравенство Чебышева дает некоторое дополнительное представление о том, насколько распространен набор данных.

История неравенства

Неравенство названо в честь русского математика Пафнуты Чебышева, который впервые сформулировал неравенство без доказательств в 1874 году. Десять лет спустя Марков доказал это неравенство в своей диссертации. диссертация. Из-за различий в том, как изобразить русский алфавит на английском языке, именно Чебышев также пишется как Чебышев