Кривая Белла и определение нормального распределения

Срок кривая колокола используется для описания математической концепции, называемой нормальным распределением, иногда называемой распределением Гаусса. «Кривая колокола» относится к форме колокола, которая создается при построении линии с использованием точек данных для элемента, который соответствует критериям нормального распределения.

В кривой колокола центр содержит наибольшее число значений и, следовательно, является самой высокой точкой на дуге линии. Этот пункт относится к жадный, но в простых сроках это - наибольшее число вхождений элемента (в статистических терминах, способ).

Нормальное распределение

Важно отметить, что нормальное распределение является то, что кривая сосредоточена в центре и уменьшается с обеих сторон. Это важно, поскольку данные по сравнению с другими распределениями имеют меньшую склонность к получению необычно экстремальных значений, называемых выбросами. Кроме того, кривая колокола означает, что данные симметричны. Это означает, что вы можете создать разумные ожидания относительно вероятности того, что результат будет лежать в пределах диапазон слева или справа от центра, после того как вы измерили величину отклонения, содержащегося в данных. Это измеряется с точки зрения

instagram viewer
Стандартное отклонение.

График кривой колокольчика зависит от двух факторов: среднего значения и стандартного отклонения. Среднее значение определяет положение центра, а стандартное отклонение определяет высоту и ширину колокола. Например, большое стандартное отклонение создает короткий и широкий колокол, в то время как небольшое стандартное отклонение создает высокую и узкую кривую.

Вероятность кривой Белла и стандартное отклонение

Чтобы понять факторы вероятности нормального распределения, вам необходимо понять следующие правила:

  1. Общая площадь под кривой равна 1 (100%)
  2. Около 68% площади под кривой попадает в одно стандартное отклонение.
  3. Около 95% площади под кривой попадает в два стандартных отклонения.
  4. Около 99,7% площади под кривой попадает в три стандартных отклонения.

Пункты 2, 3 и 4 выше иногда называют эмпирическим правилом или правилом 68–95–99.7. Как только вы определите, что данные нормально распределены (колокол изогнутый) и рассчитать среднее значение и среднеквадратичное отклонениеВы можете определить вероятность что одна точка данных попадет в данный диапазон возможностей.

Пример кривой Белла

Хорошим примером кривой или нормального распределения является бросок двух кубиков. Распределение сосредоточено вокруг числа семь, и вероятность уменьшается по мере удаления от центра.

Вот процент вероятности различных результатов, когда вы бросаете две кости.

  • Два: (1/36) 2.78%
  • Три: (2/36) 5.56%
  • Четыре: (3/36) 8.33%
  • 5: (4/36) 11.11%
  • Шесть: (5/36) 13.89%
  • Семь: (6/36) 16,67% = наиболее вероятный исход
  • Восемь: (5/36) 13.89%
  • 9: (4/36) 11.11%
  • 10: (3/36) 8.33%
  • 11: (2/36) 5.56%
  • Двенадцать: (1/36) 2.78%

Нормальные распределения имеют много удобных свойств, поэтому во многих случаях, особенно в физика и астрономияслучайные вариации с неизвестными распределениями часто считаются нормальными, чтобы учесть вероятностные вычисления. Хотя это может быть опасным предположением, оно часто является хорошим приближением из-за неожиданного результата, известного как Центральная предельная теорема.

Эта теорема утверждает, что среднее значение любого набора вариантов с любым распределением, имеющим конечное среднее значение и дисперсию, имеет тенденцию встречаться в нормальном распределении. Многие общие атрибуты, такие как результаты тестов или рост, соответствуют примерно нормальному распределению, с немногими членами в верхних и нижних концах и многими в середине.

Когда не следует использовать кривую колокола

Есть некоторые типы данных, которые не соответствуют нормальному шаблону распределения. Эти наборы данных не должны пытаться соответствовать кривой колокола. Классическим примером могут быть оценки учащихся, которые часто имеют два режима. Другие типы данных, которые не соответствуют кривой, включают доход, рост населения и механические сбои.