Лучшие вопросы
Таймлайн
Чат
Перспективы

Гистограмма (статистика)

Из Википедии, свободной энциклопедии

Remove ads

Гистогра́мма в математической статистике — это один из графических методов исследования рядов распределения значений случайной величины.[B: 1]

Среди графических методов исследования рядов распределения указаны[1] следующие:

  • способ точек, (в результате которого получается точечная диаграмма);
  • способ прямоугольников (дающий ступенчатый многоугольник, столбчатую диаграмму, или гистограмму);
  • способ прямых (дающий многоугольник частот);
  • кривая сумм (изображение ряда из накопленных частот);
  • изображение наблюдённых значений случайной величины (по оси абсцисс откладывается их порядковый номер);
  • огива (значения случайной величины, полученные при наблюдении, располагаются в возрастающем порядке; по оси абсцисс откладывается их новый порядковый номер).

Ступенчатые многоугольники и многоугольники частот носят общее название многоугольников распределения. В качестве наиболее удобных указаны точечная диаграмма, ступенчатый многоугольник и многоугольник частот.[1]

Для двумерного случая вместо ряда распределения строится таблица распределения, и ей соответствующее графическое построение называют призмограммой.[1]

Remove ads

Определение

Суммиров вкратце
Перспектива

По ГОСТу

ГОСТ Р 50779.10-2000 предлагал следующие определения:

2.17 гистограмма
Графическое представление распределения частот для количественного признака, образуемое соприкасающимися прямоугольниками, основаниями которых служат интервалы классов, а площади пропорциональны частотам этих классов

2.18 столбиковая диаграмма
Графическое представление распределения частот для дискретной случайной величины, образуемое набором столбцов равной ширины, высоты которых пропорциональны частотам[D: 1]

Альтернативное определение

Пусть выборка из некоторого распределения. Определим разбиение числовой прямой . Пусть

— число элементов выборки, попавших в -й интервал. Тогда кусочно-постоянная функция , имеющая вид:

, — называется нормализованной гистограммой.[источник не указан 1889 дней][2]

Гистограмма абсолютно непрерывного распределения[источник не указан 1889 дней]

Пусть распределение случайных величин абсолютно непрерывно и задаётся плотностью вероятности . Тогда

по вероятности при .[3]
Remove ads

Процедура построения гистограммы

Суммиров вкратце
Перспектива

При выполнении чертежа по способу прямоугольников горизонтальная ось разбивается на равные отрезки, соответствующие разрядам; на этих отрезках, как на основаниях, строятся прямоугольники с высотой, пропорциональной частоте данного разряда.[4]

Опишем эту процедуру более детально. Сначала множество значений, которое может принимать элемент выборки, разбивается на несколько разрядов (bins). Чаще всего эти интервалы берут одинаковыми, но это не является строгим требованием. Эти интервалы откладываются на горизонтальной оси, затем над каждым рисуется прямоугольник. Если все интервалы были одинаковыми, то высота каждого прямоугольника пропорциональна числу элементов выборки, попадающих в соответствующий интервал. Если интервалы разные, то высота прямоугольника выбирается таким образом, чтобы его площадь была пропорциональна числу элементов выборки, которые попали в этот интервал.

Существенным для построения гистограммы является выбор оптимального разбиения, поскольку при увеличении интервалов снижается детализация оценки плотности распределения, а при уменьшении падает точность её значения. Для выбора оптимального количества интервалов часто применяется правило Стёрджеса

,

где — общее число наблюдений величины, — логарифм по основанию 2, — обозначает целую часть числа .

Также часто встречается правило, оценивающее оптимальное количество интервалов как квадратный корень из общего числа измерений:

Remove ads

Использование

Суммиров вкратце
Перспектива

Представление рядов распределения в преобразованном виде является необходимым условием при сравнении этих рядов между собой[1].

Исследование рядов распределения в значительной степени облегчается благодаря применению графического метода. При изображении рядов распределения на горизонтальной оси откладывают значения разрядов или наблюдённые значения случайной величины , а на вертикальной оси, — соответственно, разрядные частоты или наблюдённые частоты[1].

Построение нормализованных гистограмм может использоваться для получения эмпирической оценки плотности распределения случайной величины[5].

В общем виде одна из наиболее важных задач формулируется так: на заданном уровне значимости проверить гипотезу о том, что представленное на гистограмме распределение является мономодальным[A: 1].

Примеры использования

Гистограммы применяются (в том числе в иллюстративных целях) во всех областях знания, где приходится иметь дело с обработкой эмпирического числового материала и анализом частотности реализации тех или иных событий.

Так, например, анализ гистограмм традиционно считается среди геологов наглядным и информативным методом решения геологических задач, поскольку он позволяет проверять геологические гипотезы, сформулированные на языке статистики[A: 1].

Thumb
Пример гистограммы 5-минутной записи в норме при исследовании вариабельности ритма сердца

В кардиологии построение и описание гистограммы является обязательным геометрическим методом анализа вариабельности ритма сердца, предложенным стандартами 1996 года[A: 2][B: 2]. В качестве дополнительных способов описания гистограмм ритма сердца используют методы их триангулярной интерпретации, такие как индекс Святого Георга и триангулярный индекс[6].

На производстве при анализе состояния технологического процесса, построение гистограмм считается эффективным способом оценки ситуации и проведения анализа на первом этапе изучения стабильности технологического процесса, а также рассматривается как один из эффективных инструментов менеджмента качества на этапе контроля качества готовой продукции и анализа текущего состояния технологического процесса[A: 3].

Remove ads

См. также

Примечания

Литература

Ссылки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads