Что такое гистограмма и зачем она нужна. ★ Январь 2023
Возможно, некоторые со мной яростно не согласятся, но гистограммой пользоваться не надо. А чтобы понять почему, я лучше расскажу, что это такое.
Гистограмма — это распределение пикселей по яркости. Гистограмма может быть монохромной либо цветной (RGB, например). Чаще всего в фотоаппарате вы видите монохромную гистограмму. Цветная встречается только в некоторых камерах, не обязательно дорогих, а так же в графических редакторах.
Вот как выглядит гистограмма:
Чем выше точка на кривой, тем больше пикселей данной яркости на фотографии. На картинке выше приведён случай правильно проэкспонированного кадра, с более-менее нормальной освещённостью без каких-либо проблем и перекосов. Слева на графике совсем чёрные пиксели (их почти нет), справа — совсем белые, то есть, самые яркие (пересвеченные).
Бытует мнение, что надо пользоваться гистограммой, чтобы получать кадры с «правильной» экспозицией. Если от цветной гистограммы ещё какая-то польза есть, то от монохромной точно никакой, но обо всём по порядку.
Прежде всего, следует учесть, что гистограмма — это не какой-то дополнительный параметр, который должен учитывать фотограф. Гистограмма — это результат анализа кадра. То есть, сама камера сначала пытается оценить экспозицию с помощью разных методов в автоматическом режиме, а потом строится гистограмма на основании того, что получилось. Если вы ещё раз попытаетесь её оценить «на глазок», лучше у вас вряд ли получится. В современных зеркальных Никонах экспозиция считается изощрённым 3D матричным методом с учётом цвета, чего пока нет в Кэнонах. Если представить, что простая монохромная гистограмма для этих целей подходит больше, то зачем надо было городить огород!? Возможно, кому-то покажется, гистограмма всё-таки нужна хотя бы в ручном режиме М, где автомат почти ничего не подстраивает, тогда читаем дальше.
Большинство камер строит монохромную гистограмму только по зелёному каналу, при том, что в большинстве камер цветной гистограммы просто нет! Это значит, что если с зелёным камера справится, то об остальных цветах вы не узнаете. Вот пример:
Ну да, кажется, что есть проблемы с тёмными областями, возможно, в тенях будут потеряны детали, но в целом ничего криминального нет, довольно равномерное распределение с большим количеством зелёного (предположительно) в средней освещённости.
Теперь смотрим цветную гистограмму:
Вот эта картинка уже может насторожить. Оказывается, есть не только проблема с тенью, но и пересвечен синий канал (возможно, небо). Да ещё и какие-то три цветных горба, что может натолкнуть на мысли о проблемах с балансом белого, то есть, с цветопередачей.
А теперь смотрим исходную картинку:
Полный аллес капут, а зелёного вообще нет. Картинка отдаёт синевой, цвета какие-то химические, действительно есть потеря деталей в тенях. Это фото я сделал на телефон и оно мне просто попалось в качестве примера, что могло бы получиться, если бы я внимательно изучал монохромную гистограмму. Конечно, такого перекоса цветов не было бы на D700, который очень хорошо работает в автоматическом режиме, но тем не менее, часто возникают ситуации, когда и на D700 требуется настраивать баланс белого.
Ещё один кадр из повседневной жизни с более-менее приемлемой освещённостью и цветами, вот его гистограмма:
Не знаю как вам, меня такие кадры вполне устраивают. А что до гистограммы, то для новичка она не сильно отличается от предыдущей.
Разбавим скучную статью жизненными примерами:
Вы думаете, это тёмная недоэкспонированная фотография? Я так не думаю:
Едем дальше:
Если вы попытаетесь на основе дедуктивного метода фотографов-теоретиков скорректировать экспозицию, чтобы сделать кадр светлее, вы безнадёжно потеряете небо над Нью-Джерси, а ночь превратится в день:
И на закуску цветная лесенка-чудесенка:
А по фото не скажешь:
В качестве выводов выскажу несколько соображений. Забудьте про монохромную гистограмму. По поводу цветной, то, возможно, от неё есть польза, но вы будете тратить слишком много времени не на фотографию, а на непонятно что, и упустите удачный кадр. Самый верный и быстрый способ — щёлкнуть и посмотреть на экране, нравится лично вам фото или нет. Благо, экраны современных камер показывают достоверную картинку.
Внимательный читатель наверняка уже несколько абзацев прочитал в напряжении, пытаясь догадаться, в чём подвох с заглавной фотографией. Я просто приведу монохромную гистограмму этого кадра без комментариев:
Гистограмма
Перейти к содержимому
Гистограмма – что это такое и «с чем её едят».Гистограмма – это диаграмма тонового распределения пикселей на снимке. Звучит мудрено, но все проще, чем кажется на первый взгляд — давайте разбираться! Слева направо идет шкала яркости (от темных к светлым оттенкам), а сверху вниз — количество площади фотографии той или иной тональности, то есть чем выше столбец, тем больше пикселей такой тональности (яркости) присутствует на снимке. (фото 1, 2)Гистограмма условно разделяется на три части: левая часть это самые темные участки изображения, часто этот участок называют просто тени; средняя часть гистограммы это, как ни странно, средние тона и, наконец, правая часть гистограммы это самые яркие участки изображения или света.
Существуют разные гистограммы – общая гистограмма экспозиции показывает распределение количества пикселей по яркости без привязки к цвету и поканальная гистограмма. Поканальные гистограммы зависят от цветового пространства (rgb, cmyk, lab) и представляют собой ту же самую гистограмму с одной лишь разницей – они привязаны к определенному цветовому каналу. Самой распространенной системой определения цвета является RGB поэтому более подробно остановимся именно на ней.
Чем нам поможет гистограмма?
Случаются такие моменты когда автоматика камеры не справляется и мы не можем получить так нужный нам кадр, особенно часто это происходит либо в плохо освещенных, либо наоборот ярко освещенных сценах. Тут то к нам на выручку и спешит гистограмма, по которой мы можем определить следует ли нам увеличить выдержку и открыть пошире диафрагму или наоборот света предостаточно и надо уменьшить его поток, попадающий на матрицу нашей камеры. Особенно полезна может быть гистограмма при съемке с импульсными источниками света, читай в студии, когда при фокусировке освещенность сцены кардинально отличается от освещенности во время съемки. Помимо прочего следует иметь в виду, что нет идеальной формы гистограммы, к которой нужно стремиться, все зависит как от конкретных условий съемки, так и от творческой задумки автора. Помните гистограмма лишь дополнительный инструмент при создании фотографии!
Похожие записи
Последнее на сайте
Гистограмма | Введение в статистику
Что такое гистограмма?
Гистограмма показывает форму значений или распределения непрерывной переменной.
Как используются гистограммы?
Гистограммы помогают увидеть центр, разброс и форму набора данных. Вы также можете использовать их в качестве визуального инструмента для проверки нормальности. Гистограммы являются одним из семи основных инструментов статистического контроля качества.
О чем стоит подумать?
Гистограммы — отличный способ оценки данных. Их можно использовать для проверки данных на наличие экстремальных значений или выбросов, а также для понимания распределения ваших данных. Распределение переменной важно понимать при выборе подходящих инструментов статистического анализа.
Гистограммы показывают форму данных
Гистограммы показывают форму ваших данных. Горизонтальная ось показывает значения ваших данных, где каждая полоса включает диапазон значений. Вертикальная ось показывает, сколько точек в ваших данных имеют значения в указанном диапазоне для столбца. На гистограмме на рис. 1 столбцы показывают количество значений в каждом диапазоне. Например, первая полоса показывает количество значений в диапазоне от 30 до 35.
На гистограмме показано, что центр данных находится где-то около 45, а разброс данных составляет примерно от 30 до 65. форма данных примерно в форме холма. Эта форма является визуальным признаком того, что данные, вероятно, относятся к нормальному распределению.
Рисунок 1: Гистограмма
В чем разница между гистограммами и гистограммами?
Основное различие между гистограммами и столбчатыми диаграммами заключается в типе отображаемых данных. Гистограммы используются с непрерывными данными, а гистограммы — с категориальными или номинальными данными.
Гистограммы не имеют промежутков между барами. Полосы представляют количество значений, встречающихся в диапазоне, указанном на горизонтальной оси. Гистограммы могут иметь промежутки между столбцами. Столбцы представляют измеренные значения для каждой категории.
Как создать гистограмму?
Для создания гистограммы необходимо определить диапазон значений данных для каждого столбца. Диапазоны столбцов называются интервалами. В большинстве случаев ящики имеют одинаковый размер. При равных бинах высота столбцов показывает частоту значений данных в каждом бине. Например, чтобы создать гистограмму возраста в годах, вы можете выбрать интервалы по десятилетиям (0–10, 11–20 и т. д.). Затем высота столбца показывает количество людей в каждом десятилетии.
При использовании программного обеспечения контейнеры определяются программой. Однако некоторые программные средства позволяют изменять количество бинов и начальные точки бинов, что позволяет исследовать и лучше понимать ваши данные.
На рис. 2 показаны те же данные, что и на рис. 1, но с большим количеством столбцов. Вы по-прежнему можете видеть центр, распространение и форму данных. Однако общую форму увидеть труднее, чем на первом рисунке.
Рисунок 2: Гистограмма из рисунка 1 с большим количеством столбцов
На рисунке 3 показаны те же данные, что и на рисунке 1, но только с тремя столбцами или интервалами. Гораздо труднее увидеть центр, форму и распространение данных.
Рисунок 3. Гистограмма с рисунка 1 с меньшим количеством столбцов
На приведенной ниже анимации показано, как использовать JMP и его инструмент захвата для изучения изменения границ ячеек для данных, показанных на рисунках 1–3.
Рис. 4: Анимация, показывающая интерактивный инструмент настройки бинов, доступный в JMP.
Вы можете захотеть изменить значения осей и приращения осей для изучения ваших данных, даже если ваше программное обеспечение не позволяет вам исследовать их в интерактивном режиме.
Как экстремальные значения данных наблюдаются на гистограммах
На гистограммы влияют экстремальные значения или выбросы. На рисунках 5 и 6 показан набор данных с исключенным и включенным выбросом.
Рисунок 5: Гистограмма, отображающая данные без выбросов
Рисунок 6: Гистограмма, отображающая данные с выбросом
На приведенных выше рисунках обе гистограммы имеют масштаб по горизонтальной оси от 20 до 90.
Как проявляется асимметрия в гистограммах
Не все гистограммы симметричны. Гистограммы отображают распределение ваших данных, и существует много распространенных типов распределений. Например, данные часто несимметричны. В статистике это называется искаженными данными. Например, время автономной работы телефона часто неравномерно: некоторые телефоны имеют гораздо более длительное время автономной работы, чем большинство.
Рисунок 7: Гистограмма, отображающая почти симметричные данные
Рисунок 9: Гистограмма, отображающая данные, которые смещены вправо (положительно)
На рисунке 7 показаны почти симметричные данные. Если вы думаете о том, чтобы сложить участок пополам посередине, две стороны будут примерно одинаковыми.
Гистограмма на рисунке 8 показывает несимметричные данные. Он смещен влево, а более длинный левый хвост значений смещается влево. Статистика асимметрии отрицательна.
Гистограмма на рис. 9 также показывает несимметричные данные. Он смещен вправо, с более длинным правым хвостом значений, уходящим вправо. Статистика асимметрии положительная.
Как группы данных отображаются на гистограммах?
Если вы знаете, что в ваших данных есть группы, то построение гистограмм для каждой группы может быть более целесообразным, чем построение одной гистограммы. Однако, если вы не уверены или не знаете, существуют ли группы, гистограмма может показать шаблон, который приведет вас к обнаружению групп в ваших данных
Например, график на рисунке 10 содержит данные для мужчин и женщин. Мы думаем, что могут быть различия в данных для мужчин и женщин.
Рисунок 10: Гистограмма, отображающая данные о различных группах
На этом графике, который имеет форму холма, показаны данные с центром около 22 и разбросом от примерно 7 до примерно 32.
На рисунке 11 показаны данные для мужчин, выделенных значком полосатая часть каждого бара. Данные для мужчин выглядят примерно в форме холма.
Рисунок 11: Гистограмма из рисунка 10 с выделением данных для мужчин
На графике на рисунке 12 показаны данные для женщин, выделенные полосатыми полосами. Эти данные также выглядят примерно в форме холма.
Рисунок 12: Гистограмма из рисунка 10 с выделением данных для женщин
На приведенных выше графиках показаны примеры, когда различия между группами оказывают влияние, но общий разброс значений одинаков для двух групп. Когда вы сравниваете выделенные гистограммы для мужчин и женщин, вы видите, что мужчины чаще имеют более низкие значения, чем женщины. Существует много совпадений, но гистограммы подтверждают идею о том, что между мужчинами и женщинами есть разница.
На рис. 13 показаны данные, в которых две группы сильно различаются. Если вы посмотрите на общую гистограмму, данные не имеют форму холма. На графике показаны данные для одной группы, выделенной полосами. Эта группа примерно имеет форму холма, имеет разброс примерно от 5 до 15 и центр около 9. На графике показаны данные для второй группы сплошными столбиками. Он не имеет грубой формы холма, имеет ширину от 20 до 32 и центр около 23.
Рисунок 13: Гистограмма, отображающая данные, где значения для каждой группы заметно различаются
Эти графики помогают определить важное соображение: всякий раз, когда вы создаете гистограмму, подумайте о том, есть ли в ваших данных группы. Если есть возможность групп, вы, вероятно, узнаете больше о данных, создав отдельные гистограммы для каждой группы. С помощью некоторых программ вы можете исследовать групповые различия на одной гистограмме, как показано на рисунках выше.
Гистограммы и типы данных
Непрерывные данные: подходят для гистограмм
Гистограммы подходят для непрерывных данных, поскольку они измеряются по шкале со многими возможными значениями. Некоторые примеры непрерывных данных:
- Возраст
- Артериальное давление
- Вес
- Температура
- Скорость
Для всех этих примеров гистограмма является подходящим графическим инструментом для изучения распределения данных.
Категориальные или номинальные данные: используйте гистограммы
Гистограммы не имеют смысла для категорийных или номинальных данных, поскольку они измеряются по шкале с несколькими возможными значениями. Используйте гистограммы вместо гистограмм.
При использовании категорийных данных выборка часто делится на группы, а ответы имеют определенный порядок. Например, в опросе, где вас просят высказать свое мнение по шкале от «Совершенно не согласен» до «Совершенно согласен», ваши ответы будут категоричными.
При номинальных данных выборка также делится на группы, но без особого порядка. Страна проживания является примером номинальной переменной. Вы можете использовать аббревиатуру страны или цифры для кодирования названия страны. В любом случае вы просто называете разные группы данных.
Что такое гистограмма? | EdrawMax
Знания
Знайте все о гистограмме
- Часть 1: Что такое гистограмма?
- Часть 2: История гистограмм
- Часть 3. Для чего используются гистограммы?
- Часть 4: Когда использовать гистограмму?
- Часть 5: Основные элементы гистограммы
- Часть 6: Распределения гистограммы
- Часть 7: Как создать базовую гистограмму?
- Часть 8: гистограмма против гистограммы
- Часть 9: Примеры гистограммы
Часть 1: Что такое гистограмма?
Гистограммы являются наглядным пособием для статистической аппроксимации данных с использованием столбцов разной высоты и ширины. Он представляет собой распределение непрерывных данных путем их сжатия в указанные пользователем диапазоны. Короче говоря, они суммируют большие объемы данных в легко читаемые графики, которые помогают более эффективно передавать информацию.
Часть 2: История гистограмм
Термин гистограмма имеет греческое происхождение и впервые был использован в конце 19 века известным английским математиком и биостатистиком Карлом Пирсоном для обозначения распространенной формы графического представления. Таким образом, ему приписывают введение гистограмм.
Это говорит о том, что Карл не изобретал эти диаграммы, а гистограммы использовались задолго до того, как они получили это название. Однако дата рождения и происхождение до сих пор неясны. Тем не менее, после имени Карла эти графики стали более популярными и стали получать признание среди исследователей и аналитиков.
Часть 3. Для чего используются гистограммы?
Гистограммы — важный инструмент для визуального представления распределения данных. Эти диаграммы обобщают большие объемы данных и представляют частоту значений. Следовательно, они помогают определить тренд распределения данных и медианы. Они также эффективны для выявления пробелов и выбросов в данных.
Часть 4: Когда использовать гистограмму?
Гистограмму можно использовать, когда вы хотите:
- Показать распределение значений ряда данных.
- Объединяйте большие значения данных в компактные графические представления.
- Сравните результаты процесса с указанными вами ограничениями и оцените, будет ли он соответствовать требованиям или нет.
- Сравните результаты двух или более процессов.
- Принимайте решение на основе результатов процесса.
Часть 5: Основные элементы гистограммы
Гистограмма состоит из четырех основных компонентов:
1. Название
Это выделяет информацию, включенную в гистограмму.
2. Горизонтальная ось (ось X)
Это представляет интервалы, на которые разделены данные. Интервалы равномерны и помогают суммировать большое количество наборов данных. Отдельные значения данных не отображаются.
3. Вертикальная ось (ось Y)
Ось Y представляет частоту графиков данных, которая представляет собой количество раз, когда значение появлялось в этом интервале.
4. Стержни
Полосы имеют переменную высоту и ширину и используются для представления графиков данных. Высота соответствует частоте значения, а ширина представляет длину интервала.
Часть 6: Распределения гистограммы
Гистограммы являются важными инструментами для отображения распределения частот, показывая, насколько повторяется значение в каждом наборе. Ниже приведены некоторые распространенные формы гистограмм, которые представляют различное распределение данных.
1. Нормальное распределение
Для представления нормального распределения используется изогнутый график в форме колокола. Точки на одной стороне среднего, скорее всего, будут и на другой стороне, поэтому график имеет очень симметричную форму.
2. Неравномерное распределение
В асимметричном распределении пик наклонен к пределу, а от него уходит хвост. Это асимметричное распределение, которое может быть смещено вправо или влево. В то время как распределение с асимметрией вправо называется положительно асимметричным, распределение с асимметрией влево является отрицательным. Мы получаем правостороннее распределение, если все собранные данные имеют значение больше нуля, тогда как левостороннее распределение формируется, когда данные имеют значения меньше 100.
3. Случайное распределение
Как следует из названия, этот тип распределения представляет собой случайную картину и имеет несколько рассеянных пиков. Если гистограмма представляет эту форму, можно сделать вывод, что различные процессы были объединены и каждый из них необходимо анализировать отдельно.
4. Бимодальное распределение
Бимодальные распределения, также известные как графики двойных пиков, показывают, что данные из двух разных процессов были объединены в один набор данных. В этом случае данные обоих процессов следует анализировать отдельно.
Часть 7: Как создать базовую гистограмму?
Шаг 1: Соберите значения данных для процесса.
Шаг 2: Теперь выберите подходящую ширину для каждого стержня. Диапазон должен иметь одинаковые интервалы и соответствовать всем данным.
Шаг 3: Выберите количество баров для гистограммы. Не используйте слишком много или слишком мало контейнеров.
Шаг 4: Создайте диаграмму частотного распределения для ваших графиков данных, проверив, сколько значений попадает в каждый бин.
Шаг 5: Нарисуйте график и обозначьте ось. Масштабируйте ось с интервалами, выбранными на шаге 2, и ось Y с частотой значений данных.
Шаг 6: Нарисуйте гистограмму для каждого интервала, чтобы гистограмма соответствовала частоте каждого значения. Между столбиками не должно быть промежутков.
Универсальное программное обеспечение для построения диаграмм
Легко создавайте более 280 типов диаграмм
Легко начинайте строить диаграммы с помощью различных шаблонов и символов
- Превосходная совместимость файлов: Импорт и экспорт чертежей в файлы различных форматов, например Visio
- Кроссплатформенная поддержка (Windows, Mac, Linux, Интернет)
Скачать бесплатно
Безопасность проверена | Переключиться на Mac >>
ПОПРОБУЙТЕ БЕСПЛАТНО
Безопасность подтверждена | Перейти на Linux >>
ПОПРОБУЙТЕ БЕСПЛАТНО
Безопасность подтверждена | Переключиться на Windows >>
Часть 8: гистограмма против гистограммы
Люди часто утверждают, что гистограммы — это тип гистограммы. Ну, это неправда. Они могут выглядеть одинаково, но оба представляют собой две разные формы графа.
Часть 9: Примеры гистограммы
Для лучшего понимания гистограмм давайте рассмотрим несколько примеров, приведенных ниже.
1. Время ожидания клиента
Это гистограмма, построенная для времени ожидания клиентов в определенном месте. Данные были собраны, а затем разделены на подходящие интервалы, чтобы соответствовать всем значениям. Из гистограммы мы можем легко понять, что трое клиентов ждали 35 секунд, а 5 из них должны были ждать не менее 50 секунд. Такие графики — хороший способ проверить эффективность системы и улучшить сервис.
2. Высота черешни
Это еще один пример построения гистограммы высоты вишневых деревьев в саду. В саду было 30 деревьев, и для каждого из них была измерена высота. Затем данные группируются в виде диаграммы частотного распределения, которая устанавливает интервалы и записывает для них частоту.