Опорный кадр в H.264. Маленький параметр с большими последствиями
Опубликовано: Скачать статью в формате pdf (необходимо зарегистрироваться или авторизоваться)
Кодек H.264 де-факто стал стандартом в IP-видеонаблюдении. Преимущества межкадрового сжатия очевидны — меньше поток, меньше нагрузка на ЛВС, меньше объём архива. Вычислительные мощности серверного оборудования растут, и обрабатывать потоки в H.264 уже не проблема. Но всё ли мы знаем об H.264? Какие параметры кодека и на что влияют? Что такое опорный кадр H.264 и какое его значение оптимально? Давайте разбираться.
Структура кодека H.264
Прежде чем говорить об опорном кадре, нужно понимать структуру потока и принципы работы кодека H.264. Для начала немного теории.
Спецификация H.264 была опубликована ещё в 2003 году. Кодек стал настоящей революцией в телевидении высокой чёткости. Он позволил хранить и передавать изображение высокого разрешения с высоким качеством и битрейтом в несколько раз меньшим, чем другие форматы сжатия. Давайте рассмотрим структуру потока формата H.264.
IP-камера передает полные кадры (JPEG)а, между ними передаются только кодированные изменения изображения относительно опорного кадра. В этом и заключается суть межкадрового сжатия. Полные кадры получили название I-кадры. Далее следуют P и B-кадры. P-кадры содержат информацию об изменениях относительно I-кадра. B-кадры связаны как с I-кадрами, так и с P-кадрами. Все это нацелено на более эффективное сжатие и низкий поток с высоким качеством, но за это приходится расплачиваться высокими затратами на вычислительные мощности и оперативную память сервера при декодировании.
Из схемы структуры потока можно также заметить, что при декодировании невозможно восстановить изображение из B-кадра пока не будет получен P-кадр. В связи с этим мы и видим задержку в отображении потока с IP-камеры в H.
Существуют различные профили H.264, которые отличаются возможностями по кодированию. Чтобы не углубляться в теорию стоит отметить, что чем выше спецификация профиля, тем выше степень сжатия с сохранением высокого качества, но тем больше нагрузка на процессор камеры для кодирования и на ресурсы сервера по декодированию потоков. Так же, у старших профайлов больше упомянутая задержка в отображении потока с IP-устройства. Современные камеры в большинстве своем поддерживают Baseline Profile и Main Profile. Профессиональным IP-камерам доступен High Profile.
Некоторые производители IP-камер предоставляют возможность переключаться между профилями H.264. В этом случае доступен выбор — разгрузить ресурсы сервера и уменьшить задержку с Baseline Profile, но увеличить поток и дисковое пространство для архива, либо переключиться на High Profile и эффективно сжимать видеопоток с сохранением высокого качества изображения.
Что такое «опорный кадр»?
В схеме, расположенной выше, видно, что P и B-кадры, по сути, опираются на I-кадр, т. е. содержат информацию об изменениях относительно I-кадра. Именно поэтому I-кадр и получил название «опорный кадр». Частоту, а точнее период следования опорных кадров, указывают в виде параметра GOP length (Group of Pictures), либо GOV (Group Of VOPs). Это цифровое значение указывается числом (10, 32, 64, 100, …), которое показывает сколько кадров (P и B) следует между опорными I-кадрами.
Можно встретить название для GOP length в виде термина «частота опорных кадров». Это не совсем корректно и правильнее назвать GOP length — период следования опорных кадров. Когда мы обогатились новой терминологией, можно переходить к настройке этого параметра.
Оптимальная частота следования опорных кадров
Размер опорного кадра — весомая часть потока H.264. Чем чаще следует опорный кадр (меньше значение GOP length) — тем больше битрейт, но тем легче его обрабатывать процессору видеосервера при декодировании (отображения на УРМ или работе видеоаналитики). И наоборот, чем реже опорный кадр (больше значение GOP length) — тем меньше поток, но тем больше возможные артефакты межкадрового сжатия, и тем меньше восстановленный кадр соответствует реальному изображению с IP-камеры. При большом периоде следования опорного кадра требуются большие вычислительные ресурсы ПЭВМ и объём памяти для хранения последовательности кадров для восстановления.
Оптимальное значение периода следования опорных кадров средней сцены и типовых задач видеонаблюдения выбирает производитель IP-камеры и выставляет по умолчанию в настройках кодека. Встречаются IP-камеры со значением GOP length от 32 до 120 и более. В то же время, значение частоты опорного кадра (GOP length) оказывает значительное влияние на работу систем видеоанализа, и об этом мало кто задумывается, а точнее никто и не знает. Вот об этом поговорим подробно.
Значение опорного кадра для видеонаблюдения
Открываем секрет!
Практически вся видеоаналитика и технологии машинного зрения в большинстве программных продуктов (VMS) на рынке систем видеонаблюдения основаны на анализе и обработке именно опорных кадров.
Это связано с тем, что для восстановления дополнительных кадров из потока H.264 для работы видеоаналитики пришлось бы задействовать значительные вычислительные ресурсы ПЭВМ.
А вот теперь представьте себе, что для темпа видеоввода 25 к/с и значения GOP=100 мы получаем опорный кадр для работы видеоаналитики каждые 4 секунды!!! Какая точность и задержка у нас будет, хотя бы в детекции движения? За 4 секунды может произойти многое, а алгоритмы видеоанализа этого могут и не заметить, т.к. опорные кадры до возникновения происшествия и после будут одинаковыми. Для проверки этой теории мы даже сняли видеоролик и разместили его на нашем канале в YOUTUBE:
На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения. Подпишись на канал
Как это ни странно, но об этом практически никто не говорит. В редких рекомендациях на форумах техподдержки можно встретить совет по уменьшению частоты следования опорных кадров (уменьшения GOP) в IP-камере для решения проблем с детекцией движения.
Самое опасное в этой ситуации, что проблемы в детекции характерны на быстродвижущихся объектах и при определенном стечении обстоятельств. А по всеми известному закону эти обстоятельства возникнут в самый неподходящий момент, и в архиве не будет информации о том, кто поцарапал директорскую машину или куда пропал портфель важного гостя. И разобраться в первоисточнике проблемы практически невозможно. Проще сказать, что это глюк ПО видеонаблюдения, хотя заказчику от этого не легче.
Некоторые производители решают эту проблему через изменение настроек IP-устройств при их подключении к VMS. Семейство продуктов ITV (Интеллект, Intellect X +) автоматически меняет значение частоты следования опорных кадров в IP-камере и устанавливает GOP=8, но это возможно только в том случае, если камера качественно интегрирована.
Другие производители восстанавливают недостающие кадры путем частичной декомпрессии H.264 и получения промежуточных кадров для работы видеоаналитики. Так делает, например, Macroscop. Но, как мы уже заметили, это не дается даром и приходится расплачиваться высокой нагрузкой на видеосервер. Об этом рассказывается в статье Особенности работы ПО IP-видеонаблюдения.
Какой вариант лучше — сказать сложно. Правильным будет в конкретной ситуации и задаче выбрать оптимальное решение, опираясь на знание и понимание всех нюансов современных технологий и возможностей программных продуктов. И эти знания мы стараемся вам доносить в простой и понятной форме через информационные статьи, видеоролики на нашем канале, вебинары и семинары.
Резюме
Внимательно изучая значение и влияние различных параметров IP-устройств, открываешь для себя много интересного, а порой и крайне важного для работы систем видеонаблюдения. Кто бы мог подумать, что незаметный GOP в IP-камере может оказывать столь существенное влияние на такие базовые функции системы видеонаблюдения, как запись видеоархива по детекции движения.
В построении систем видеонаблюдения нет несущественных параметров. В определенных ситуациях любая функция или настройка может стать определяющей. Специалисты компании Видеомакс постоянно изучают возможности программных продуктов и функционал современных IP-камер на реальных стендах, изучая спецификации производителей и опираясь на фундаментальные принципы и знания, полученные в лучших технических вузах страны.
Результатами этих исследований мы делимся со своими партнёрами, помогая создавать эффективные системы видеонаблюдения, которые не подведут и будут долгие годы решать поставленные заказчиком задачи. Линейка оборудования VIDEOMAX вобрала в себя все последние достижения в компьютерной индустрии и оптимизирована для обработки видеопотоков с IP-камер в системах видеонаблюдения.
Каждый специалист инженерного отдела компании Видеомакс — это гуру в системах видеонаблюдения. По любому вопросу вы можете проконсультироваться у сотрудников отдела продаж или инженерного отдела по телефону +7(495)640-55-46 или отправить вопрос на email: [email protected]
Впереди ещё много полезного для инженеров и проектировщиков систем видеонаблюдения. Зарегистрируйтесь на нашем сайте, чтобы оперативно получать новости о всем самом важном, что происходит на рынке систем безопасности.
Назад к основам: что такое «группа изображений» (GOP)?
by AWS Central EurAsia & Russia Team | on | in AWS Elemental MediaConvert, Media & Entertainment | Permalink | ShareОригинал статьи: ссылка (Bryan Samis, Sr. Specialized Solutions Architect, AWS Elemental Media Services)
Иногда, в своей повседневной жизни, специалисты по работе с видео забывают, что не все понимают абракадабру из трехбуквенных абревиатур, которые используются в нашей индустрии. В серии публикаций “Назад к основам” мы рассмотрим основные фундаментальные понятия и принципы, используемые при кодировании или сжатии видео для его дальнейшего распространения. Попытаемся объяснить их доступным и лёгким для понимания языком.
В этой статье мы рассмотрим такое понятие, как “Group of Pictures (GOP)” – группа изображений или группа кадров, которое используется в современных алгоритмах кодирования видео, включая такие алгоритмы межкадрового кодирования, как MPEG-2, H.264 и H.265.
Ну, что же, давайте начнём.
Зачем нам в принципе нужно сжимать видео?Несжатое или некомпрессированное видео, которое передается по таким интерфейсам, как “High Definition Multimedia Interface” (HDMI), “Serial Digital interface” (SDI) или Ethernet требуют большой пропускной способности. Таблица, приведённая ниже, показывает примерные значения битрейтов, которые требуются для работы с несжатым цифровым видео сигналом для различных разрешений (размеров изображения) и частотах кадровой развертки (количеству передаваемых изображений/кадров в секунду времени):
Разрешение | Битрейт |
1280×720 (720 50/60p)/1920×1080 (1080 25/30i) | ~ 1.5 Гигабита в секунду |
1920×1080 (1080 50/60p) | ~ 3 Гигабита в секунду |
3180 x 2160 (2160 50/60p or 4K) | ~ 12 Гигабит в секунду |
Хотя работа с видеосигналами со скоростью в несколько Гигабит в секунду возможна в рамках профессионального студийного комплекса, совершенно очевидно, что транслировать 1,5 Гбит/с в дома большинства зрителей или на их мобильные устройства невозможно. Для большей части пользователей домашние интернет-провайдеры даже не способны предоставить такую скорость подключения, не говоря уже о скорости скачивания. Таким образом, чтобы доставлять видео через Интернет или другую среду с фиксированной пропускной способностью (например, через спутник, эфир или кабель), необходимо кодировать или сжимать видео до меньших объемов (битрейтов) или иначе говоря, компрессировать (обычно в диапазоне от 1 до 20 Мбит/с).
Сколько времени вы готовы потратить на погружение в эту область? Для глубокого понимания специфики алгоритмов кодирования видео потребуются годы обучения. Обычно это является предметом исследованиий аспирантов в области компьютерных наук или математики. В этой публикации мы лишь поверхностно коснемся основ, объясняющих общие принципы кодирования видео.
На фундаментальном уровне, процессы кодирования видео основаны на поиске и устранении избыточной информации в изображении или последовательности изображений. Изображение в этом случае называется кадром, последовательность изображений – последовательностью кадров.
Если мы рассмотрим немного более детально абсолютно обычное видео, которое вы можете посмотреть онлайн или по телевизору – например, выпуск новостей, то каждый кадр новостного видеоряда, где диктор читает новости, обычно очень похож на те, которые предшествуют и следуют за ним. Губы диктора могут шевелиться во время разговора, бегущая строка может меняться в нижней части экрана, но большая часть изображения либо одинакова, либо очень похожа от кадра к кадру.
На примере трёх последовательных кадров из мультфильма “Big Buck Bunny” видно, что большая часть содержимого от кадра к кадру остается неизменной, лишь слегка меняются положение крыльев бабочки.
Эта наблюдения берутся за основу и являются ключевыми для алгоритмов межкадрового кодирования, т.к. в большинстве случаев сжатие видео достигается путём отправки полной информации только для определенных кадров, которые называются ключевыми или опорными кадрами, а для всех остальных кадров передается только информация о разнице между ключевым кадром и последующими кадрами. Приемное устройство или декодер может использовать ключевой кадр, плюс эти различия, для воссоздания нужного кадра с разумной точностью. Этот метод сжатия известен, как временное сжатие, потому что он использует тот факт, что информация в видео изменяется медленно с течением времени.
Второй тип сжатия, известный как пространственное сжатие, также используется для сжатия ключевых кадров путём поиска и устранения избыточности в самом изображении или кадре. Давайте ещё раз вернёмся к примеру новостей и представим единичный снимок изображения, где диктор читает новости. В большинстве случаев пиксели (пиксель – это наименьший логический элемент двумерного цифрового изображения) в этом изображении похожи на пиксели, которые их окружают, поэтому мы можем применить тот же метод, что и ранее, отправив только различия между одной группой пикселей и последующей группой. Это тот же метод используется для сжатия обычных изображений (картинок, фотографий, и т.п.), когда мы сохраняем их в формате JPEG (широко известный и распространенный формат сжатия одиночных изображений, разработанный одноименной группой разработчиков Joint Photographic Experts Group).
На примере кадра, извлечённого из того же мультфильма “Big Buck Bunny” видно, что пиксели обычно окружены другими пикселями аналогичного цвета — например, в небе синие пиксели окружены другими синими пикселями, а белые пиксели окружены другими белыми пикселями в облаке. При кодировании используется этот факт, который позволяет существенно сжимать (уменьшать объем данных) изображения с применением алгоритмов пространственного сжатия без видимой или существенной потери качества.
Надеюсь пока все понятно! Ну так что же все же это — GOP?В идеальном мире устройства, осуществляющие процесс кодирования (кодеры или кодирующие устройства), могли бы создавать ключевой кадр для первого кадра видео и потом каждый последующий кадр был бы представлен, как разница между данным кадром и ключевым, и так до конца видео. Однако есть несколько причин, по которым в реальной жизни это работать не будет:
- Произвольный доступ: отправка первого кадра в качестве ключевого кадра и последующих в виде различий между текущим и ключевым кадром могла бы работать, если бы каждый зритель начинал бы просмотр видео с первого кадра и смотрел только вперед от начала до конца.
Но на самом деле, зрители смотрят видео контент по-разному. Если мы говорим про просмотр лйнейных ТВ каналов, зрители обычно подключаются к их просмотру случайным образом – когда им удобно или у них есть свободное время. Чтобы подстроиться под такое поведение зрителя, необходимо разместить больше ключевых кадров по всему видео, чтобы зрители могли начать просмотр не сначала, а с этих точек, где будут передаваться ключевые кадры. Они называются точками произвольного доступа.
- Устойчивость к ошибкам. Другая проблема, связанная передачей только одного ключевого кадра и затем только с различий между кадрами, заключается в том, что для большинства случаев среда доставки или распространения видео является неидеальной. Какая то часть информации может потеряться во время доставки, данные/биты (бит – это минимальная единица измерения информации в двоичной системе счисления) могут доставляться с разной скоростью/задержкой, что может привести к тому, что часть их может поменяться местами, и есть еще множество других факторов, которые существуют в реальном мире и могут приводить к появлению всевозможных ошибок.
Если вы отправляете только отличия от того, что было раньше, и при этом вначале возникает ошибка или потеря данных, то эта ошибка будет продолжать повторяться для всей остальной части видеопотока, пока он не закончится. Добавление дополнительных ключевых кадров по всему видео обеспечит устойчивость к ошибкам, возвращая декодер к «заведомо исправному» кадру и очищая предыдущие ошибки, которые могли бы продолжаться без них. Вы, наверняка, видели, как это происходит при просмотре видео, когда появляется какая-то ошибка, и экран становится блочным, или на нем появляются фигуры с зеленым оттенком. И потом, внезапно, изображение возвращается к норме.
- Изменение сцены: передача только различий между кадрами работает очень хорошо, когда различия между кадрами относительно небольшие. Но во время изменения контента или перехода между сценами почти все изображение может быть заполнено новой информацией абсолютно отличающейся от предыдущей последовательности кадров.
Когда это происходит, обычно нет смысла продолжать передавать только различия. Устройство кодирования видео (видеокодер) способно отслеживать это и автоматически вставлять новый ключевой кадр в пограничную точку – в момент смены сцены. Это называется обнаружением смены сцены.
Итак, теперь, когда вы понимаете, почему так важно регулярно вставлять ключевые кадры в видеопотоке, мы можем поговорить о группе изображений или группе кадров (GOP). Проще говоря, GOP — это расстояние между двумя ключевыми кадрами, измеряемое количеством кадров или промежутком времени между ключевыми кадрами. Например, если ключевой кадр вставляется в видео каждую секунду со скоростью 25 кадров в секунду, длина GOP составляет 25 кадров или 1 секунду. Хотя реальная длина GOP зависит от выбранной реализации и конкретного применения, обычно она находится в диапазоне 0.5–2 секунды.
«Ключевые кадры»? «Кадры, несущие разницу между текущим и ключевым кадром»? Нет ли для них других более официальных названий?Конечно есть! В стандартах кодирования MPEG-2 и выше ключевые кадры обычно известны, как кадры с внутренним кодированием или сокращенно I-кадры («intra-coded frame»). Они названы так потому, что кадры сжимаются с использованием пространственного сжатия, и, таким образом, вся информация, необходимая для декодирования этого типа кадра, есть в нем самом. Декодеру не нужно каких-либо других кадров для воссоздания изображения.
Важно заметить, что начиная со стандарта H.264 и выше был введен еще один специальный тип кадра, называемый “ Instantaneous Decoder Refresh ” (или IDR-кадр), который представляет из себя ключевой I-кадр, содержащий дополнительно специальную команду для декодирующего устройства для очищения референсного буфера. IDR кадр указывает, что ни один кадр после кадра IDR не может ссылаться на какой-либо кадр перед ним. Данный фукционал широко используется для адаптивного стримминга – вещания через интернет, где один и тот же контент вещается небольшими частями/кусками с разными разрешениями и битрейтами, и приемное устройство, в зависимости от доступной на данный момент времени для него полосы, может запросить копию с меньшим или больщим видео битрейтом, обеспечив тем самым беспрерывное декодирование видео, хотя и с потерей качества в моменты падения скорости доступа в интернет).
Хотя между кадрами I и IDR есть тонкие различия, для понимания GOP мы можем рассматривать их так, как если бы они были одинаковыми.
Вы можете думать об I-кадре, как о простом статичном изображении в формате JPEG. Обычно I-кадры используют наибольшее количество битов в видеопотоке (имеют больший размер), потому что они используют только пространственное сжатие, и совсем не используют временное.
А как насчет «кадров, несущих разницу между текущим и ключевым кадром»? Есть два типа кадров, которые мы используем для передачи информации о различиях декодеру. Первый называется прогнозируемым или разностным кадром (P-кадр, “Predicted frame”). Он называется прогнозируемым кадром, потому что он содержит информацию о том, что изменилось по сравнению с предыдущими кадрами. P-кадры предоставляют «различия» между текущим кадром и одним (или несколькими) кадрами, которые были перед ним. Например, Р-кадр, который следует сразу за I-кадром, использует неизменную информацию из этого I-кадра и дополняет ее своей межкадровой разностью. Если за этим P-кадром следует еще один Р-кадр, то он в свою очередь берет неизменную информацию из предыдущего P-кадра (который в свою очередь использовал неизменную информацию I-кадра) и дополняет ее своей межкадровой разностью. P-кадры сжимаются гораздо лучше, чем I-кадры, поскольку они используют преимущества, как временного, так и пространственного сжатия и занимают меньше битов в видеопотоке.
Последний тип кадра, которые мы используем для передачи информации о различиях — это кадр с двунаправленным прогнозом или B-кадр (“Bi-predicted frames”). Они также могут называться обратными кадрами.
B-кадры являются двунаправленными, потому что они используют данные из кадров, которые были до и после них, и несут только различия между текущим кадром, прошлым и будущим опорными или прогнозируемыми кадрами. Поскольку они используют временное сжатие, и передают только разницу между текущим кадром, прошлым и будущим I и P кадрами, то их коэфициент сжатия выше чем у остальных типов. B-кадры обеспечивают максимальное сжатие и занимают наименьшее количество бит в видеопотоке.
Те из вас, кто всё еще не потерял нить объяснения, могут спросить, как B-кадр может заглядывать в будущее, чтобы указать различия между ним и будущим кадром. Опять же, детали немного выходят за рамки этой публикации, но происходит то, что устройство кодирования (кодер) буферизует прошлые и будущие кадры перед кодированием промежуточных кадров. Оно отправляет эти кадры в декодер не по порядку, поэтому будущий кадр (I или P) фактически поступает в декодер раньше, чем B-кадры. Затем декодер создает промежуточные кадры и воспроизводит их в правильном порядке, используя информацию о временной синхронизации, добавленную кодером на этапе кодирования в транслируемый сигнал или видеофайл.
На рисунке выше, вы можете посмотреть размеры (в килобайтах) различных типов кадров в одной группе кадров (GOP). Обратите внимание, что I-кадры используют наибольшее количество битов, за ними следуют P-кадры, а B-кадры используют наименьшее количество битов.
Типичная структура GOP содержит повторяющийся шаблон кадров B и P, “зажатый” между I кадрами. Примером типичного GOP может быть что-то вроде:
I B B P B B P B B P B B I
Последовательность, подобная приведённой выше, может быть представлена двумя числами: M и N. M представляет собой расстояние между двумя I или P-кадрами, тогда как N представляет собой расстояние между двумя I-кадрами. Вышеупомянутая группа кадров (GOP) описывается, как M = 3, N = 12.
Профессиональные видеоанализаторы могут визуально отображать группы изображений и типы кадров:
Но вы также можете увидеть структуру GOP закодированного видео с помощью бесплатного программного обеспечения, к примеру, такого как ffprobe:
$ ffprobe -i SAMPLE_MOVIE.mp4 -show_frames | grep 'pict_type' pict_type=I pict_type=B pict_type=B pict_type=P pict_type=B pict_type=B pict_type=P pict_type=B pict_type=B pict_type=P pict_type=B pict_type=P pict_type=I
Из результатов выполнения команды, приведеннй выше, мы видим, что наш образец видео имеет длину GOP 12 кадров.
Как настройки длины GOP влияют на качество кодирования видео?Чем короче длина GOP, тем меньше кадров B и P существует между I кадрами. Помните, что кадры B и P предлагают нам наиболее эффективное сжатие, поэтому в видео с более низким битрейтом короткая длина GOP приведет к ухудшению качеству видео. Увеличение длинны GOP, в свою очередь, обеспечивает более эффективное сжатие контента, что позволит ожидать более высокого качества видео при более низкой скорости передачи данных, однако это может повлиять на увеличение времени переключения между каналами и на отказоустойчивость.
В качестве примера, два последующих изображения представляют увеличенный фрагмент одного и того же кадра из мультфльма Big Buck Bunny, закодированного со скоростью 2,5 Мбит/с с использованием идентичных настроек кодирования, за исключением длины GOP. Первое изображение сжато с GOP, равным 4 кадрам, а второе — с длиной GOP, равной 90 кадрам.
Кадр того же видео, закодированный со скоростью 2,5 Мбит/с, с GOP, равным 4 кадрам (вверху), и GOP, равным 90 кадрам (внизу), это наглядная иллюстрация того влияния, которое настройки GOP могут иметь на качество видео. Поскольку в верхнем примере меньше кадров B и P, кодер должен более грубо квантовать I-кадры (сжимать их больше), чтобы соответствовать выбранному битрейту, что приводит к блочности, размытости и потере деталей.
Вышесказанное верно для большинства случаев кодирования. Однако при кодировании с очень высокой скоростью передачи данных, где поддержание высокого качества изображения более важно, чем сохранение битов (обычно 50 Мбит / с и выше), можно использовать длину GOP, равную 1 кадру (то есть, когда каждый кадр является I-кадром). Обычно это используется только на этапе производства и для создания архивов. В этом случае требования к качеству превалируют над требованиями к сохранению полосы.
В AWS Elemental MediaConvert (облачный сервис AWS для кодирования видео файлов) вы можете настроить параметры GOP, выбрав видеодорожку требуемого выхода и прокрутив вниз до дополнительных настроек.
В примере выше примере мы указали длину группы изображений равной 90 кадров с двумя B-кадрами между опорными или прогнозируемым кадрами. Другими словами, приведенная выше конфигурация представляет M = 3, N = 90.
В AWS Elemental MediaLive (облачный AWS сервис для кодирования линейного контента в реальном времени) Вы найдёте настройки GOP, выбрав видеодорожку требуемого выходного потока и прокрутив вниз до раздела «Структура GOP».
В этом примере длина GOP равна 60 кадров с 3 B-кадрами между опорными кадрами. Другими словами, приведенная выше конфигурация представляет схему M = 4, N = 60.
Наконец, если вы осуществляете кодирование с помощью бесплатного программного обеспечения с открытым исходным кодом, такой как например ffmpeg с x264, вы можете указать настройки GOP, включив аргументы keyint = и bframes = в испольняемую команду:
$ ffmpeg -i SAMPLE_MOVIE.mp4 -c:v libx264 -b:v 4M -x264-params keyint=24:bframes=2 OUTPUT.mp4
При данных настройках видео будет кодироваться, используя длину GOP = 24, с двумя B-кадрами между опорными кадрами, или M = 3, N = 24.
Какой тип кадров наиболее важен?Частый вопрос на собеседовании для специалистов по обработке видео: «какой тип кадра самый важный?». Распространенный (и вполне приемлемый) ответ, что I-кадры являются наиболее важными, потому что без них другим типам кадров было бы не на чем основывать свои различия. Но тонкий нюанс этого вопроса в том, что на него нет однозначного правильного ответа. С таким же правом можно сказать, что B-кадры являются наиболее важными, потому что они обеспечивают наилучшее сжатие. В конце концов, какой смысл в сжатии видео, если оно работает не эффективно? Цель этого вопроса не в том, чтобы получить правильный ответ, а в том, чтобы услышать, как кандидат обосновывает свой ответ, поскольку это дает ключ к пониманию того, насколько хорошо он знаает фундаментальные основы кодирования видео.
Надеюсь, после прочтения этой публикации вы будете понимать различные методы сжатия, используемые в кодировании видео, какие типы кадров при этом бывают, и то, как они объединяются, чтобы сформировать GOP.
И как заключение, хотелось бы чтобы Вы сами попытались ответить на вопрос: «Какой тип кадра, по вашему мнению, наиболее важен?»
TAGS: encoding, Media & Entertainment Solutions, video compression
AWS Central EurAsia & Russia Team
Системы отсчета
главная следующая
Майкл Фаулер, Университет Вирджинии
Инерциальные системы отсчета
Краеугольным камнем специальной теории относительности является принцип Относительность :
Законы
Физика одинакова во всех инерциальных системах отсчета.
Мы увидим, что из этого безобидного глядя заявление.
Давайте сначала, однако, кратко рассмотрим теорию Ньютона. механика с точки зрения системы отсчета.
«Система отсчета» — это просто набор координат: то, что вы используете для измерения вещей, которые материи в ньютоновских задачах, то есть положениях и скоростях, поэтому мы тоже нужны часы.
Точка в пространстве определяется тремя координатами (x, y, z) и «событием», например, небольшим взрывом, по месту и времени: (x,y,z,t).
Инерциальная система определяется как система, в которой выполняется закон инерции Ньютона , т. е. любое тело, на которое не действует внешняя сила, остается в покое, если оно изначально в покое, или продолжает двигаться с постоянной скоростью, если это то, что это делалось с самого начала. Пример из не -инерционная рама представляет собой вращающуюся раму, такую как карусель.
«Законы физики», которые мы рассмотрим в первую очередь, — это законы ньютоновской механики,
как это выражено законами движения Ньютона, с гравитационными силами, а также
контактные силы от предметов, сталкивающихся друг с другом. Например, зная универсальное
гравитационная постоянная из эксперимента (и вовлеченных масс), это
можно из Ньютона
Второй закон,
сила = масса × ускорение ,
для предсказания будущих движений планет с большой точностью.
Предположим, мы знаем из опыта, что эти законы механики верны в одном точка зрения. Как они выглядят в другой кадр, движущийся относительно первого кадра? Чтобы это выяснить, нам нужно выяснить, как получить от положения, скорости и ускорения в одном кадре до соответствующих величины во втором кадре.
Очевидно, что две системы отсчета должны иметь постоянную относительную скорость, иначе закон инерции не будет выполняться в них обоих. Выберем координаты так, чтобы эта скорость была вдоль оси x обоих из них.
Обратите внимание, что мы также добавляем часы с каждым кадром.
Предположим, что S′ выполняется
относительно S со скоростью v по оси x.
Для удобства обозначим момент, когда O′ проходит O , как нулевую точку
хронометраж.
Преобразования Галилея
Если событие происходит в точке (x,y,z,t), измеряемой в ю.ш., каковы его координаты (x′,y′,z′,t′) в ю.ш. ? Легко видеть, что t′=t – мы синхронизировал часы, когда O′ прошел O . Также очевидно, что y′=y и z′=z, из рисунка. Мы также можем видеть, что x=x′+vt. Таким образом, (x,y,z,t) в S соответствует (x′,y′,z’,t′) в S’ , где
x′=x−vt,y′=y, г’=г,т’=т.
Вот как позиции трансформируют ; они известны как Galilean . преобразования.
Как насчет скоростей ? скорость в S′ в направлении x’
u′x=dx′dt′=dx′dt=ddt(x−vt)=dxdt−v=ux−v.
Это и так очевидно: это просто сложение формул скоростей
ux=u′x+v.
Как ускорение трансформируется?
du′xdt′=du′xdt=ddt(ux−v)=duxdt
, так как v является константой.
То есть
a′x=ax,
ускорение равно в обоих кадрах. Это опять-таки очевидно —
ускорение есть скорость изменения скорости, а скорости одних и тех же
частица, измеренная в двух кадрах, отличается на 9
мы получаем тот же закон при переходе к другой инерциальной системе отсчета, потому что каждый член в приведенном выше уравнении остается тем же .
Обратите внимание, что ma→ – скорость изменения импульса. одинаково на обоих кадрах. Итак, в столкновение, скажем, если полный импульс сохраняется в одном кадре (сумма индивидуальные скорости изменения импульса равны нулю) то же самое верно для всех инерционные рамки.
главная следующая
Система отсчета Определение и значение
- Основные определения
- Викторина
- Сопутствующее содержимое
- Примеры
- Научная
Показывает уровень оценки в зависимости от сложности слова.
Сохрани это слово!
См. синонимы системы отсчета на сайте Thesaurus.com
Показывает уровень оценки в зависимости от сложности слова.
сущ. Физика.
система отсчета (по умолчанию 2).
ВИКТОРИНА
ВСЕ ЗА(U)R ЭТОГО БРИТАНСКОГО ПРОТИВ. ВИКТОРИНА ПО АМЕРИКАНСКОМУ АНГЛИЙСКОМУ
Существует огромное количество различий между тем, как люди говорят по-английски в США и Великобритании. Способны ли ваши языковые навыки определить разницу? Давай выясним!
Вопрос 1 из 7
Правда или ложь? Британский английский и американский английский различаются только сленговыми словами.
Происхождение системы отсчета
Впервые зафиксировано в 1920–25 гг.
Слова рядом с системой отсчета
ссылка, рефери, справочник, справочник, электрод сравнения, система отсчета, группа отсчета, отметка, справочники, референдум, референт
Dictionary.com Полный текст
На основе Random House Unabridged Dictionary, © Random House, Inc. , 2023
Слова, относящиеся к системе отсчета
контекст, система координат, структура, точка зрения, дискурсивная вселенная
Как использовать систему отсчета в предложении
Ваш мозг перемещается по системам отсчета, чтобы вспомнить факты, хранящиеся в разных местах.
«У нас никогда не будет настоящего ИИ без предварительного понимания мозга»|Will Heaven|3 марта 2021 г.|MIT Technology Review
В 2011 году ЛГБТ-издание Queerty обвинило приложение в том, что оно якобы удалило учетные записи, в которых упоминалось о том, что они трансгендеры.
Проблема транс-свиданий Гриндра|Дэвид Левсли|9 января 2015 г.|DAILY BEAST
Затем он дает некоторое представление о своей психике — в комплекте со ссылкой на Дом животных.
Huckabee 2016: Нагнись и возьми, как пленник!|Оливия Нуцци|8 января 2015 г.|DAILY BEAST
Средства массовой информации склонны представлять подобные ситуации как заблуждения, но в данном случае все наоборот.
правда.
Сегодняшняя Республиканская партия: все еще крута с расистским потворством?|Майкл Томаски|7 января 2015 г.|DAILY BEAST «черная система ценностей».
Преподобный Джереми Райт был хуже, чем Scalise|Рон Кристи|2 января 2015 г.|DAILY BEAST
Действительно, дизайнеры часто ссылаются друг на друга в своих показах, и пресса всегда это замечает.
Большой бизнес фэшн-подделок|Лиззи Крокер|24 декабря 2014|DAILY BEAST
Она выглядела так мило, когда говорила это, стоя и улыбаясь посреди комнаты, дверной проем образовывал раму для нее.
Музыкальное образование в Германии|Эми Фэй
Все его тело слегка вздрогнуло — Боб был мертв.
Эдинбургский журнал Blackwood, № CCCXXXIX. Январь 1844 г. Том. LV.|Разное
Эти эскимосы очень любили запускать воздушных змеев, не считаясь с пользой!
Великан Севера|Р.М. Ballantyne
Над кроватью снова накинули алый ситцевый балдахин, а рядом стояла плетеная люлька на красном каркасе из манзанита.
Опорный кадр: Опорный кадр в H.264. Маленький параметр с большими последствиями