В каком формате необходимо хранить графические файлы: Форматы графических файлов. Растровые форматы TIFF, JPEG, CALS, BMP, PNG, PCX Векторные форматы HP-GL, DWG, DXF

В каком формате должен храниться документв СЭД в DOC, PDF и TIF?

Ришат Мухаметшин 8 июля 2015

Делопроизводителю

Время чтения: 4 минуты

Фактически, DOC и PDF стремятся друг к другу по возможностям, но старая слава по-прежнему заставляет воспринимать первый как что-то непременно изменяемое, а второй — как нечто зафиксированное и неизменное.

Вопрос читателя: В каких случаях документ в системе должен храниться в формате DOC,  PDF и TIF? В чем их разница?

В первую очередь следует понять, для чего эти три формата были созданы. DOC — это потомок обыкновенного текстового документа, унаследовавший возможность быть отредактированным кем угодно в любой момент. В ходе эволюции DOC приобрёл возможность форматирования текста, добавления служебной внутренней информации о документе.

Например, в Word 2012 можно вставлять в тело документа видеоролики и аудиодорожки, что явно продиктовано заменой новыми мультимедийными и чувствительными к прикосновениям планшетами постепенно устаревающей бумаги. Но ударение на редактирование содержимого всё-таки осталось. Именно поэтому чаще всего при открытии документа в этом формате любой редактор покажет курсор и предоставит возможность изменить содержимое.

PDF — очень сильный формат, имеющий несколько важных принципиальных отличий от формата DOC.

Возможность внедрения шрифтов непосредственно в документ гарантирует одинаковое отображение документа на любом устройстве и на бумаге при печати на любом принтере. Изначально формат не был предназначен для редактирования, однако сейчас многие программные средства для работы с PDF позволяют редактировать документы в этом формате, если таковые не зашифрованы, и неизменность содержимого уже не является особенностью формата. Такой документ также может содержать мультимедийный контент, который не может быть напечатан, но может быть просмотрен на любом компьютере, планшете или смартфоне.

Фактически, DOC и PDF стремятся друг к другу по возможностям, но старая слава по-прежнему заставляет воспринимать первый как что-то непременно изменяемое, а второй — как нечто зафиксированное и неизменное.

TIF стоит отдельно и представляет собой формат хранения изображений, что накладывает на него несколько ограничений. Согласно определению, он содержит только изображение и не содержит текста, а поскольку текста нет, он не может быть проиндексирован, и по содержимому такого документа нельзя выполнить поиск. Многие графические редакторы позволяют изменять содержимое таких документов, но редактированию подвергается именно изображение. Мультимедийное и виртуальное содержимое (то, которое невозможно напечатать) TIF не поддерживает, его возможности ограничиваются разбиением документа на несколько страниц и добавлением служебной информации.

Современное применение и возможности формата TIF сильно пересекаются и всё больше становятся подмножеством формата PDF.

TIF предназначен для хранения исключительно изображений — PDF может хранить изображения, а ещё позволяет строить оглавление, вставлять закладки и наносить текст и мультимедийные метки поверх этих изображений. TIF имеет возможность добавления метаданных — у PDF этот механизм развит лучше (например, древовидное оглавление — тоже метаданные). TIF может сжимать изображения для экономии пространства хранилища — PDF тоже это может. Для просмотра TIF во всех операционных системах есть предустановленные средства, для PDF до сих пор требовалось устанавливать дополнительное ПО, но в Windows 8 приложение для просмотра документов в этом формате уже встроено.

Очевидно, для создания и хранения исходных текстов документов логично и целесообразно использовать предназначенный для этого DOC. Минус, состоящий в доступном изменении содержимого, становится плюсом при внедрении СЭД, позволяющей учитывать изменения, их авторство и смену этапов жизненного цикла документа.

Для сканов же печатных документов — и входящих, и исходящих — логично и целесообразно использовать PDF, учитывая его возможности рецензирования, индексации и одинакового представления на разных устройствах вывода и практически полное перекрытие возможностей формата TIF.

Формат TIF, несмотря на популярность на протяжении уже более двадцати лет, сдаёт позиции, с одной стороны, более мощному, а с другой стороны, стандартизированному и потому гарантирующему совместимость на годы вперёд формату PDF. И всё-таки, победитель в этом бою ещё не определён.

Источник: Журнал «Современные технологии делопроизводства и документооборота»

Чтобы прочитать эту статью до конца,
авторизуйтесь или зарегистрируйтесь

управление контентом электронный документ электронный архив

Введение.

Обработка мультимедийной информации 9 класс онлайн-подготовка на Ростелеком Лицей

Тема: Средства и технологии в создании и обработке мультимедийной информации

Урок: Введение. Обработка мультимедийной информации

 

1. Введение

В различных словарях и справочниках можно найти разные определения понятия мультимедиа. Например, в Издательском словаре дается следующее определение:

2. Мультимедиа и мультимедийные компьютеры

Мультимедиа – это совокупность всех видов информации (графической, звуковой, видео).

В словаре по естественным наукам (сетевую версию словаря можно найти на сайте (Источник) представлено следующее определение:

Мультимедиа – совокупность компьютерных технологий, одновременно использующих несколько информационных сред: графику, текст, видео, фотографию, анимацию, звуковые эффекты, высококачественное звуковое сопровождение.

В данных определениях нет противоречий: под мультимедиа понимают и совокупность различных видов представления информации, и технологию обработки такой информации. Основу технологий составляют аппаратные и программные части, то есть существуют специальные программные средства для обработки мультимедийной информации (графические редакторы, звуковые редакторы, видеоредакторы). Об аппаратной части мы уже говорили, когда рассматривали различные устройства современного компьютера. Существует такое понятие, как мультимедийный компьютер (рис. 1).

Рис. 1. Мультимедийный компьютер

Что представляет собой мультимедийный компьютер?

Такой компьютер должен иметь достаточно большой объем оперативной памяти (рис. 2) для хранения мультимедийной информации.

Рис. 2

Рис. 3

Он должен иметь мощную видеокарту (рис. 3) не только для того, чтобы отображать на экране монитора картинку с хорошим разрешением, но и для того, чтобы поддержать работу видеоредактора.

Также мультимедийный компьютер должен иметь звуковую карту (рис. 4), акустическую систему (рис. 5), наушники и микрофон (рис. 6).

Рис. 4

Рис. 5

Рис. 6

Кроме этого, компьютер должен иметь DVD/CD-дисковод (рис. 7).

Рис. 7

Мультимедийную информацию активно используют для обучения. Интерактивные тексты, видео, звуковая учебная информация активно используется для дистанционного обучения через Интернет.

3. Модели представления графических изображений

Модели представления графических изображений

Чтобы изображение можно было хранить на компьютере, обрабатывать и передавать, оно должно быть представлено в цифровом виде. Для представления графической информации в цифровом виде были предложены две модели графических изображений. Одна из моделей называется точечной (растровой), а вторая модель – векторной (объектной).

4. Точечная (растровая) модель представления графических изображений

В точечной модели изображение – это совокупность пикселов (одинаковых по размеру и форме мельчайших элементов изображения), расположенных в виде матрицы (таблицы).

Пиксел – аббревиатура двух английских слов: picture element (элемент изображения).

Пикселы обладают следующими важными свойствами: однородность (все пикселы имеют одинаковую форму) и неделимость (пиксел – мельчайший элемент). Каждый пиксел вносит свой вклад в формирование изображения. Иногда точечное изображение называют растровым.

Растр (от нем. raster) – это решетка (сетка), которая разбивает изображение на отдельные элементы.

Представление точечного изображения – это совокупность сведений о цвете всех пикселов, которые составляют данное изображение. Хранить информацию о цвете точки можно при помощи разного количества бит информации. Например, при помощи 1 бита мы можем хранить только 2 цвета – белый и черный (0 и 1).

Глубина цвета – величина, определяющая количество информации о цвете точки изображения.

Если на глубину записи отводится 1 байт (8 битов), то доступно будет 28=256 цветов.

Разрешение (resolution) – количество пикселов (pixels) или точек (dots) на дюйм (inch) изображения. Оно измеряется в ppi (pixels per inch) или dpi (dots per inch).

Различают разрешение оригинала (то разрешение, с которым изображение сканировали, фотографировали, создавали с помощью графического редактора), а также разрешение изображения на экране монитора и разрешение напечатанного изображения.

Разрешение экрана монитора может быть различным, его можно выбрать в настройках разрешения экрана ОС.

Примеры разрешения мониторов:

  • 800х600;
  • 1024х768;
  • 1280х1024;
  • 1600х1200;
  • 1920х1080.

Чем больше разрешение экрана, тем лучше изображение.

Разрешение печатного изображения – это количество отдельных точек, которые могут быть напечатаны на участке единичной длины.

Разрешение печатного изображения также измеряется в ppi и dpi. Для получения относительно качественного изображения необходимо хотя бы 72 dpi, а для получения действительно качественного – не меньше 300 dpi.

Точечная модель представления графического изображения появилась не случайно. Это модель известных художественных техник (например, мозаики, вышивки). Когда мы смотрим на изображение, выполненное в стиле мозаики, мы видим сплошное изображение, и только при приближении можно увидеть, как оно распадается на отдельные точки. Аналогично, при приближении к глазам вышивки, мы видим, что изображение распадается на отдельные крестики, бисеринки. Каждый такой элемент (камешек, крестик) вносит свой вклад подобно тому, как пиксел вносит свой в формирование графического изображения. Фотографии, репродукции полотен, иллюстрации чаще всего представляются с помощью точечной (растровой) модели представления изображений.

5. Векторная (объектная) модель представления графических изображений

Еще одна модель представления цифрового изображения – векторная модель. В векторной модели изображение – это совокупность разнообразных сложных геометрических объектов, состоящих из простейших фигур (круги, эллипсы, прямоугольники, многоугольники, отрезки прямых, дуги кривых линий). Такие фигуры называют также графическими примитивами.

С векторными изображениями мы встречались на уроках алгебры, когда рисовали графики функций, геометрии, черчения. С помощью векторной модели очень легко представить изображения, которые являются схемами, чертежами, рисунками, то есть там, где не важна фотореалистичность.

Для того чтобы сохранить информацию об изображении в векторной модели, достаточно записать математические формулы, которые помогут воссоздать линию, круг, дугу. Например, для того чтобы записать информацию о круге, мы должны записать координаты центра и радиус.

6. Достоинства и недостатки моделей представления графических изображений

Каждая из моделей имеет свои достоинства и недостатки. Сравним эти модели. Точечная модель требует больших объемов памяти для хранения изображения, потому что необходимо хранить информацию о каждой точке изображения. Размер графического файла равен произведению площади изображения на разрешение и на глубину цвета. В векторной модели хранится только важнейшая информация о графических примитивах, поэтому файл с векторными изображениями меньше по объему, чем с растровыми.

Изображения, представленные векторной моделью, не теряют своего качества при изменении их размеров или при другой трансформации (рис. 9), а растровые изображения ухудшаются (рис. 8). При увеличении масштабов изображения между пикселами возникает пустое пространство, которое заполняется копиями существующих пикселов, из-за этого изображение «размывается» (рис.8). Нам кажется, что размер пиксела увеличивается за счет того, что вокруг существуют его копии.

Рис. 8

Рис. 9

Для обработки точечных и векторных изображений существуют специализированные графические редакторы. Для обработки точечных изображений можно использовать графические редакторы Adobe Photoshop (рис. 10), Gimp и другие редакторы.

Рис. 10. Окно графического редактора Adobe Photoshop

Для обработки векторных изображений можно использовать графические редакторы CorelDRAW (рис. 11), Adobe Illustrator и другие редакторы.

Рис. 11. Окно графического редактора CorelDRAW

С появлением новых версий редакторов их стараются выполнять многофункциональными (позволяют импортировать и работать как с векторными, так и с растровыми графическими изображениями).

Рендеринг – преобразование векторного изображения в точечное.

7. Формат графических файлов

Формат файла – это описание (спецификация) того, что именно, где и в каком виде должно быть представлено в файле.

Существует более 20 различных форматов графических файлов. Примеры форматов графических файлов:

  • BMP;
  • JPEG;
  • GIF;
  • TIFF;
  • CDR;
  • PCX;
  • WMF.

8. Сжатие информации

Каждый такой формат несет в себе информацию о файле и о способе сжатия графической информации. Мы уже говорили, что графические файлы могут занимать большие объемы памяти. Разработаны способы сжатия информации, которые и хранятся в формате файла.

Сжатие может происходить двумя способами: с потерями информации (необратимое) и без потери информации (обратимое, основано на удалении избыточности исходного представления информации, то есть на применении более экономного кодирования).

Рассмотрим такой пример:

Пусть исходная информация представлена следующим образом: ААА БББ ВВВВ АААААА. Тогда более экономным представлением этой информации будет: А3 Б3 В4 А6 (числа указывают на количество повторений буквы).

Алгоритм такого сжатия очень прост: мы заменяем повторы символов указанием их количества. Восстанавливается такая информация после сжатия достаточно легко. Такое сжатие является сжатием без потерь. Данный способ сжатия будет работать хорошо, например, в изображениях с областями одного цвета (темный или белый фон).

9. Заключение

Итак, на данном уроке мы рассмотрели модели представления графических изображений, рассмотрели их достоинства и недостатки, форматы графических файлов, способы сжатия информации при представлении графического изображения.

В дальнейшем мы рассмотрим подробнее средства, которые позволяют обрабатывать графическую информацию, а именно графические редакторы и приемы работы в них.

 

Список литературы

  1. Угринович Н.Д. Информатика-9. – М.: БИНОМ. Лаборатория знаний, 2012.
  2. Гейн А.Г., Юнерман Н.А. Информатика-9. – М.: Просвещение, 2012.
  3. Соловьёва Л.Ф. Информатика и ИКТ. Учебник для 9 класса. – СПб.: БХВ-Петербург, 2007.

 

Дополнительные рекомендованные ссылки на ресурсы сети Интернет

  1. Project68.narod.ru (Источник).
  2. Esate.ru (Источник).
  3. Bgtu-ief.com (Источник).

 

Домашнее задание

  1. Что такое мультимедиа?
  2. Какие модели представления графических изображений вы знаете?
  3. В чем достоинства и недостатки моделей представления графических изображений?
  4. Какие форматы графических файлов вы знаете?

http://bgtu-ief. com

4.1.2 Форматы изображений и хранение

4.1.2 Форматы изображений и хранение

4.1.2 Форматы изображений и хранение

ТИФ и форматы BMP

TIF (формат изображения с тегами) или BMP (битовые карты) форматы просты: все будет сохранено в полной мере количество.
Каждый пиксель сохраняется с полной информацией для яркости и 16 миллионов цветов
Требует много места в памяти, поэтому идеально не подходит для HTML и не может быть включен напрямую
Однако это предпочтительный формат для хранения оригиналы. Затем вы оптимизируете копию файла оригинал и сохранить его в сжатом формате, совместимом с HTML.

JPEG Формат

Формат JPEG сжимает данные изображения с помощью алгоритма дискретного косинусного преобразования (похожего на преобразования Фурье и др.).
Алгоритм сжатия достаточно хорош; это также сохраняет максимальную информацию о цвете (то есть палитру из 16,7 миллионов цветов). Большая часть графики программы предлагают возможность выбора коэффициента сжатия.
С Paint Shop Pro вы можете выбрать степень сжатия фактор, активировав опции в « сохранения как » («Speichern als») меню.
Высокий коэффициент сжатия приводит к небольшому размеру файла с очень низкое качество и наоборот: низкий коэффициент сжатия приведет к большой файл с очень высоким качеством. Просто взгляните на примеры по ссылке или в тесте картинка ниже.
Формат JPEG является распространенным форматом для представления отсканированные фотографии или изображения с очень тонкими цветовыми градиентами на сайте www. JPEG не дает возможности объявить прозрачным задний план.
 

Гифка формат

GIF Формат был разработан CompuServe специально для использования в сети. GIF сжимает размер изображения за счет уменьшения палитры до 256 цветов. Это снижает битность изображения до 1 / 10 до 1 / 30 по сравнению с обычным файлом BMP без заметного потери. Формат GIF предлагает несколько вариантов включения изображения в веб-страница:
Прозрачный фон: Один из не более чем 256 цветов изображение может быть объявлено «прозрачным»; затем он будет заменен цветом фона страницы.
Чересстрочная презентация: Изображение будет представлено последовательно (слой за слоем), при этом каждый слой показывает более подробную информацию
Анимации: Несколько изображений GIF могут быть подключены к анимация ; то есть короткий «комикс полоса».
GIF лучше всего использовать для кнопок, клипарты и другие изображения только с несколькими цветами или цветовыми оттенками, а также особенно для рисунков или текстов, представленных в виде изображений, но не для высоких фото в разрешении.
 

PNG формат

PNG формат (портативная сетевая графика) сочетает в себе преимущества JPEG и Форматы GIF:
Сжатие без заметных потерь
16,7 миллионов цветов
Прозрачный фон и чересстрочная развертка
Однако не позволяет выбрать коэффициент сжатия
Вот пример различных способов сильный образ. Он содержит фотографию, четкие линии, много цветов и непрерывный переход цвета. В исходном формате TIF требуется 152 КБ
Обратите внимание, что JPEG требуется наименьшее количество места для хранения, но есть проблемы с четкими линиями на чистом фоне. фотография, тем не менее, по-прежнему выглядит довольно хорошо даже при высоком сжатии.
Вы можете увидеть различия больше произносится, если вы сравниваете изображения, экспортируя их в Paint Shop Pro и увеличивая их.
 
Формат
Формат JPEG с коэффициент сжатия 1 («Оригинал»)
Размер хранилища 58 КБ .
Формат JPEG с коэффициентом сжатия 25
Размер хранилища 15 КБ .
Формат JPEG с коэффициент сжатия 50
Размер хранилища 10 КБ .
Формат JPEG с коэффициентом сжатия 75
Размер хранилища 7 КБ .

Формат GIF. Место хранения Размер 43 КБ PNG. Размер хранилища 79 КБ

Как компьютеры хранят изображения.

Изображения являются источником почти… | Грег

Изображения являются источником почти всех носителей. Поэтому я думаю, что интересно взглянуть на то, как изображения хранятся на компьютере. Я решил провести экскурсию по самому известному формату изображений: jpg (или «jpeg», как вам больше нравится).

  1. Основы
  2. Формат JPEG
  3. Алгоритм сжатия JPEG

Значения изображения

Прежде чем углубиться в jpeg, давайте сначала разберемся, как хранятся значения изображения. Изображение представляет собой набор пикселей; пиксель — это наименьшая единица, из которой состоит наше изображение.

Каждый пиксель содержит:

  • Значение красного
  • Значение синего
  • Значение зеленого

Значение каждого цвета находится в диапазоне от 0 до 255 (в терминах интенсивности).

Почему не более 255?

Поскольку в одном байте (8 бит) может храниться от 0 до 255 значений, а также потому, что человеческий глаз не может увидеть больше деталей при больших значениях (большинству людей достаточно 255). Поэтому 256 значений для каждого цвета не только удобны, но и работают.

Рисунок 1: Пример значений пикселей

Изображение представлено двумерным массивом.

Каждая ячейка массива состоит из 3 значений для интенсивности красного, интенсивности зеленого и интенсивности синего.

Комбинация этих трех основных цветов позволяет создать любой цвет в одной ячейке.

Улучшенный способ хранения цветов: YCrCb

Модель RGB хороша тем, что близка к аппаратной; большинство экранов (в зависимости от технологии) имеют 3 разных светодиода RGB для каждого пикселя.

Однако в модели RGB светимость (яркость пикселя) и цвета смешиваются.

Рисунок 2. Иллюстрация перехода от модели RGB к модели YCrCb

Существует еще один способ хранения информации о цветах и ​​яркости изображения — модель YCbCr.

В этой модели яркость сохраняется в компоненте «Y», а цвета — в компонентах «Cb» и «Cr».

Поскольку человеческий глаз гораздо более чувствителен к яркости, чем к цветам, теперь можно применить более сильное сжатие только к цветам (Cb и Cr).

Формула для получения значений Y, Cb, Cr из RGB следующая (при условии, что значения находятся в диапазоне от 0 до 255):

Y = (77/256)R + (150/256)G + (29/ 256)B

Cb = -(44/256)R — (87/256)G + (131/256)B + 128

Cr = (131/256)R — (110/256)G — (21 /256)B + 128

Важно понимать, что jpeg можно рассматривать как две разные вещи:

  • Файловый контейнер, также известный как JFIF («формат обмена файлами JPEG»). Это контейнер данных изображения (то есть потоков байтов) и метаданных. Поэтому расширение файла «.jpg» или «.jpeg» полезно, поскольку оно информирует компьютер о том, что файл соответствует файловой организации JFIF.
  • Алгоритм, используемый для сжатия и/или распаковки данных изображения, содержащихся в контейнере JPEG
Рис. 3. Упрощенное представление файла JFIF («.jpeg» или «.jpg») cat.jpeg» на рабочем столе моего компьютера он делает следующее (упрощенная версия):

  • Моя операционная система открывает свой визуализатор изображений по умолчанию
  • Программное обеспечение визуализатора изображений по умолчанию знает путь к файлу «cat. jpeg»
  • По умолчанию визуализатор изображений использует системные вызовы (например, «filp_open») для загрузки этого изображения в ОЗУ (если файл действителен и разрешения предоставлены).
  • Теперь файл JFIF загружен и доступен в оперативной памяти.
  • Программа визуализатора изображений по умолчанию знает, как декодировать поток байтов сжатых данных jpeg, она может считывать значения изображения и отображать изображение на экране компьютера!

Данные файла JFIF могут быть представлены в виде длинной шестнадцатеричной «строки».

Рисунок 4: Структура файла JFIF (Википедия)

В этом потоке несколько маркеров расположены для определения различных полей файла.

Каждый маркер начинается с «FF», за которым следует определенный номер, например «E0», указывающий тип маркера.

Как видно из изображения выше, «настоящие» данные изображения начинаются сразу после маркера «FF DA» в конце файла.

Теперь попробуем разобраться в самом интересном: в алгоритме JPEG. Этот алгоритм генерирует сжатые данные изображения, которые будут храниться в файле JFIF. Это не самая простая часть, целью этой статьи будет понять, что делает алгоритм в общих чертах.

Рисунок 5 : Шаги сжатия JPEG

Ниже приведены различные шаги, предпринимаемые для сжатия/распаковки изображения с использованием алгоритма JPEG.

Давайте разберем эти 5 шагов один за другим 😀

Преобразование цвета

Во-первых, изображение необходимо преобразовать в формат YCbCr. Для этого компьютер может использовать приведенную выше формулу преобразования RGB в YCbCr.

Понижающая дискретизация (или субдискретизация цветности)

Теперь, когда наше изображение находится в формате YCbCr, мы можем сжать цвет, чтобы уменьшить размер. Этот шаг также называется субдискретизацией цветности.

Для субдискретизации цветности мы будем рассматривать каждый блок изображения размером 2×4 пикселя.

Когда у нас будут эти 2 строки, мы будем использовать 3 параметра, чтобы указать, какой тип сжатия нам нужен.

Рисунок 6: Примеры субдискретизации цветности

p1:p2:p3

p1 означает: «сколько различных значений Y мы храним в каждой строке?»

p2 означает: «сколько различных значений ячеек CbCr мы сохраняем в первой строке?»

p3 означает: «сколько различных значений ячеек CbCr мы сохраняем во второй строке?»

Ячейки, из которых были удалены значения CbCr, примут значения соседней ячейки.

Как вы понимаете, формат 4:1:1 является наиболее сжатым, а формат 4:4:4 вообще не сжимается.

DCT 😱 😱😱 (не бойтесь)

DCT означает дискретное косинусное преобразование и лежит в основе сжатия JPEG. Есть несколько способов объяснить / понять DCT.

Поэтому я попытаюсь объяснить это по-своему, сосредоточившись больше на общей концепции, чем на математике.

Для упрощения примеров я буду использовать только «черно-белое» (оттенки серого) изображение (процесс такой же для цветных изображений, но он просто повторяется несколько раз для разных компонентов). Следовательно, каждый пиксель нашего изображения имеет только одно значение (от 0 до 255).

Рисунок 7: От исходного изображения к блокам 8×8

Прежде всего, все изображение разделено на блоки 8×8 (которые будут обрабатываться отдельно).

Для каждого блока 8×8 мы хотим уменьшить количество информации без потери качества.

DCT позволяет нам сократить объем информации для каждого блока, не будучи слишком заметным для человеческого глаза, позвольте мне объяснить вам, как это сделать.

Давайте представим, что это один из блоков 8×8 (мы назовем его B):

Рисунок 8: Каждое значение от 0 до 255 представляет пиксель с разной интенсивностью серого

Мы можем записать эту матрицу как линейную комбинацию (сумму с разными коэффициентами) матриц 8×8, в которых есть только «1» (но с другим значением). позицию для каждой новой матрицы).

Рисунок 9: Выражение блока изображения 8×8 с различными «тупыми» матрицами (также называемыми каноническим базисом)

Как видите, мы использовали 64 различных матрицы для определения блока изображения 8×8 благодаря коэффициенту перед каждой матрицей.

Другими словами, мы можем сгенерировать каждый блок 8×8 любого изображения с этими 64 различными матрицами. Нам нужно будет только изменить коэффициенты перед каждой матрицей.

64 различные матрицы канонического базиса можно рассматривать как функции.

Рисунок 10: Каждая из 64 различных матриц канонического базиса является функцией

Идея сжатия DCT JPEG состоит в том, чтобы изменить выражение B (изменить используемую математическую «основу»).

Мы по-прежнему будем выражать B линейной комбинацией, но с другим базисом (из 64 матриц). Коэффициент каждой матрицы также изменится.

Рисунок 11: 64 различных DCT-матрицы 8×8 (с цветами вместо чисел 0–255)

Как вы можете видеть на исходном примере блока изображения 8×8, значения пикселей не слишком далеко от одной ячейки к другой. Это, как правило, верно для большинства изображений.

Вот почему выражение блока 8×8 с помощью функций косинуса (в терминах частот) полезно, так как некоторые из 64 матриц более важны для определения блока изображения 8×8, чем другие.

Рисунок 12: Одна из 64 новых функций, которые мы будем использовать для выражения B (исходный блок изображения 8×8)

Таким образом, B будет равен чему-то вроде этого:

Рисунок 13: B, выраженный в частотах вместо отдельных пикселей

Вы можете задать вопрос:

как я получил коэффициенты DCT на приведенном выше рисунке? 🤔

Ответ получен благодаря формуле DCT 😜

Рисунок 14. Изменение базиса DCT

Формула DCT позволяет вычислить коэффициент DCT в позиции u, v, поскольку она знает каждое значение исходного блока изображения 8×8. линейная комбинация (которая на этом рисунке является функцией, называемой «f»).

Вот формула DCT, которая вычисляет коэффициент DCT в позиции (i,j) матрицы коэффициентов DCT.

Рисунок 15: Формула DCT

Следовательно, для нашего примера мы получим:

Рисунок 16: Сравнение двух базовых коэффициентов

В нашей новой основе «DCT», поскольку блок изображения 8×8 теперь определяется частотами, а не попиксельно, отбрасывание некоторых «высокочастотных» компонентов будет не слишком заметно.

Действительно, если вы посмотрите на приведенный выше блок коэффициентов DCT, то ясно увидите, что первый компонент «235,6» является одним из наиболее важных значений.

Рисунок 17: «Низкочастотные» компоненты гораздо важнее для определения «глобально» большинства блоков изображения 8×8

Квантование

Теперь, когда у нас есть матрица коэффициентов DCT исходного блока 8×8, мы можем сжать изображение. На данный момент мы не потеряли никакой информации с DCT; мы все еще можем обратить его благодаря «обратному DCT», чтобы получить точные исходные значения блока пикселей 8×8.

Для сжатия изображения воспользуемся «таблицей квантования».

Рисунок 18: Пример таблицы квантования

Таблица квантования представляет собой матрицу 8×8, которая определяет уровень сжатия изображения

Мы разделим каждый номер коэффициента DCT на соответствующее число в таблице квантования. Каждый результат должен быть целым числом (таким образом, при необходимости его следует округлить).

После этой операции мы потеряем некоторое количество информации (все числа округлены до 0). Здесь происходит сжатие, и оно необратимо. Вот почему JPEG — это алгоритм сжатия с потерями: некоторые данные теряются навсегда.

Как видно из этой таблицы квантования, значения в нижнем правом углу высокие. Это означает, что большинство коэффициентов DCT в этой зоне будут разбиты (маленькие числа делятся на большие числа). Эту таблицу квантования можно перевести как «Большинство блоков изображения 8×8 будут иметь небольшие коэффициенты DCT в правом нижнем углу. Таким образом, мы постараемся избавиться от этих коэффициентов».

Рисунок 19: Операция, при которой информация теряется (сжимается) в блоке изображения 8×8

Как вы можете видеть после применения таблицы квантования к нашей матрице коэффициентов DCT, у нас осталось лишь небольшое количество коэффициентов. Эти коэффициенты расположены в верхнем левом углу (выражая низкочастотные вариации).

Используемая таблица квантования не уникальна и может зависеть от используемого программного обеспечения. В Photoshop или Gimp вы можете выбрать значения качества (от 0 до 100 или просто выбор между низким, средним и высоким). Этот выбор изменяет значения таблицы квантования.

Меньшие числа в таблице квантования означают лучшее качество. Наоборот высокие цифры в таблице квантования означают более низкое качество (но и меньший размер файла!).

Используемая таблица квантования сохраняется в файле JFIF. Это важно, так как это необходимо для распаковки изображения.

Кодирование сжатого изображения

Различные наборы сжатых блоков коэффициентов DCT 8×8 представляют данные изображения. Он должен быть сохранен в файле JFIF (с таблицей квантования).

Различные сжатые блоки коэффициентов DCT 8×8 сохраняются благодаря кодированию Хаффмана.

Это сэкономит больше места. Я не буду объяснять кодировку Хаффмана, так как она не является предметом этой статьи и мало что добавит к пониманию принципов сжатия JPEG.

Если вы хотите узнать больше об этом, не стесняйтесь щелкнуть здесь

Все данные, необходимые для распаковки изображения, сохраняются в файле JFIF (таблицы квантования, таблицы Хаффмана, …).

DCT можно инвертировать. Таким образом, любое программное обеспечение для просмотра/редактирования jpeg может открыть изображение.

После реконструкции изображение будет немного отличаться из-за операции одностороннего квантования, выполненной ранее во время сжатия (установка некоторых коэффициентов DCT на 0). Поэтому JPEG снижает качество изображения, но позволяет сэкономить драгоценное место на наших дисках 😁😁😁

Надеюсь, вам понравилась эта (может быть, слишком длинная?) история. Если это так, не стесняйтесь хлопать и подписываться на меня в Твиттере 😁

— — — — — — — — — — — — — — — — — — — — — — —

Ссылки

JPEG ‘files’ & Color (JPEG Pt1)- Computerphile

Формат обмена файлами JPEG

Codage JPEG et DCT

JPEG — Wikipedia

Системы сжатия изображений JPEG

Сжатие изображений и дискретное косинусное преобразование

Основы DCT, квантования и энтропийного кодирования

Изображения

Я создал различные иллюстрации, кроме:

Figure 4: https://en.

В каком формате необходимо хранить графические файлы: Форматы графических файлов. Растровые форматы TIFF, JPEG, CALS, BMP, PNG, PCX Векторные форматы HP-GL, DWG, DXF

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Пролистать наверх