Как мы с DALL-E 2 делали картинки к статьям / Хабр
DALL-E 2 — нейросеть, которая рисует картинки по текстовому запросу. Гулявшие в этом году примеры работы с ней просто поражают: иногда она рисует, как настоящий художник, и еще и предлагает варианты на выбор! С августа этого года мы периодически использовали DALL-E 2, чтобы генерировать заглавные картинки к статьям «Хакера», и сегодня я покажу, как это было.
«Хакер» — легендарный журнал об информационной безопасности. Оформив подписку на Xakep.ru, ты сможешь скачать любой вышедший номер в виде PDF и получишь доступ к огромной базе материалов о пентестинге, защите данных и компьютерных трюках. Каждая подписка помогает поддержать команду авторов и редакторов.
Проблема иллюстраций к статьям у нас стоит давно: изображения с фотостоков обычно скучные, а по теме информационной безопасности вообще тоска смертная — бесконечные хакеры в капюшонах и летающие полупрозрачные буквы. Нанимать иллюстратора, который выдавал бы по картинке в день, — слишком накладно. В итоге выкручиваемся как можем.
Мысль генерировать картинки при помощи нейросети меня сразу же захватила: это быстро, можно (в теории!) изобразить именно то, что хотел, а если результат будет несовершенным, то пускай это будет фирменной фичей, этаким признаком того, что мы тут уже живем в будущем.
Как только я увидел картинки, сгенерированные нейросетью DALL-E 2, я открыл рабочий чат и объявил, что нам срочно нужна эта штука. В июле доступ раздали миллиону ждущих в очереди, и одному из наших сотрудников повезло (спасибо ему огромное, что поделился доступом!).
С того момента я два месяца упражнялся в создании картинок при помощи нейросети и снабжал ими статьи «Хакера». Перебор вариантов стал в редакции регулярным увеселением, которым я хочу поделиться и с читателями.
Статья: Уроки форензики. Исследуем дампы и ищем следы взлома в системе
Идея: пускай Шерлок Холмс или человек, похожий на него, изучает жесткий диск.
sherlock holmes inspecting a hard drive
Увы, у DALL-E 2 плоховато и с лицами, и с точным изображением устройств. Ничего не подходит.
С реалистичными людьми связываться не хочется, тогда пускай это будет детектив Пикачу!
detective pikachu inspecting a hard drive in a hi-tech room
Ах да, DALL-E 2, скорее всего, ничего не знает про детектива Пикачу, потому что не видела коммерческих картинок с рекламой фильма. Зато видела мягкие игрушки Пикачу, поэтому у нас есть мягкая игрушка, но без шапки Шерлока. В любом случае на всех картинках он делает что-то странное. На расследование не тянет.
Возвращаемся к идее с Шерлоком, но попробуем сделать его мультяшным.
cartoon sherlock holmes inspecting a hard drive in a tech room
Последний вроде бы симпатичный, но превратить это в горизонтальную картинку будет сложно. Остальные держат очень странные предметы.
А что, если сделать фото, но из старой газеты? Это поможет скрыть недостатки, да и детектив будет более узнаваемым.
old newspaper photo of sherlock holmes inspecting a hard drive
Последнего берем! Разве что бровь странноватая, но идеала все равно не добиться.
Мучения
Говорят, чтобы нарисовать приличную картинку при помощи DALL-E 2, нужно сделать в среднем 30–50 запросов, а если требуется что-то действительно выдающееся, то счет может пойти на сотни. Мы обычно ограничивались двумя-тремя запросами, хотя в некоторых случаях поиски растягивались до пяти-восьми. Главное — вовремя отказаться от слишком смелой идеи.
Статья: Сканим на Python. Как написать и улучшить собственный сканер портов
Идея: сканер, сканер… Первая ассоциация — сканер штрих-кодов на кассе. А кассира для смеха попробуем сделать змеей в парике.
cashier is a snake in a wig holding a barcode scanner in its tail
Что просил, то, в целом, и получил. Кажется, идея слишком сложная, поэтому сделаем попрямолинейнее. Пусть питон будет инспектировать сервер. Скажем, держать в хвосте увеличительное стекло.
digital art of a python with a magnifying glass in its tail in a server room inspecting a server
Рука-хвост — ого-го! Все остальное тоже не годится. Попробуем сделать питона мультяшным.
cartoon illustration of a python inspecting a server with a lens in a server room
Стиль неплох, но очень уж рукастые питоны! Попробуем снова уточнить про хвост.
cartoon illustration of a python with a magnifying glass in its tail in a server room inspecting a server
Кажется, руки неизбежны. Что ж, возьмем первого. В конце концов, для мультфильма питон с рукой — это почти нормально.
Статья: Время паять! Подбираем инструменты и осваиваем искусство пайки
Идея: нужно нарисовать паяльник. Пускай вздымается в небо в лучах солнца.
soldering iron shining brightly in a ray of light against the sky
Это… не паяльники. Пробую еще раз, заменив солнце звездным небом и добавив «реализм» и «высокое качество».
high quality realistic soldering iron shining brightly in the night sky
Вышли какие-то космические корабли. И у пришельцев явно дурные намерения.
Пробую сделать «картину» и добавить руку и печатную плату в качестве фона.
realistic painting of a hand with a soldering iron soldering a computer chip to a pcb
А вот это почти хорошо! Берем третий, несмотря на то что человек тычет жалом куда-то в процессор.
Статья: Винда на айфоне. Используем виртуалку UTM для установки Windows на iOS
Идея: первая мысль очень прямолинейная — попросим нарисовать айфон с Windows на экране и посмотрим, что выйдет.
phone on the table with microsoft windows on screen
Да, это определенно какие-то айфоны. Но дизайнил их не Джонни Айв. Да и винды нету.
Пробую тогда попросить знаменитый зеленый холм из Windows XP.
iphone laying on the table with windows xp green hill on screen
Зеленый экран есть! Зеленого холма нет.
Пожалуй, заставлять DALL-E рисовать реалистичную технику просто бесполезно. Попробуем вместо этого что-нибудь абстрактное. Намекнем на вложенность операционных систем, а чтобы было красиво, сделаем в стиле Сальвадора Дали.
screens within screens endless loops in style of salvador dali
Тут я усвоил важный урок: если попросить у DALL-E безумную чертовщину, то все получится! Я взял третью картинку из-за того, что она немного напоминает логотип программы UTM, о которой идет речь в статье.
Удачи
Хорошо придуманный запрос, немного везения, и DALL-E способна выдать картинку не хуже, чем с фотостока, а иногда и лучше.
Статья: Микроконтроллер не нужен! Делаем радиоприемник на копеечном китайском чипе
Идея: почему-то сразу вспомнился старый мем про троллейбус из буханки хлеба. DALL-E к бою!
stock photo of a radio made out of a loaf of bread
Все картинки мне очень нравятся, выбираю первую. Радио в наушниках — немного странно, но будем считать, что у него просто такая ручка.
Статья: Privesc as a Service. Повышаем привилегии через Active Directory Certification Services
Идея: статья у нас про поддельные сертификаты. Подделку изобразить сложно, поэтому пускай горят, это всегда хорошо выглядит!
Начнем с совсем краткого запроса, посмотрим, что выйдет:
burning diplomas
Вышло не очень — фотореализм не удался. Наугад пробую добавить «medievel painting» — «средневековая картина».
Отлично! Все хороши, берем второй.
Статья: Мастерская хакера. 13 утилит для Linux, которые пригодятся админу
Идея: сделаем крутого пингвина, который едет на гоночной машине. В стиле ретровейв для дополнительной крутости.
a penguin in cool looking shades driving a ferrari f40 convertible in miami neonwave illustration
У предпоследнего потрясающая носовая фигура, но последний почти идеален. Только руль не задался и второе сиденье — с пингвиньим клювом. Но его будет легко замазать в редакторе.
Вдохновившись, запрашиваю еще таких же пингвинов, убрав точную марку машины — DALL-E все равно в них плохо разбирается.
a penguin in cool looking shades driving a ferrari convertible in miami neonwave
Три результата похуже, но последний просто отличный. Только погляди, как пингвин держит лапкой руль!
Статья: Инфильтрация и эксфильтрация. Изучаем методы передачи данных при пентестах
Идея: долго ломаю голову над инфильтрацией и эксфильтрацией и в итоге придумываю кота, который ворует рыбу у рыбака. Делаю для пробы слегка абстрактный запрос. Добавляю слово «картина», чтобы скрыть возможные огрехи.
painting of a cat stealing a fish from a fisherman
Кроме последнего, результаты симпатичные, хотя DALL-E почему-то решила, что и рыбак тоже вполне может быть котом. Берем первого, самого душевного, хотя худи (или скафандр?) из шкуры все же вызывает вопросы.
Статья: Вперед в прошлое! Как выжить в Windows 2000 в 2022 году
Идея: Windows 2000? Это было давно. Пишу: «пещерные люди охотятся на доисторические компьютеры, наскальная живопись». Да простит меня автор!
cave painting of people hunting a laptop
Охоты на ноутбук не происходит, но результаты тем не менее хороши. Мне особенно понравился первый, где кто-то все же несет топор.
Статья: Ядовитые гифки. Как работает уязвимость GIFShell
Идея: гифки у меня ассоциируются с пиксель-артом и с летящей Nyan Cat. И попросим одеть кошку в плащ из кислоты.
nyan cat in a cape of green acidic fluid pixel art
У DALL-E удивительным образом получается почти настоящий пиксель-арт. Да и коты тоже отличные. Мне больше всего понравился первый, но редакционным голосованием выбрали последнего.
Статья: Картошка-0. Повышаем привилегии в AD при помощи RemotePotato0
Идея: вспомнив Мистера Картошку из «Истории игрушек», пытаюсь создать похожего персонажа. Чтобы было совсем как у Pixar, добавим, что нужен высококачественный рендер.
high quality rendering of a happy potato with a face in a room
Класс! Все картошки прекрасны, некоторые хочется сразу же поставить себе на аватарку. Вторая особенно проникновенная. Берем ее!
Статья: Летние исследования для чемпионов Security. Колонка Дениса Макрушина
Идея: чемпион на подиуме с книгой в руках.
a painting of a champion standing on a podium with a book in his hand with dramatic backlight
Повезло с первого раза. Беру третьего, дорисовываю фон, и готово.
Статья: Суровая жаба. Изучаем защиту Excelsior JET для программ на Java
Идея: будем рисовать жабу. Большую сердитую жабу, сидящую в болоте.
big angry toad staring in dramatic light in a swamp
Невероятно, но у нас четыре почти фотореалистичные жабы. Годится любая, я выбрал первую.
Статья: Лето в стиле ретро. Заметки главреда, затерянного в пространстве и времени
Идея: это моя предыдущая колонка — о том, как я все лето угорал по ретрогеймингу и ретрокомпьютингу и разъезжал на мотороллере (тоже довольно винтажном). Его и изобразим в лучах заката.
retrowave summer yamaha scooter trees against sunset cyberspace
Красота какая! Вторая картинка почти идеальна, но придется выправлять или замазывать в редакторе поломанное внизу солнце. Берем четвертую, где кривизна сойдет за стилизацию.
Неудачи
Далеко не все запросы удивляют способностью DALL-E творить шедевры. Я здесь постарался не заниматься черри-пикингом и показать, как работа с нейросетью выглядит в реальности. Обычно мне удавалось в итоге добиться от DALL-E толка, но за два месяца было несколько случаев, когда приходилось оставлять попытки и брать готовую картинку из интернета.
Статья: Уроки форензики. Расследуем заражение машины с Windows шпионским трояном
Идея: шпионские трояны… Что, если попытаться изобразить тест Войта — Кампфа из «Бегущего по лезвию»?
Voight Kampff Test
DALL-E 2 уловила идею, но не до конца. Я в итоге пошел вспоминать, как выглядело приспособление, и взял картинку из фильма.
Другие подобные случаи я опущу, ничего занимательного в них нет.
Хохмы
Открывать DALL-E, придумывать запрос и ждать результата для меня, несмотря на все сложности, стало одной из приятнейших частей работы. Не в последнюю очередь потому, что результаты часто выходят веселыми — настолько, что можно поржать, как говорится, всем офисом.
Статья: Бан Kiwi Farms. Почему Cloudflare отказалась защищать сайт, где собираются тролли и сталкеры
Идея: к владельцам форума Kiwi Farms буквально вломилась бригада SWAT. Попробуем это изобразить! Я давно хотел попросить у DALL-E сделать что-нибудь в стиле комиксов Мебиуса, который считается одним из создателей киберпанка как визуального стиля.
SWAT team seen through the door in style of mobius comic books
Картинки вышли красивые, но, увы, совершенно непонятно, что здесь происходит. Хотелось бы к тому же вид из открытой двери, а не из-за спин. Пробую исправить это.
SWAT team looking at you through the open door in style of mobius comics
Смотрю на результаты круглыми глазами, потом потихоньку начинаю выть. Продолжаю смотреть, и вой постепенно переходит в ор. На второй картинке, кажется, изображена полиция мемов. Скидываю картинки автору статьи — Маше Нефедовой, она проходит через ту же череду эмоций.
Кажется, нужно менять подход. Я уже выяснил, что у DALL-E отлично получаются забавные овощи и фрукты с глазами. Грех этим не воспользоваться. А киви-пираты вообще будут хитом! Пробуем.
a painting of three kiwis with evil faces dressed as pirates dramatic light
На мой взгляд, результат великолепный. Однако Маша, критично оглядев наш с DALL-E шедевр, говорит, что, во-первых, киви на вид так себе, во-вторых, владельцы форума имели в виду птичку, а не плоды. Упс!
Ладно, птица так птица. Нарядим ее в черную худи и посадим за ноутбук.
evil kiwi bird in a black hoodie in front of a laptop
Они все просто прекрасны, и на этот раз Маша не в силах спорить. Второй потрясает нас своей шубой и своим злым «лицом». Но выбираем того, который что-то печатает клювиком.
Правда, Маша к этому моменту уже сама сделала более серьезную иллюстрацию при помощи Midjourney, так что птица отправляется только в соцсети.
Статья: Облака под угрозой. Как пентестить инфру в AWS
Идея: летящий в облаках черный воздушный шар с черепом и костями. Для красоты просим подсветить лучами солнца.
black hot air balloon with skull and bones in the sky with clouds backlit by the sun
Хуже всего получились череп и кости, но это легко исправить. Беру первый, замазываю в редакторе странную полосу слева, накладываю картинку с Веселым Роджером.
Но чтобы получить достаточную ширину по горизонтали, нужно больше неба. Не попробовать ли функцию дорисовывания? Отрезаю кусочек неба и прошу DALL-E дополнить его. Ответ совершенно недвусмысленный!
Однако облака — субстанция очень гибкая, можно редактировать как угодно. Без проблем замазываю безобразие и прилаживаю облака к картинке.
Статья: Фундаментальные основы хакерства. Боремся с дизассемблерами и затрудняем реверс программ
Идея: цикл «Фундаментальные основы хакерства» мы всю дорогу иллюстрировали каким-то стоковым типом в черной худи. Но в честь последнего выпуска, выход которого еще и (почти) совпал с днем рождения Юры Язева, хотелось разнообразия. Что, если вручить хакеру в руки тортик?
photo of a hacker in a black hoodie holding a birthday cake dark background backlit
Почти хорошо! Но в лица лучше не вглядываться, конечно.
Статья: Перехват VK. Как хакеры используют кликджекинг для деанонимизации
Идея: кликджекинг — перехват кликов мышью. Мышей перехватывают кошки, так что попробуем нарисовать кошку, которая ловит компьютерную мышь.
Для начала возьмем мультяшный стиль.
cartoon illustration of a cat holding a computer mouse in its mouth
В целом не так плохо, и коты забавные, но везде разные изъяны. То мышь не видно, то мышь изуродована до неузнаваемости, то коты слишком кривые.
Решаю попробовать попросить подделку под рендер.
high quality octane render of a cat holding a computer mouse in its mouth
Коты страшноватые, и белый фон не годится. Делаю еще один заход и прошу добавить желтый фон.
high quality octane render of a cat holding a computer mouse in its mouth on a yellow background
От души веселюсь, разглядывая результаты. Готового по-прежнему нет, но первому коту хотя бы легко добавить недостающий зрачок. Рисуя, немного умираю внутри от того, какой кот круглый и какие у него пальцы.
Статья: Даня снова с нами! Выясняем у Дани Шеповалова, где он пропадал 20 лет и при чем тут гуси
Идея: нужен Даня, ослик и гуси. Сразу мысли о каких-то старинных картинах. Скиталец едет на осле и ведет за собой стаю гусей. Попробуем стилизовать под средневековую икону.
a man with a goose and a donkey medieval icon high quality
Последняя картинка хороша, но у нашего пророка что-то не то с лицом. Пробую еще раз, подкрепив религиозные мотивы.
a man with a goose and a donkey ancient religious painting
Картинки отличные, однако нимбы, пожалуй, не к месту. Даня, конечно, легенда, но далеко не святой. Выбираем первую. К тому же эти гуси с ногами (руками?) абсолютно невозможные.
Кошмары
Если нужно нарисовать что-нибудь пугающее, нейросети здесь могут оказать неоценимую помощь. Увы, ограничить крипоту очень сложно, и она вылезает тут и там совершенно непроизвольно.
Статья: Атака Базарова. Evil Twin поверх динамической маршрутизации
Идея: изобразим злого двойника. Скажем, человек стоит перед зеркалом, а отражение — его злая версия. С красными глазами и клыками!
illustration of a man in the room looking in the mirror and seeing his angry evil twin with fangs and red eyes
Кошмар! Двойники, может, и ничего, но у нас и оригиналы не очень-то добрые вышли.
Если нам нужны клыки, то пускай в зеркале будет орк. В крови!
a man looking in the mirror and seeing an orc covered in blood
Мне понравилось, что одно из отражений еще и держит в руках зеркало. Может быть, третий вариант чуть лучше других, но в целом все это никуда не годится.
Пробуем слегка другой подход. Пускай человек видит себя демоном из ада.
illustration of a man in the room looking in the mirror and seeing himself as a demon in hell
Первый вроде бы ничего! Но тут я решил дать выбор самому автору статьи. А тот сразу сказал, что вторая картинка из первого запроса идеальна. Попросил добавить на грудь его любимую руну, я, конечно же, добавил.
Позднее, когда мы назначили эту статью темой сентябрьского номера, художник перерисовал для обложки картинку заново. Результат, конечно, совершенно другого уровня.
Статья: Анатомия эльфов 2. Разбираем устройство ELF-файлов в подробностях
Идея: попробуем нарисовать что-то вроде анатомического атласа, но для эльфа и с подписями на эльфийском. Подписи — большой риск, любые буквы DALL-E даются очень плохо.
anatomic picture of an elf
В принципе, неплохо, кроме того, что эльфы не те — слишком сказочные. Попробуем еще разок, добавив упоминание эльфийских рун. Возможно, это как раз наведет DALL-E на мысль о толкиеновских эльфах.
anatomic picture of an elf annotated with elven runes
Эльфы стали более фэнтезийными, но все страшноватые. Пробую еще раз.
anatomic diagram of an elf annotated with elven runes
Эльфы все страшнее и страшнее. Это уже не Толкиен и даже не Перумов. Впрочем, первая картинка хотя бы достаточно абстрактная. Отправляю запрос еще раз, на удачу поменяв синоним для диаграммы в надежде, что эльфы будут в разрезе.
cross-section anatomic diagram of an elf annotated with elven runes
Ну все, дело сделано, теперь это настоящее топливо для кошмаров, особенно этот ELL без лица и с роскошными рогами (и потрясающей диаграммой).
Советы
За эти два месяца я неплохо натренировался в обращении с DALL-E. Попробую поделиться некоторыми советами.
Лучше всего у DALL-E получается подделываться под сюрреализм — недаром название намекает на Сальвадора Дали.
Другие известные художественные стили тоже срабатывают. Смело добавляй к запросу имя любимого художника.
Фотореалистичные изображения иногда получается хорошо (как в примере с жабой), но если тебе нужно нарисовать лицо человека или какое-то устройство, то добиться правдоподобия будет очень тяжело.
Рендеры, карандашные наброски и карикатуры иногда получаются неплохо, но это чистой воды удача. Вообще, чем меньше в целом деталей, тем скорее DALL-E нарисует что-то лишнее.
Не забывай указывать, где происходит действие, иначе есть шанс получить белый фон.
Просить «высокое качество» не помешает, но это не волшебные слова, которые автоматически улучшат любую картинку.
Нужно обращать внимание на освещение. «Драматичный свет» и «закат» часто улучшают результат.
Чтобы получить изображение без кривизны, нужно делать очень много запросов, причем лучше всего прорабатывать несколько идей, пока не нащупаешь ту, которая у нейросети получается лучше всего.
Также рекомендую почитать Ultimate guide to DALL·E 2: how to use it & how to get access — подробное руководство по использованию DALL-E 2. И полистать презентацию The DALL·E 2 Prompt Book, в которой есть множество примеров запросов.
Выводы
Работая с DALL-E, я поначалу чувствовал себя пещерным человеком, которому дали немного поиграть с кремнем и повысекать искры. У нейросетей есть огромный потенциал, и сейчас их развитие — чуть ли не самое интересное, что происходит в области вычислительной техники.
Вопрос о том, лишат ли нейросети работы художников, для меня пока открыт. На мой взгляд, если и лишат, то нескоро, а пока что работы может стать даже больше.
Очень часто картинки нужно дорабатывать, к тому же сами запросы составлять не так-то просто, и познания в истории искусства дают преимущества. В идеале нужно аккуратно направлять нейросеть в сторону задумки — причем не только словами, но и своими набросками.
Недавно мне встретился очень интересный пример того, как при помощи локально развернутой нейросети Stable Diffusion и графического редактора можно нарисовать в точности то, что задумано. Предполагаю, скоро появятся и «облачные» редакторы с подобными (и гораздо более продвинутыми) инструментами. И кто-то должен будет учиться ими пользоваться.
Наш пример показывает, что раньше мы не могли позволить себе рисовать картинки для каждой статьи и были вынуждены выбирать из того, что есть на фотостоках, а с DALL-E можем позволить себе гораздо больше иллюстраций. С помощью нейросетей рисовать по картинке в день намного легче, и, естественно, это должен делать специальный человек, а не развлекающийся главный редактор.
Бонус
На сладкое покажу запрос, который я использовал, чтобы сделать обложку к этой статье. Я попробовал образно представить нашу редакцию.
office in style of Hieronymus Bosch
Поразительное сходство! На первой я работаю за айпадом с клавиатурой. На второй Валентин Холмогоров оживляет винтажный компьютер. На третьей кто-то из наших авторов начал писать статью и исчез (типично). Ну а на последней Дима Агарунов редактирует какой-то важный бизнес-документ, а вокруг… Кажется, кипит работа.
Как оптимизировать картинки для сайта
Изображения на сайте не просто иллюстрируют текст, но и влияют на трафик. Если картинки долго загружаются или залиты в плохом качестве, это негативно скажется на поведении пользователей. Правильная оптимизация поможет этого избежать — пользователь часто не вчитывается в текст, а скроллит страницу, и качественная иллюстрация привлекает его внимание.
Оптимизировать изображения нужно, чтобы они меньше весили и быстрее загружались.
Как оптимизировать изображения
Чтобы изображение оптимизировалось, нужно правильно задать формат, качество, размер, атрибуты alt и title, а также подписать картинки, разместить их в sitemap-файл и установить на сайт OpenGraph.
Формат
Google индексирует картинки в форматах JPEG, PNG, GIF, BMP, SVG и WebP. Яндекс — JPEG, PNG и GIF. Подробнее о том, как Яндекс индексирует изображения, можно узнать в справке.
JPEG — подходит для портретных и пейзажных фотографий, где важна цветопередача. Есть также JPEG 2000 и JPEG XR. Они сжимают изображения ещё сильнее, чем обычный JPEG, но пока эти форматы поддерживаются не всеми браузерами;
PNG — для сложных графических элементов, в которых нужно сохранить прозрачность и тени;
GIF — для анимации и мелких элементов: иконок, кнопок и так далее;
BMP — для растровых изображений;
SVG — для векторной графики в логотипах и значках;
WebP — сохраняет высокое качество изображений небольшого размера.
Качество
Чем качественнее будет картинка, тем больше пользователей обратит на неё внимание и тем лучше она проиндексируется.
Следите, чтобы при сжатии графика не испортилась и изображение было привлекательным и чётким.
Размер
От того, какого размера иллюстрация и сколько она весит, зависит скорость загрузки и индексация страницы.
Укажите ширину и высоту изображения в CSS, чтобы поисковик быстрее проиндексировал страницу. Оптимальный размер внутри страницы — в районе 300 px. Если изображение нужно растянуть на всю ширину экрана — 1920 px.
Приемлемый вес картинки — от 200 КБ до 1 Мб. Вес меньше 200 КБ сделает картинку некачественной, а изображение больше 1 Мб уже будет медленно загружаться.
Узнать размер и вес иллюстраций можно благодаря аудиту сайта от Serpstat:
Атрибуты alt и title
Название атрибута alt — сокращение от alternative. Это название изображения, которое покажется на месте картинки, если она не прогрузится. То есть это альтернативная, исходя из названия, информация, которую пользователь узнает об изображении.
Именно благодаря alt картинки попадают в выдачу поисковиков. Название должно содержать в себе три-четыре слова и соответствовать тому, что изображено. Желательно, чтобы в него входили ключевые слова.
Alt — это не то же самое, что название файла. Атрибут прописывается уже в коде, а название — перед загрузкой на сайт. Но назвать изображение тоже нужно правильно. Например, если на иллюстрации — аэропорт Шереметьево, назовите файл SVO-airport.jpg, а не именем, которое присвоила система.
Так alt выглядит в коде изображения
Второй атрибут — title — показывается, если просто навести курсор на изображение, даже если оно прогрузилось. Эта настройка не так обязательна, как alt, но всё же с её помощью картинка может косвенно продвигаться — на изображении с текстом пользователи останавливают внимание чуть дольше.
Так title выглядит на сайте
Подписи
Если alt и title — подписи, которые появляются при каком-то действии, то обычная подпись сопровождает изображение всегда.
Изображение с подписью. Кстати, текст, который вы сейчас читаете — тоже пример подписи
Подписи помогают оптимизировать картинку по двум причинам:
- даже если пользователю лень читать полный текст, при скролле страницы он задержит взгляд на подписях;
- в подпись можно добавить ключевые слова, которые заметит поисковик.
Чтобы подпись помогла не только оптимизации, но и читателю, напишите в ней что-нибудь полезное и не противоречащее иллюстрации.
Sitemap-файл
Sitemap — это карта сайта в виде кода, по которому можно читать, где находятся те или иные объекты. Чтобы поисковики проиндексировали труднодоступные изображения (например, загруженные с помощью JavaScript), их нужно прописать в sitemap-файле в формате XML.
В коде это выглядит так:
Подробнее о том, как настроить sitemap-файл, можно узнать в справках Яндекса и Google.
Разметка OpenGraph
Материалы, опубликованные на сайте, можно продвигать также с помощью соцсетей. Чтобы на него обратили внимание в новостной ленте, пост со статьёй нужно красиво оформить. В этом помогает разметка OpenGraph.
Если OpenGraph есть на сайте, то при публикации в соцсетях автоматически заливается изображение нужного размера, а также правильные заголовок и ссылка. Это повышает привлекательность поста.
Пост со статьёй на OpenGraph
Материал не на OpenGraph опубликуется в соцсети в сжатом виде — если нажать на изображение, оно будет вести на сайт, и картинку не получится посмотреть полностью, не перейдя по ссылке.
Подробная инструкция, как настроить OpenGraph, есть у Яндекс.Помощи.
CDN
Если страница медленно загружается, это может привести к потере аудитории и, как следствие — убыткам. Кроме веса контента, на скорость загрузки влияет географическая удалённость сервера. Чтобы сайт открывался одинаково быстро в любой точке мира, можно использовать сети доставки контента (Content Delivery Networks), которые распределяют нагрузку на один сервер.
Кроме того, CDN улучшает вертикальные поиски — к ним относится поиск по картинкам и видео. Однако поисковик может индексировать страницу с изображением не на вашем сайте, а на том сервере, который закэшировал картинку. Это означает, что фактически изображение расположено не у вас и из-за этого вы теряете трафик.
Чтобы этого не произошло, стоит создать поддомен для CDN и размещать изображения на нём.
Где сжать изображение и не потерять качество
Есть много онлайн-сервисов, которые качественно оптимизируют изображения. Расскажем о нескольких из них.
I love image
Сжимает картинки форматов JPG, PNG и GIF.
Image Compressor
Сжимает одновременно до 20 изображений форматов JPEG и PNG.
EzGIF
Как понятно из названия, этот сервис оптимизирует гифки.
Imagifiy
Позволяет оптимизировать все картинки на сайте сразу.
Compressor
Сервис, в котором можно выбрать — нужно ли искажать качество изображения или нет. Сжимает картинки на 90%.
Вывод
Изображения не просто делают контент разнообразнее, но и помогают сайту ранжироваться. Для этого нужны качественные, нетяжёлые по весу и небольшие по размеру картинки.
Оптимизируя изображения, не забудьте настроить формат, качество, размер, атрибуты alt и title, а также подписать картинки, разместить их в sitemap-файл и установить на сайт OpenGraph.
Сжать иллюстрации можно с помощью сервисов, которые специализируются на разных форматах или расположениях изображений.
Улучшите процесс создания изображений с помощью искусственного интеллекта Midjourney с помощью этих продвинутых советов
Midjourney — один из самых диких веб-сервисов, подобных передовым, с которыми я когда-либо сталкивался. Это также один из лучших и наиболее гибких способов, позволяющих вам продолжать совершенствовать свое приглашение или запрос на изображение. Давайте углубимся в некоторые полусложные инструкции, чтобы получить больше от Midjourney.
Обновление от 30 января: более продвинутые советы в моем последнем посте : убедитесь, что ваши подсказки изображения AI Midjourney имеют этот параметр.
Давайте создадим несколько уникальных иллюстраций и изображений с помощью Midjourney
Важно знать, что существует руководство пользователя Midjourney. Довольно удобно, хотя не всегда легко найти, и мало кто думает, что он им понадобится. Если вы говорите «конечно, я читал руководство», то этот пост не для вас. В противном случае я поделюсь несколькими способами улучшить ваш имидж и художественное творчество.
Совет № 1. Как только вы окажетесь в комнате для новичков, побродите там, чтобы посмотреть, какие изображения и произведения искусства создают другие люди. Для тех, кто вам нравится, обратите внимание на язык подсказок, который они используют. Я добился большей части своего успеха, наблюдая, как другие создатели структурируют свои подсказки. Художники, фотографы и другие лица, использующие передовое программное обеспечение, часто используют определенные термины, и они могут быть очень полезны при воссоздании чего-то подобного своими собственными усилиями.
Совет № 2: вы можете использовать фотографии в качестве руководства для Midjourney. Вставьте URL-адрес в начале подсказки, а затем свой текст с запятыми, чтобы разделить ключевые идеи. Подсказка может выглядеть так, как показано на скриншоте ниже: URL-адрес вставлен (затем такие термины/слова:) фотореалистично, очень подробно, рыбак смотрит на океан, стоит в лодке.
Подсказка в Midjourney, чтобы показать, как включить и использовать существующую фотографию или изображение из Интернета.
Ти Джей МакКью через Midjourney AIЕЩЕ ОТ FORFORBES ADVISOR
Совет № 3: Выберите стиль художника, который вам нравится, скажем, стиль Да Винчи.
/вообразите рыбака, смотрящего на океан, стоящего в лодке, в стиле Давинчи
Подсказка на середине путешествия Рыбак в стиле Да Винчи
TJ McCue via MidjourneyСовет № 4: Предложите освещение, которое хотите, напишите Sunset Lighting или яркое освещение или неоновые огни.
/представьте, что рыбак смотрит на океан, стоит в лодке, освещение заката
TJ McCue Midjourney Рыбак, предлагающий освещение заката как часть подсказки
TJ McCue через MidjourneyЯ потратил время, используя ключевые слова для управления ИИ, такие как фотореалистичность, высокая детализация, высокое разрешение. Некоторые пользователи указывают конкретную камеру или объектив для создания желаемого эффекта. Из руководства Midjourney я начал тестировать идеи по их ссылкам на ресурсы, которые предлагали запрашивать определенные материалы, такие как акварель, рисунок тушью или карандашный набросок.
Одна из областей, в которой мои усилия окупились, — это использование забавных слов, архитектурных терминов или культурных стилей: футуристическая одежда, 2153 год, киберпанк, стимпанк, заброшенный склад, японская деревянная хижина. Потенциал использования только вашего разума и слов для создания образов поразителен.
Мне пришлось добавить эту последнюю подсказку к сегодняшнему сообщению:
/представьте себе высоко детализированного киберпанк-рыбака, смотрящего на океан, стоящего в своей лодке, рядом с заброшенным причалом и складом, синее освещение
Изображение, демонстрирующее подсказку, использованную в Midjourney
TJ McCue через Midjourney AIОдин из моих любимых ресурсов исходит от участника Medium , Ларса Нильсена, где он опубликовал: Расширенное руководство по написанию подсказок для Midjourney ( text-to -изображение). Его пост отлично справляется со сравнением таких вещей, как стиль или освещение.
И последнее, что касается продвинутых тем: вы можете загрузить приложение Discord для iOS, Android, Windows, Linux и Mac, которое даст вам несколько дополнительных способов использования всего опыта Midjourney.
Возвращаясь к основам Midjourney
Вчера я предложил самые простые основы в своем посте: Art Generator на основе искусственного интеллекта Midjourney создает ослепительные изображения из слов. По моему собственному опыту и даже опыту нескольких полуподкованных технических друзей, у нас были одни и те же проблемы новичков: «Как вы вообще находите место, чтобы вставить /imagine?» Я хотел бы расширить здесь больше этих основ, если вы все еще задаетесь вопросом о них.
Как только вы преодолеете основной шум настройки Midjourney и его точки доступа Discord. Возможно, вы запустили несколько основных подсказок, и пока вы ждете результатов, на экране появляются десятки, а то и сотни изображений.
Некоторые дополнительные основы / предостережения, которые, возможно, не были очевидны:
— После того, как вы войдете в комнату #newbies (красный кружок № 1), в самом верху экрана (красный кружок № 2) главная панель справа в левой навигационной колонке, где проходят все иллюстрации) — это краткое руководство по использованию Midjourney. Боже мой, я не мог найти его прошлой ночью, когда писал первый пост. Но если вы хотите найти его самостоятельно в Discord, вот скриншот:
TJ McCue Midjourney Краткое руководство скриншот шаги
TJ McCue Midjourney Краткое руководство по началу работы скриншот шаги-Большой вопрос, который возникает у большинства людей в этот момент: «Как мне вообще найти мои изображения, мои результаты?» Два способа:
— Во-первых, для вашей пробной версии, и это может измениться, вам нужно прокрутить вверх, чтобы найти свои результаты. Как только вы найдете их, вы можете нажать маленькую кнопку смайликов реакции в правом верхнем углу этого раздела. Когда он откроется, вы сможете ввести «конверт», выбрать этот смайлик, и он отправит вам детали вашего создания в области прямого сообщения (DM).
— Во-вторых, на изображении ниже у меня есть три цифры в красных кружках: 1. Нажмите на маленький логотип Discord вверху слева. 2. Щелкните логотип в виде папки «Входящие». 3. Перейдите на вкладку «Упоминания», и даже во время бесплатного пробного периода вы увидите созданные вами изображения. Если нет, вы можете застрять в прокрутке. Кажется, всегда есть задержка, когда они появляются для меня.
Как увидеть свои творения в Midjourney — 1, 2, 3 красные круги приведут вас туда.
Скриншот TJ McCue через Midjourney — В-третьих, если вы станете платным подписчиком, вы сможете получить доступ к своей собственной фотогалерее в веб-приложении Midjourney. На самом деле немного облом, что они не облегчают работу во время вашей базовой бесплатной пробной версии, но это был самый надежный способ вернуться к изображениям.
— Осторожно, Создатель. То, что вы создаете, является общедоступным, даже если вы отправляете запрос из области прямого сообщения, результаты будут отображаться на экране с бешеной прокруткой, который вы, возможно, помните, когда впервые вошли в Discord. Вы можете заплатить, чтобы ваши творения оставались конфиденциальными, за дополнительную ежемесячную плату в размере 20 долларов США (помимо ежемесячной абонентской платы).
ПРИМЕЧАНИЕ. Я планирую продолжить эту подборку инструментов искусственного интеллекта, которые могут повысить вашу производительность или креативность, или и то, и другое. Так что не стесняйтесь обращаться к идеям, инструментам, лайфхакам, расширенным подсказкам, которые вы, возможно, создали. Я думаю, что на ChatGPT и Midjourney есть что покопать, и я буду настаивать на публикации каждый понедельник и четверг, начиная с февраля. Кроме того, да, я слышал о Stable Diffusion (и нескольких других многообещающих инструментах AI Art и Image). Я обязательно отчитаюсь после того, как у меня будет возможность попробовать.
Использование плоского стиля изображения для получения более качественных изображений
Сообщение от: Rick Berk
За время своей карьеры в фотографии я продолжал развивать свои стили съемки и редактирования, чтобы добиться желаемых результатов. Несколько лет назад, работая с монтажерами над кинопроектом, я наткнулся на концепцию, которую решил применить к своей фотографии, и должен сказать, что она значительно улучшила мои окончательные изображения. Позвольте мне объяснить, как использовать плоские стили изображения.
Когда голливудские студии снимают фильм с помощью цифровой кинокамеры, камера часто настраивается на запись так называемой логарифмической гаммы. Это похоже на стили изображения, которые мы, пользователи цифровых зеркальных камер и фотоаппаратов, знаем и любим. Но в то время как стили изображения или элементы управления изображением по большей части предназначены для придания законченного вида, Log Gamma делает прямо противоположное. Видеофайл, снятый с использованием Log Gamma, будет очень плоским, с небольшим контрастом и цветовой насыщенностью. Цель съемки видео таким образом состоит в том, чтобы сохранить как можно больше информации о диапазоне тонов в изображении, чтобы колористы, которые позже будут работать над видео, могли выделить эти детали и создать визуальный образ фильма. . Этот процесс называется цветокоррекцией.
Когда я начал понимать, что делают колористы, я скорректировал свой рабочий процесс, чтобы позволить мне использовать преимущества тех же концепций. Я обнаружил, что, используя плоский стиль изображения с низким контрастом и низкой насыщенностью, при обработке файла RAW я могу повысить детализацию и контрастность и избежать обрезки светлых участков и теней.
Выбор плоского стиля изображения
Плоский или нейтральный стиль изображения даст вам изображение с наименьшей контрастностью, сохраняя лучшую детализацию светлых участков и теней. Это позволяет выявить эти детали при обработке. Гистограмма на вашей камере, а затем в Photoshop или Lightroom позволяет вам увидеть, где падают ваши светлые и темные тона, чтобы избежать обрезки.
Некоторое время я снимал в формате RAW, но по большей части оставил для параметра «Стиль изображения» значение «Стандартный» или «Пейзаж». Как только я увидел эту технику, я решил изменить стиль изображения на своей камере на Нейтральный (для камер Canon) или Плоский (на более новых Nikon).
Стиль изображения Canon
Причина в том, что гистограмма, отображаемая на задней панели камеры, а также предварительный просмотр изображения отражают выбранный стиль изображения. В результате, если выбран более контрастный стиль изображения, например Пейзаж, гистограмма будет отражать это и может указывать на отсечение светлых участков или теней, особенно в контрастной сцене.
На этой гистограмме показаны обрезанные светлые участки, что означает потерю деталей в самых ярких областях изображения.
На моем Nikon D810 я использую управление изображением Flat, потому что это лучший выбор для захвата всего диапазона тонов в сцене, и эти тона отражаются на гистограмме на задней панели камеры, когда я просматриваю кадры.
Nikon 810 Flat Picture Control
Управление изображением Nikon — если у вас нет Flat, выберите Neutral или Faithful
Гистограмма на вашей камере представляет собой график, показывающий, где пиксели вашего изображения располагаются по отношению к светлым и теневым участкам. Левый край представляет черный цвет, средний левый — тени, средний — средние тона, средний правый — блики, а крайний правый — белый. Хотя не все камеры имеют элемент управления или стиль плоского изображения, большинство из них имеют стиль или элемент управления нейтрального или точного изображения, которые работают аналогично. Кроме того, большинство камер дают вам возможность редактировать стили изображения, поэтому вы можете уменьшить контрастность, если хотите, гарантируя, что вы захватите больше деталей в светлых и темных участках, и уменьшите вероятность обрезки светлых участков или теней.
При обрезании светлых участков обрезанные объекты сцены будут отображаться чисто белыми без деталей. Когда тени обрезаются, объекты в этих областях будут отображаться на сцене как чисто черные, а также без деталей. Если при просмотре гистограммы волнистые линии, составляющие график, смещаются вверх либо к левой, либо к правой стороне, это называется отсечением. Когда это происходит, вы теряете детали в тенях, если они сдвинуты влево, и в светах, если график сдвинут вправо. Уменьшив контрастность стиля изображения, вы снизите вероятность потери деталей сцены.
Съемка в формате RAW и, зная, что я буду вносить коррективы в постобработку, на самом деле не имеет значения, какой стиль изображения я использую, потому что я могу изменить его при обработке файла RAW. Но очень важно иметь возможность видеть точную гистограмму на моей камере, чтобы убедиться, что я захватил как можно больше тонового диапазона.
Обработка файла RAW
Это изображение было снято с использованием элемента управления «Плоское изображение», а затем ползунки светлых участков и теней в Adobe Camera RAW были скорректированы для дальнейшего снижения контрастности.
Как только я начну обрабатывать файл RAW, я при необходимости сделаю еще больше, чтобы сгладить изображение и сжать диапазон тонов в пределах гистограммы. Это включает в себя использование ползунков «Света» и «Тени» в Adobe Camera RAW для отображения деталей на обоих концах гистограммы. Вы можете наблюдать за изменением гистограммы в Adobe Camera Raw или Lightroom, чтобы не зайти слишком далеко. Если блики начинают выглядеть мутными, вы зашли слишком далеко. Точно так же, если тени начинают выглядеть размытыми, это, вероятно, тоже слишком далеко. Вы хотите сохранить детали в каждом из них, но не потерять глубину тона полностью. Важно отметить, что эта корректировка будет различаться для разных изображений в зависимости от того, где на изображении попадают светлые и темные участки.
В дополнение к регулировке бликов, теней и контраста здесь я буду использовать ползунок Dehaze, кисть Lens Correction и Spot Removal в Adobe Camera RAW. При желании вы можете использовать кисть «Вибрация», «Насыщенность» и «Корректирующая кисть», чтобы завершить изображение в Adobe Camera RAW или Lightroom, но я предпочитаю работать в Photoshop. Там я могу использовать рабочий процесс «Слои» вместе с маскирующими и корректирующими слоями, а также с различными плагинами для получения окончательного изображения.
Создание цвета и контраста
Используя корректирующие слои в Photoshop, я увеличил насыщенность цвета и контрастность, чтобы получить финальное изображение.
Как только я получу изображение с желаемым уровнем плоскостности, я приступаю к созданию цветовой насыщенности и контрастности, или, говоря голливудскими терминами, к цветокоррекции моего изображения. После переноса изображения в Photoshop есть несколько способов сделать это. Во-первых, используйте корректирующие слои, чтобы вы могли постоянно корректировать каждый слой по своему усмотрению, пока не сгладите изображение для окончательного результата. Кроме того, если вы вносите корректировку, которую хотите применить только к определенным областям, вы можете использовать маски слоя, чтобы скрыть или показать ее по желанию.
Многие из этих настроек будут зависеть от вашего личного вкуса. Я лично предпочитаю, чтобы мои изображения имели насыщенный цвет и контраст. Таким образом, набор корректирующих слоёв, которые я мог бы использовать, будет Vibrance, Exposure, Hue/Saturation, Curves и Exposure. Гибкость использования корректирующих слоев позволяет мне направлять корректировки туда, где они мне нужны, вместо того, чтобы делать их глобально.
Это то же изображение, но я использовал Nik Color Efex Pro для получения окончательного изображения вместо корректирующих слоев.
Если вам не нравятся корректирующие слои, возможно, используйте плагин, такой как Nik Efex Pro от Google. Теперь он доступен бесплатно и является программным пакетом, который я очень рекомендую. Я создал несколько пресетов в Color Efex Pro, а также буду использовать Viveza и его контрольные точки для дальнейшей настройки изображения. Для пейзажей в Color Efex я создал пресет с использованием Brilliance/Warmth, Pro Contrast, Skylight Filter, Detail Extractor и Vignette:Lens, которые мне нравятся для большинства моих пейзажных изображений.
Подведение итогов
Слева — изображение со сглаженными и обесцвеченными тонами, с использованием элемента управления «Плоское изображение» и при необходимости корректировки светлых участков и теней. Справа — полностью обработанное изображение с построением контраста и цветовой насыщенности.
Начиная со сглаженного файла, вы даете себе пространство в диапазоне тонов для создания контраста и насыщенности без обрезки светлых участков, теней или любых цветовых каналов. Хотя съемка с более законченным стилем изображения может выглядеть более приятно на ЖК-экране камеры, или при импорте в Lightroom или Photoshop контрастность уже отрегулирована, чтобы придать ему приятный вид. Любые корректировки насыщенности или цвета могут привести к тому, что файл будет как минимум выглядеть пережаренным, а в худшем — с обрезанными бликами, тенями или цветовыми каналами.
Справа изображение в плоском стиле, а слева — «цветокоррекция» в Photoshop.