Midjourney — нейросеть генерирующая картинки по текстовому описанию / Хабр
В наше время нейросетью уже мало кого удивишь, эти штуки умеют обрабатывать видео, вести диалог с человеком, выполнять поиск материалов в интернете, писать музыку, распознавать объекты на фото, помогают обрабатывать фото и многое другое. Сегодня я хочу рассказать о сетке рисующей картинки — Midjourney.
Команда Midjourney позиционирует себя как независимую исследовательскую лабораторию, занимающуюся расширением творческих способностей человечества.
Проект был запущен в феврале 2022 ученым и предпринимателем Дэвидом Хольцом.
Давид Хольц — выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве работал в Институте Макса Планка, где изучал алгоритмы нейровизуализации, также работал в исследовательском центре NASA и принимал участие в разработке технологии LiDAR (обнаружение и определение дальности с помощью света, технология используется, в том числе, в камерах iPhone).
Подробнее о личности основателя можно прочесть вот в этой заметке.
Midjourney является независимым самофинансируемым проектом над которым трудится команда из 11 штатных сотрудников, а также большое количество внешних консультантов. Перечень всех участников проекта доступен на официальном сайте проекта.
Работу Midjourney обеспечивают алгоритмы распознавания речи и алгоритмы создающие образы. Проще говоря, Миджорни умеет распознавать печатный текст и преобразовывать его в картинки. Для этого необходимо на английском языке описать сюжет, направить его на обработку сетке и дождаться результата. После полученный результат можно немного модернизировать, увеличить его качество и скачать.
Получаются вот такие картинки.
Сетка представлена в формате Дискорд-бота. Придуманный сюжет нужно направить боту в чат, а в ответ он пришлёт сгенерированную картинку.
Наличие такого инструмента в будущем очень сильно упростит работу дизайнера, решив проблему отсутствия контента на стоках, длительный поиск необходимых материалов.
Для быстрого создания контента понадобится воображение, умение структурировать информацию и интерпретировать ее в понятные словосочетания. Ну, круто же!
Я уверен, что никакие нейросети и Скайнеты не заменят дизайнера, но очень сильно упростят его работу.
Теперь о том, как протестировать это чудо техники. 😊
Сейчас сетка находится на этапе открытого бета-тестирования, доступ может получить каждый. Для этого необходимо:
1. Перейти на сайт Миджорни — midjourney.com и нажать кнопку «join the beta».
2. Сайт перенаправит вас в Discord. Там необходимо авторизоваться или создать аккаунт. Авторизация через Дис обязательна — нейросеть работает в формате Дискорд-бота.
3. Далее нужно дать сетке необходимые разрешения.
4. После чего система вас может направить в личный кабинет Миджорни. Выглядит он как на скрине. Чтобы из кабинета попасть в Дискорд-бот нужно нажать на ваш аватар в нижней части экрана и выбрать пункт «Go to Discord». Может сразу направить в бот, бывает по-разному. 😊
5. Открывшийся канал нейросети, будет выглядеть так.
6. Можно ознакомиться со справочной инфой в разделе «welcome», там кратко описано что к чему.
7. После чего нужно перейти в любой канал название которого начинается как newbies: «newbies-102», «newbies-132» и т.д.
8. Находясь в канале необходимо в текстовую строку ввести команду «/imagine promt» и текст сюжета, должно получиться как на скрине.
9. После того как будет вставлен текст нужно нажать энтер и можно наблюдать в реальном времени процесс генерации картинок. Это займет около минуты.
10. Можно не ждать — когда картинка будет готова нейросеть пришлет уведомление. Перейти к записи в канале можно через центр уведомлений Дискорда.
11. Ознакомившись с результатом, можно попросить сетку проработать варианты одного из сюжетов нажав одну из кнопок V1, V2, V3 или V4. Кнопки соответствуют одному из четырёх предложенных вариантов.
12. Кнопки типа U1 и т.д. необходимы для инициации процесса улучшения качества картинки — «upscale».
13. После того как картинка будет доработана ее можно скачать или ещё немного доработать, увеличить размер до максимума, а также оценить.
На GitHub существует более обширный гайд по работе с сетью. В нём доступны различные дополнительные команды и настройки.
Ссылка на гайд тут.
Стоит ещё добавить, что большинство продуктов делаются людьми для зарабатывания денег и Миджорни не исключение. Для тестирования работы сетки разработчиками бесплатно предоставляются «25 действий»: можно сгенерировать 25 сетов по 4 картинки в низком качестве или меньшее количество сетов и за оставшиеся баллы (действия) проработать варианты или увеличить качество изображений.
Когда лимит будет исчерпан бот пришлет вам вот такое уведомление.
Для увеличения лимитов можно перейти в админку сети и приобрести один из предложенных пакетов.
На этом у меня всё. Очень рекомендую протестировать сетку и очень жду, когда нейросети станут одним из инструментов дизайна, таким же привычным как Фигма или Фотошоп. 😊
🔷Искусственный интеллект может создавать уникальные картинки🔶
Дата поста: 27 Дек 2022
Валерий
72
0
Язык статьи:
ru
Дата поста: 27 Дек 2022
Валерий
72
0
Язык статьи:
ru
Искусственный интеллект может использоваться для решения различных задач, которые трудно выполнить человеку. Например, искусственный интеллект может анализировать большие объемы данных, выполнять сложные математические расчеты или решать задачи оптимизации.
Искусственный интеллект также может использоваться для создания новых технологий и решения практических задач в различных областях, таких как медицина, транспорт, образование, бизнес и т.
Содержание:
- 1 Искусственный интеллект может создавать картинки?
- 2 Что такое Midjourney?
- 2.1 ИНСТРУКЦИЯ (ПОЖАЛУЙСТА, ПРОЧИТАЙТЕ)
- 2.2 Midjourney частозадаваемые вопросы
- 3 Примеры сгенерированных изображений с помощью midjourney
Искусственный интеллект может создавать картинки?
Да, искусственный интеллект может использоваться для создания картинок различных типов. Одним из способов это делать является использование нейронных сетей, которые могут обучаться на больших объемах изображений и создавать новые изображения, основываясь на том, что они уже знают.
Например, нейронная сеть может обучаться на фотографиях людей и создавать новые фотографии людей, которые никогда не существовали ранее. Также искусственный интеллект может использоваться для генерации изображений различных типов, например, абстрактных изображений, цветовых паттернов и т. д.
Искусственный интеллект может написан на различных языках программирования, в зависимости от того, какой язык лучше подходит для конкретной задачи. Часто используются языки программирования с высоким уровнем абстракции, такие как Python, Java, C++ и т. д.
Также могут использоваться языки с низким уровнем абстракции, такие как ассемблер, если требуется большая скорость выполнения кода или доступ к низкоуровневым ресурсам компьютера. В общем, выбор языка программирования для реализации искусственного интеллекта зависит от целей и требований к проекту.
Самым продвинутым по генерации изображений является ИИ — Midjourney. О нем и расскажем немного дальше.
Что такое Midjourney?
Midjourney — это новая лаборатория исследований, которая сосредоточена на новых средах и инструментах для усиления людей.
Привет! Мы рады, что вы присоединились к бета-версии Midjourney. Чтобы увеличить сообщество устойчивым образом, мы даем всем ограниченный бесплатный период опробования (около 25 запросов), а затем различные варианты покупки полной членской платы.
Полные членские платы включают: неограниченное количество генераций (или ограниченное по дешевой тарифной плану) и выгодные условия для коммерции, начинают от 10 долларов и заканчиваются в 50 долларов в месяц.
ИНСТРУКЦИЯ (ПОЖАЛУЙСТА, ПРОЧИТАЙТЕ)
Чтобы создать изображения:
- Перейдите в один из каналов «новичка-newbie» бота. См. Прикрепленный скриншот: https://s.mj.run/newbie
- Введите /imagine и затем то, что вы хотите
- Бот отправит вам 4 изображения в течение 60 секунд
- Нажмите нумерованные кнопки под изображениями, чтобы получить увеличенные (U) или вариации (V) версии
- Чтобы узнать, как начать работу, посетите ссылку.
Чтобы увидеть популярные изображения от сообщества, посетите: https://s.mj.run/feed.
Midjourney частозадаваемые вопросы
Есть ли какие-то правила?
- Не будьте железным
- Не используйте наши инструменты для создания изображений, которые могут вызвать возмущение, раздражение или конфликты. Это включает жестокие сцены и взрослое содержание.
- Будьте уважительны к разработчикам, модераторам и руководителям на сервере
- чтобы узнать больше правил, см. правила через команду: #rules (также есть своя комната в дискорде с правилами) или /info.
Могу ли я делать подробные обзоры текущей бета-версии? Могу ли я размещать скриншоты / видео с Discord?
Да! Но пожалуйста, укажите дату в своем обзоре и укажите, что опыт все еще значительно меняется.
Вы берете инвестиции?
В настоящее время мы не принимаем вложения в уставный капитал. Бизнес-партнерства и пожертвования рассматриваются.
Я — журналист / блогер и хочу написать что-то о вас, как связаться?
Пожалуйста, напишите на [email protected]
Откуда берется финансирование?
Финансирование поступает от бизнес-партнерств, пожертвований и наших собственных сбережений.
Какой бизнес-моделью руководствуетесь здесь?
Мы разбираемся, но наша цель — предоставить как можно большему количеству людей доступ к этим технологиям.
Могу ли я помочь? Вы нанимаете людей?
Да! Отправьте электронное письмо на [email protected] с указанием того, что вам нравится делать (Twitter/LinkedIn/резюме поможет нам быстрее ответить).
Примеры сгенерированных изображений с помощью midjourney
Лучшие генераторы изображений ИИ в 2023 году
Нравится вам это или нет, популярность генераторов изображений искусственного интеллекта (ИИ) в этом году резко возросла, и эта технология не собирается останавливаться.
В начале 2022 года практически не было общедоступных генераторов ИИ для преобразования текста в изображения, но после того, как DALL-E, наконец, стал доступен в бета-версии в июле, а Stable Diffusion был выпущен месяц спустя, теперь внезапно появились множество генераторов изображений AI, претендующих на звание лучшего программного обеспечения на рынке.
Так что, если вы не знаете, какой генератор AI-изображений вам следует использовать в 2023 году, это полное руководство по лучшим вариантам.
Обновление от 21.19.2022 от Matt Growcoot: Информация о DALL-E обновлена. И NightCafe AI добавлен в список.
Краткий обзор
DALL-E 2
Продукт исследовательской лаборатории OpenAI, соучредителем которой является Илон Маск. имя, когда вы спрашиваете их о генераторах ИИ для преобразования текста в изображение.
Когда DALL-E был запущен в апреле, он ошеломил социальные сети своей способностью превращать краткое описание в фотореалистичное изображение.
Для тех немногих, кто имел привилегированный доступ к закрытому инструменту, DALL-E был настолько исключительным, что это казалось почти волшебством — будь то создание изображений «астронавта-енота с отражением космоса в стекле его шлема». или «плюшевые мишки покупают продукты в Древнем Египте», и все это из простой текстовой подсказки.
«астронавт-енот с отражением космоса в стекле шлема мечтает о звездах» @OpenAI DALL-E 2 pic.twitter.com/HkGDtVlOWX
— Эндрю Мейн (@AndrewMayne) 6 апреля 2022 г.
Преобразование текста в изображение.
Вот «Два плюшевых мишки покупают продукты в Древнем Египте», преобразованный из текста в изображение.
Использование OpenAI DALL-E 2.
Безумие. pic.twitter.com/hUOWxrquyS
— murfin.eth (@JoeMurfin) 11 апреля 2022 г.
С тех пор DALL-E завоевал репутацию ведущего среди доступных генераторов искусственного интеллекта для преобразования текста в изображение. Он известен тем, что дает наилучшие результаты и является одной из самых простых в использовании систем.
Изображение «Мужчина, который фотографирует своей цифровой камерой», созданное DALL-E 2DALL-E ни в коем случае не является единственным программным обеспечением машинного обучения, которое может генерировать изображения. Так что же стоит за беспрецедентной репутацией генератора ИИ? И почему эта технология считается такой новаторской и прорывной?
Прежде всего, тот факт, что изображения, которые создает DALL-E, визуально привлекательны, является ключевым компонентом его успеха. В то время как другие генераторы изображений ИИ часто создают произведения искусства, имеющие апокалиптический или более мрачный оттенок, Dall-E создает изображения, которые являются шокирующе реалистичными и гораздо более эстетичными для создателей, которые уже обладают острым художественным чутьем.
Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное DALL-E 2Когда DALL-E появился на сцене, это стало огромным шагом вперед в технологии создания изображений ИИ. По сравнению со своими предшественниками, это программное обеспечение было первым, которое позволило пользователям получить исключительную степень контроля над стилем, темой и атрибутами цифровых изображений, которые они создавали, и даже позволило пользователям управлять объективом и диафрагмой в своих «фотографиях», созданных искусственным интеллектом. ». Эта технология, казалось, открывала безграничные возможности для создания изображений.
Первые впечатления от DALL-E 2 @OpenAI. 🧵
Все изображения ниже были созданы ИИ, и я предоставил ему цитируемую подсказку. Мне было очень любопытно, насколько полезным может быть такой инструмент в творческой работе.
«Ленивец, играющий на гитаре, сфотографируйте объектив 35 мм» pic.twitter.com/EHOXlrAOl9
— Грант Сандерсон (@3blue1brown) 14 июня 2022 г.
DALL-E также поразил пользователей своей замечательной способностью понимать текстовые подсказки лучше, чем любое другое программное обеспечение, которое предшествовало ему. Это связано с тем, что DALL-E использует принадлежащий OpenAI GPT-3 — возможно, самый продвинутый алгоритм машинного обучения на естественном языке — для преобразования текстовых инструкций в изображения.
Итак, как вы можете использовать DALL-E? Помимо использования его для преобразования предложений в изображения, вы также можете запросить DALL-E с изображением. Есть два способа сделать это: вариация или редактирование.
Вариант просто предлагает DALL-E с изображением, а не с текстом. В ответ на предоставленное изображение DALL-E создает серию дополнительных изображений, которые отражают эстетику и тему оригинала, но каждое изображение имеет свою изюминку.
Вариации «Грегори Крюдсон, ночная прачечная, туман, неон», сгенерированные DALL-E 2Редактирование — это третий способ вызвать DALL-E и, возможно, одна из самых революционных функций программного обеспечения. Вы можете предоставить изображение и попросить DALL-E добавить «купание слоненка» на фотографию воды, повысить резкость расфокусированной божьей коровки, удалить объект на изображении или «сделать его ночным». Технология искусственного интеллекта понимает даже такие вещи, как отражения, и соответствующим образом обновляет их при редактировании.
DALL-E генерирует только квадратные выходные данные. Но, используя его новую функцию редактирования «Outpainting», вы можете расширить изображение за пределы его исходной границы.
Outpainting позволяет пользователям расширять изображение наружу до более широкой рамки обзора, создавая более крупные изображения с любым соотношением сторон. Вводя подсказки в DALL-E, машина будет учитывать существующие визуальные элементы изображения, чтобы сохранить контекст исходного изображения. Он использует тени, отражения и текстуры для создания фона AI, который идеально сочетается с исходным изображением.
Оригинал: «Девушка с жемчужной сережкой» Йоханнеса ВермеераOutpainting: August Kamp
Благодаря этим невероятным возможностям DALL-E может стать мощным и важным инструментом редактирования для фотографов в будущем.
Если вы приобрели DALL-E и готовы начать использовать программное обеспечение, есть одна загвоздка.
Система OpenAI второго поколения DALL-E 2 недавно стала общедоступной, и теперь каждый может зарегистрироваться.
Изображение «Хомяк, поедающий пиццу на гавайском пляже», созданное DALL-EКаждая учетная запись DALL-E 2 получает 50 бесплатных кредитов для использования в системе и еще 15 кредитов каждый месяц. Дополнительные кредиты будут стоить 15 долларов за 115 кредитов, и каждый кредит принесет вам четыре изображения для подсказки или инструкции.
OpenAI прямо говорит, что пользователи «получают полные права на коммерциализацию изображений, которые они создают с помощью DALL-E, включая право на перепечатку, продажу и продажу товаров», хотя, по общему признанию, это все еще остается серой областью закона. Компания DALL-E 2 спроектировала так, чтобы отказаться от создания изображений знаменитостей или общественных деятелей. Система также не будет генерировать явный, кровавый или политический контент.
С чего начать : Чтобы зарегистрироваться в DALL-E 2, нажмите здесь.
Стабильная диффузия
Хотя вам, возможно, придется долго ждать, чтобы получить доступ к DALL-E 2, существует ИИ-генератор преобразования текста в изображение, который получает высшие оценки за доступность, и это Stable Diffusion.
Stable Diffusion, разработанный StabilityAI в сотрудничестве с EleutherAI и LAION, является отличным генератором изображений с искусственным интеллектом для тех, кто хочет начать создавать собственное цифровое искусство прямо сейчас.
Что делает Stable Diffusion особенным, так это прозрачность программного обеспечения Stability AI. Компания сделала исходный код Stable Diffusion общедоступным по лицензии Creative ML OpenRAIL-M. Это резко контрастирует с конкурирующими моделями, такими как, например, DALL-E.
Изображение «Мужчина, который фотографирует своей цифровой камерой», созданное Stable DiffusionПоскольку Stable Diffusion является открытым исходным кодом, пользователи уже начали улучшать и дополнять исходный код. Существуют десятки репозиториев с различными функциями и оптимизациями. Пользователь Reddit даже успешно создал плагин Photoshop для Stable Diffusion. Существует также подключаемый модуль для Krita.
Именно это сообщество и инновации вокруг Stable Diffusion делают генератор изображений AI таким захватывающим для пользователей, хотя, по общему признанию, может быть сложно перемещаться между различными репозиториями, доступными в Интернете.
Если вы ищете оригинальную версию Stable Diffusion, вы можете либо запустить ее на своем компьютере, либо получить доступ к бета-версии веб-интерфейса Dream Studio. Когда пользователи зарегистрируются в DreamStudio, им будет предоставлено 200 кредитов для использования в Stable Diffusion, но после этого за 1 фунт стерлингов (1,18 доллара США) можно будет купить 100 поколений. Между тем, за 100 фунтов стерлингов (~ 118 долларов США) можно купить 10 000 поколений.
Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное Stable DiffusionБета-версия Stable Diffusion может создавать фотореалистичные изображения 512×512 пикселей. Как и в случае с DALL-E, вы можете ввести текстовое приглашение, и система создаст изображение. Кроме того, он может создавать фотореалистичные произведения искусства, используя загруженное изображение в сочетании с письменным описанием.
Для обучения модели стабильной диффузии Stability AI использовал 4000 графических процессоров Nvidia A100 и вариант набора данных LAION-5B. Таким образом, Stable Diffusion способна генерировать суперкреативные изображения знаменитостей, персонажей мультфильмов и общественных деятелей, которые OpenAI не позволяет использовать с DALL-E 2.
Изображение «Брэд Питт в джунглях», созданное Stable DiffusionКачество изображения, созданные в Stable Diffusion, могут показаться очень впечатляющими. В уже ставшей вирусной публикации Reddit пользователь утверждал, что использовал текстовую подсказку в сочетании с наброском для создания гиперреалистичного изображения футуристического мегаполиса.
Однако Stable Diffusion может быть труднее освоить по сравнению с DALL-E, а бета-версия не так продвинута, как ее конкуренты. Может быть сложно правильно сбалансировать изображение и правильно сформулировать текстовую подсказку, чтобы создать желаемое изображение, хотя компания предоставляет руководство по этому вопросу.
Изображение «Хомяка, поедающего пиццу на гавайском пляже», созданного с помощью Stable DiffusionНо Stable Diffusion по-прежнему является замечательной технологией, а доступность программного обеспечения является поворотным моментом для создания изображений ИИ.
С чего начать : Чтобы использовать Stable Diffusion в веб-браузере, нажмите здесь. Чтобы загрузить Stable Diffusion на свой компьютер, щелкните здесь для получения более подробной информации.
Midjourney
Наряду с DALL-E и Stable Diffusion, Midjourney также считается одним из самых популярных и известных генераторов ИИ для преобразования текста в изображения.
Считающаяся одной из самых запоминающихся платформ для создания изображений с помощью ИИ, Midjourney попала в заголовки газет, когда один из ее пользователей выиграл конкурс изобразительного искусства, используя изображение, которое он создал с помощью программного обеспечения.
Изображение «Мужчины, делающего фотографию с помощью цифровой камеры», созданное MidjourneyВ некоторой степени Midjourney управляется через сервер Discord и использует команды бота Discord для создания высококачественных изображений в особенно художественном стиле. Пользователи могут вводить текстовое приглашение для создания четких и потрясающих изображений, которые, кажется, всегда имеют апокалиптическое или жуткое качество.
В отличие от DALL-E, Midjourney будет генерировать фотографии знаменитостей и общественных деятелей. Пользователи Discord часто используют программное обеспечение, чтобы творчески визуализировать своих любимых актеров в определенных ролях в кино.
Изображение «Брэда Питта в джунглях», созданное MidjourneyОдним из возможных недостатков Midjourney является то, что программное обеспечение очень стилизовано под генератор ИИ текста в изображение. Это делает практически невозможным создание фотореалистичных изображений в Midjourney.
Однако система никогда не предназначалась для создания реалистичных изображений, и это важная часть философии Midjourney как генератора ИИ.
«У нас есть стиль и внешний вид по умолчанию, они артистичны и красивы, и трудно оттолкнуть [модель] от этого», — говорит основатель Midjourney Дэвид Хольц.0012 Грань . «Может быть, если вы потратите 100 часов на попытки, вы сможете найти какое-то правильное сочетание слов, которое сделает его по-настоящему реалистичным, но вам придется очень постараться, чтобы оно выглядело как фотография».
«Мы стремимся сделать все красиво и художественно», — добавляет Хольц.
Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное MidjourneyЕсли у Midjourney есть один недостаток, так это то, что вам нужно использовать сервер Discord для размещения текстового приглашения, которое может быть сложно понять поначалу. . Интерфейс Discord также может быть разочаровывающим в использовании, и вы часто можете обнаружить, что ваше собственное искусство ИИ теряется среди множества других пользовательских запросов на канале.
Но, по словам Хольца, это всегда было преднамеренно, поскольку Midjourney задумывался как «социальный опыт». И, безусловно, может быть увлекательно наблюдать за художественными работами других пользователей, пока вы ждете, пока ваше изображение загрузится на Midjourney.
Итак, как вы используете Midjourney? Платформа Midjourney была открыта для всех в качестве бета-версии в июле. После того, как вы присоединились к серверу Midjourney Discord, генератор ИИ можно использовать в веб-интерфейсе Discord или в приложении Discord.
Чтобы создать обложку для Midjourney, вам нужно перейти на канал в Discord, например #newbies-126.
Оттуда вы вводите команду бота «/imagine» в канале Discord. Эта команда автоматически сгенерирует текст «prompt:». Это когда вы описываете то, что хотите видеть в виде изображения.
Вам необходимо ввести ключевые слова для вашего изображения после текста «приглашение:», иначе команда не будет работать. Затем вы нажимаете «Ввод» и ждете, пока ваше произведение будет создано.
Так, например, вы можете ввести «Хомяк, поедающий пиццу на гавайском пляже», и примерно через минуту ваше изображение должно быть сгенерировано среди других пользовательских запросов.
Изображение «Хомяк, поедающий пиццу на гавайском пляже», сгенерированное MidjourneyТри правила сервера Midjourney при создании иллюстраций: «не будь придурком, не используй бота для создания неприемлемого контента и уважай каждый.»
Первые 25 изображений на Midjourney бесплатны, а затем базовый план составляет 10 долларов в месяц за 200 изображений. Существует также стандартное членство в размере 30 долларов США в месяц для неограниченного использования. Midjourney позволит корпоративное использование сгенерированных изображений для специального корпоративного членства в размере 600 долларов США в год. В противном случае изображения принадлежат вам.
Как только вы освоитесь, Midjourney станет отличным генератором искусственного интеллекта, который постоянно создает потрясающие и часто наводящие на размышления изображения в своем собственном уникальном стиле.
С чего начать : Чтобы присоединиться к бета-версии Midjourney, нажмите здесь.
Craiyon (ранее DALL-E mini)
Craiyon, ранее называвшийся DALL-E mini, — это еще один генератор изображений с искусственным интеллектом, доступный онлайн.
Несмотря на то, что ранее он назывался DALL-E mini, Craiyon не имеет ничего общего с Open AI, кроме использования большого количества общедоступной информации, которую OpenAI предоставил для своей модели.
Изображение «Мужчина, делающий снимок цифровой камерой», созданное CraiyonВ отличие от DALL-E, Craiyon полностью бесплатен для использования и доступен для всех через его веб-сайт. Все, что вам нужно сделать, это ввести текстовое приглашение, и Craiyon займет около двух минут, чтобы создать изображения из интерактивной веб-демонстрации.
Еще одно ключевое отличие DALL-E от Craiyon заключается в том, что программное обеспечение вообще не подвергается цензуре, а это означает, что генератор ИИ примет абсолютно любое приглашение. Вы также можете заказать создание изображения в определенном стиле.
Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное CraiyonНо Craiyon, созданный инженером-программистом Борисом Даймой, не может сравниться с DALL-E и другими конкурентами по качеству изображения. Лица знаменитостей и мультфильмов часто могут быть незаметны в сгенерированном изображении.
Изображение «Брэда Питта в джунглях», сгенерированное CraiyonОднако это не означает, что Craiyon не умеет корчить рожи, просто от пользователя требуется много труда и усилий. Сообщается, что некоторые пользователи Craiyon обнаружили, что написание длинных и подробных подсказок с указанием размера и местоположения каждой части лица помогло создать более качественные лица на их художественных работах.
Изображение «Хомяк, поедающий пиццу на гавайском пляже», сгенерированное CraiyonТакже можно загрузить изображения, созданные вами на Craiyon, только в виде снимка экрана, а не в виде файла с высоким разрешением.
Возможно, это не самая современная система, но Craiyon представляет собой нефильтрованный и увлекательный генератор ИИ, к которому может легко получить доступ любой.
С чего начать : Чтобы использовать Craiyon, нажмите здесь.
TikTok
TikTok запустил базовый генератор изображений с искусственным интеллектом, который пользователи могут использовать для создания собственных зеленых экранов для своих видео.
Новый эффект видеоплатформы называется «Зеленый экран ИИ» и позволяет пользователям TikTok вводить текстовое приглашение, которое программа затем сгенерирует в виде изображения.
Зеленые экраны, сгенерированные инструментом искусственного интеллекта TikTokОднако базовый генератор преобразования текста в изображение далек от подобных DALL-E 2 и Midjourney, поскольку он создает только закрученные абстрактные изображения.
Обучение создателя изображений ИИ требует большой мощности компьютера, поэтому базовый вид набега TikTok является явным признаком сложности создания индивидуального сервиса изображений ИИ.
Инструмент TikTok подчеркивает взрыв популярности генераторов изображений с искусственным интеллектом и может стать первым шагом компании к этой растущей технологии.
С чего начать : Чтобы создать зеленый экран с искусственным интеллектом в TikTok, нажмите здесь.
Nightcafe AI
Nightcafe Studio позволяет создавать фотографии в различных стилях и предлагает различные предустановленные эффекты, от космических до масляной живописи и т. д.
Само название относится к Ночное кафе , картине Винсента Ван Гога. Платформы используют метод VQGAN + CLIP для создания ИИ-арта.
Платформа проста для новичков, и она известна тем, что имеет больше алгоритмов и опций, чем другие генераторы.
Для более совершенных генераторов художники могут регулировать вес слова в подсказке, добавляя модификаторы в «расширенном режиме». В этом варианте вы также можете контролировать соотношение сторон, качество и время выполнения цифрового искусства до того, как ИИ NightCafe создаст его. Любые ранее созданные произведения искусства могут развиваться, добавляя новые черты.
При регистрации в NightCafe пользователь получает пять бесплатных кредитов. И каждый день в полночь на счет будет поступать еще пять кредитов. Чтобы купить больше, вы можете использовать PayPal, Apple Pay, Shopify, Visa, Mastercard, Google Pay и American Express, чтобы покупать кредиты всего за 0,08 доллара США за кредит.
С чего начать : Чтобы использовать NightCafe, посетите его веб-сайт.
Генераторы изображений на основе искусственного интеллекта в сравнении друг с другом выявили существенные различия
Фабиан Штельцер недавно провел сравнительный тест изображений между тремя генераторами преобразования текста в изображение с искусственным интеллектом (ИИ): DALL-E, Midjourney и Stable Diffusion.
Стелцер опубликовал свои выводы в ветке Твиттера, где объяснил процесс, который включает в себя выдачу одинаковых подсказок для каждой машины и использование соотношения сторон 1:1.
Стелцер говорит PetaPixel , что он рассматривает каждую программу, которую он называет синтезаторами изображений, как «инструменты», где каждый генератор создает свой собственный стиль, тон и настроение.
«Я смотрю на эти синтезаторы изображений как на инструменты, каждый со своим тембром, сильными и слабыми сторонами», — объясняет он.
«Midjourney напоминает мне прекрасный аналоговый синтезатор Moog — почти невозможно заставить его звучать плохо, и с ним можно делать невероятные вещи, но взамен его диапазон более ограничен. Артефакты, которые он создает, похожи на аналоговые искажения, очень приятные».
Стельцер говорит, что, возможно, самый известный генератор изображений с искусственным интеллектом, DALL-E 2, похож на «синтезатор цифровой рабочей станции — невероятный диапазон, но почти всегда звучит слишком цифровой ».
«Stable Diffusion похож на сложный модульный синтезатор, из него можно получить почти любой тон, но играть и подсказывать немного сложнее».
Увлекательный эксперимент дает представление о том, как каждый генератор изображений ИИ интерпретирует инструкции, и дает подсказки к общему стилю изображения машины.
Midjourney имеет более мрачную атмосферу, чем два других. Возьмите изображение «За кулисами высадки на Луну». В то время как DALL-E 2 и Stable Diffusion создают гораздо более реалистичное изображение. Предложение Midjourney имеет апокалиптический оттенок, а астронавт выглядит так, будто он только что выпал из фильма ужасов.
Тем не менее, Midjourney, похоже, не может создать фотореалистичное изображение, Stable Diffusion лучше всего подходит для этого из испытания Стельцера.
«Синтезаторы изображений на основе ИИ произведут революцию в творчестве, чего мы не видели с момента появления фотографии — чем фотография была для живописи, синтезаторы изображений — для фотографий и чем кино было для театра, синтезаторы изображений предназначены для киносъемки», — говорит Штельцер из Берлина.