Нейросеть онлайн фото: Нейросетевой эффект для фото онлайн

Содержание

Генерация картинок нейросетью: 5 бесплатных онлайн-сервисов

21.10.2022

ПродвинутыйИскусственный интеллект

ПродвинутыйИскусственный интеллект

#Искусственный Интеллект

Главное

  • Нейросеть — это искусственный интеллект, который работает по принципу человеческого мозга. Нейроны получают, обрабатывают и отдают информацию, а связи передают ее. Главное отличие нейронов компьютерной сети в том, что их нужно постоянно обучать. Человек же расширяет нейросеть, когда сам учится чему-то новому.
  • В последние годы компьютерные нейросети получили большое развитие. В основном их используют для задач, где нужно обработать текст, видео, аудио и другую информацию.
  • Особую популярность приобрели нейросети, способные быстро генерировать изображения из текстового запроса, совмещать графические объекты или воссоздавать недостающие элементы, в том числе человеческие лица. Они не заменяют работу дизайнеров и художников, но помогают оптимизировать рутинные процессы.

Как нейросети генерируют изображения

Нейросеть — программа, способная к самообучению, однако ее работу нужно «дорабатывать» и совершенствовать в ходе практики. Пользователь нейросети вносит новую в нее информацию о том, как выглядят элементы, добавляет их названия, с помощью определенных алгоритмов «учит» программу  находить одинаковые и различные фрагменты. Это похоже на то, как маленькие дети запоминают по картинкам животных, цвета, буквы алфавита.

Например, в поиске Google по изображению тоже задействована нейросеть, которую научили анализировать картинки и определять сходства. После загрузки исходного изображения нейросеть «прогоняет» ее по своей базе, сравнивая с другими, и предлагает похожие.

По подобному принципу нейросети генерируют иллюстрации по текстовому запросу. Вы задаете названия объектов и существ, описываете их, а алгоритм набирает все возможные элементы из своей базы, чтобы выразить ваше сообщение. Некоторые нейросети не распознают текст, но могут применять к готовым решениям визуальные эффекты, стили и элементы других изображений.

Хотя направление нейросетей в последние годы проделало большой путь, и такие программы все более эффективны, сгенерированным изображениям еще далеко до настоящего искусства. Поэтому переживать, что иллюстраторы и художники останутся без работы, пока не приходится. Тем не менее, в публичном доступе уже есть десятки сервисов, которые позволяют сгенерировать изображения онлайн. ForkLog нашел пять таких ресурсов.

DALL-E 2

Нейросеть DALL-E 2 — продукт одной из ведущих компаний по разработке ИИ, OpenAI. Эта программа работает на основе современного и популярного алгоритма GPT-3, также созданного OpenAI. Вторая версия DALL-E способна анализировать текстовые запросы на английском языке и быстро генерировать изображения на их основе.

В октябре 2022 года состоялся публичный релиз сервиса, что позволило свободно регистрироваться в сервисе и пользоваться им. Сейчас система генерирует более 2 млн изображений в день. В то же время, чтобы создать профиль в DALL-E 2, понадобится номер телефона из ограниченного списка стран.

Портрет Сатоши Накамото, сгенерированный DALL-E 2. Данные: ForkLog

В новой версии нейросети доступна функция Outpanting. С ее помощью пользователь может дорисовать готовое изображение. Программа сохраняет тени, отражения, структуры, цветовые сочетания в крупномасштабной версии картинки.

Регистрация в DALL-E 2 бесплатная. После активации аккаунта у пользователя есть 50 кредитов: кредит списывается при отправке очередного текстового запроса. Со второго месяца количество кредитов уменьшится до 15, и накапливать их будет нельзя, однако можно купить.

Функционалом DALL-E 2 уже пользуются компании и известные бренды. Например, журналы Cosmopolitan и The Economist использовали нейросеть для генерации изображений для своих обложек. Microsoft запустила на базе сервиса собственное приложение Designer, которое может генерировать различный контент: тексты, рекламные баннеры, открытки, логотипы и т. п.

Deep Dream Generator

Deep Dream Generator — платформа не только для создания, но и для редактирования изображений с возможностью бесплатной генерации нескольких картинок после регистрации профиля. На сайте проекта доступно три формата работы.

Text 2 Dream

Генерация картинки из текста. Неоходимо ввести запрос, который описывает желаемое изображение, и нейросеть соберет его по своим алгоритмам. Также доступен список уже готовых запросов, например стиль рисования и имя художника, творчество которого будет использовано в качестве референса.

Хотя в целом режим Text 2 Dream выдает любопытные и художественные результаты, его изображения не дотягивают до уровня DALL-E 2. Это касается и интепретации слов, и качества картинки. Процесс создания занимает немного больше времени.

Изображение, сгенерированное Deep Dream Generator по запросу «NFT-единорог верхом на Space X в космосе». Данные: ForkLog

Deep Dream

Этот инструмент позволяет проводить глубокую обработку исходного изображения с помощью алгоритмов ИИ. Для этого нужно загрузить файл оригинала и задать параметры: начальная глубина проработки, уровень вовлечения ИИ и номер «слоя». Последний означает, насколько сильно найросеть преобразует изображение: изменения могут быть поистине существенными.

Deep Style

Сервис обработки изображений, который использует в качестве графических фильтров направления и жанры искусства. Для использования Deep Style нужно загрузить исходное изображение и выбрать референсную картинку из списка. 

Пользоваться Deep Dream Generator можно бесплатно, однако ограниченное время. При регистрации начисляют 30 баллов, которые снимают за использование инструментов: по 5 баллов за один запрос в Deep Style и Text 2 Dream и по 2 балла за Deep Dream. Дополнительные баллы платные: самый дешевый тариф стоит $19 в месяц и дает лимит 120 баллов, который восстанавливается со скоростью 12 баллов в час.

Hotpot

Hotpot — еще один условно бесплатный сервис, в котором есть услуга создания картинокк по текстовому запросу. Кроме самого запроса нужно задать тип визуального эффекта картинки и желаемый размер. Нейросети нужно от 2 до 20 секунд для обработки результата, но, если сайт будет перегружен, ожидание может затянуться до 2 часов и даже целого дня. Минус бесплатной версии — медленная скорость генерации и небольшой размер изображений.

На практике долгое ожидание по обработке начинается после четвертой попытки сгенерировать новую картинку. Чтобы не тратить время на обработку запросов, Hotpot предлагает оплачивать их кредитами. Их можно приобрести пакетом или оформить подписку. Например, 800 кредитов стоят $10, а при ежемесячной оплате 1000 кредитов доступны за $10.

Изображение, сгенерированное Hotpot по запросу «Биткоин-максималист». Данные: ForkLogИзображение, сгенерированное Hotpot по запросу «Питер Гриффин получил зарплату в биткоине». Данные: ForkLog

На готовое изображение можно наложить фильтры, добавить текст, отредактировать цветопередачу и др. Есть возможность преобразовать картинку в NFT. Также в Hotpot есть множество услуг, связанных с обработкой изображений: восстановление, колоризация, улучшение лиц, удаление объектов и фона и другие.

Кроме того, скоро в Hotpot будет сервис для помощи в написании текстовых запросов под названием AI Sparkwriter. Для тех, кто хочет генерировать большие объемы изображений, Hotpot предоставляет API.

Hotpot также предлагает платные функции генерации NFT-коллекций, состоящих из множества изображений. Для этого предусмотрено несколько инструментов: Collection Mixer помогает комбинировать разные объекты из загружаемых пользователем изображений, AI NFT Photo Maker накладывает слои на оригинальные изображения. При поштучном создании цифровых предметов требуется также купить лицензию сервиса.

Night Cafe

Популярный генератор картинок, который не просто собирает графические элементы из поисковой системы, а встраивает их относительно выбранного вами стиля.

Основной сервис нейросети — Text To Image. Он рисует различные визуализации Coherent, Artistic или Stable. В ответ на запрос программа генерирует сразу 4 варианта картинки, которые можно скачать без водяного знака и в высоком качестве.

Создавать картинки здесь можно без регистрации. На старте вам присваиют 5 кредитов, стоимость одной генерации — 1 кредит. Как только триал-версия закончится, за каждый новый кредит нужно будет платить по $0,08. Также баллы начисляют за активность в сообществе: публикацию сообщений, комментарии и другие действия.

Несмотря на то, что Night Cafe использует различные готовые графические элементы, все права на владения готовыми изображениями принадлежат пользователю.

Dream by WOMBO

На сайте Dream можно генерировать изображения без регистрации. Также программа доступна в виде мобильного приложения для Android и iOS. Для получения новых изображений достаточно заполнить текстовый запрос, выбрать стиль визуализации и подождать 10-20 секунд. Нейросеть выдает картинки, которые можно скачать или опубликовать в ленте на сайте сервиса.

Кроме того, готовые изображения в Dream можно выпустить в виде NFT в сети Ethereum или Polygon. Для этого нужен Web3-кошелек. Эмиссия токена бесплатная, но нужно заплатить комиссию сети.

Минус сервиса: изображения генерируются в рамке и в невысоком разрешении.

Картинка, сгенерированная в Dream по запросу «Розовый единорог». Данные: ForkLog

Что еще почитать

Что такое искусственный интеллект?

Что такое машинное обучение?

Что такое дипфейк?

Что такое обработка естественного языка?

Что такое трансформеры в машинном обучении?

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Материалы по теме

Нейросеть аниме: создаем персонажей из фото

Нейросети для генерации, объединения или редактирования изображений мгновенно становятся популярными. Это доказывает пример Lensa, которая встроила в приложение генератор аватаров на основе ваших загруженных фотографий. Но новое китайское приложение имеет еще больший потенциал, ведь оно обещает превратить каждую фотку в кадр из аниме.

Нейросеть, которая создает аниме персонажей

Многие любители аниме хотели бы представить себя рисованными персонажами. Знакомые художники больше не нужны: теперь каждый желающий может за секунды превратить любую свою фотографию в кадр из аниме.

Называется эта нейросеть «Маленький мир». Как и у большинства китайских сервисов и сайтов, созданных для жителей Поднебесной, UX-дизайн у нее мягко говоря «специфический».

Сервис максимально прост в использовании и понятен даже без знания китайского — тут есть лишь одна кнопка. При нажатии на нее появляется кадр с фотографией девушки, а под ним еще одна кнопка. Нажав на эту вторую кнопку, вы можете выбрать на компьютере нужное изображение и загрузить его на сервис. Несколько секунд — и результат «аниме-преображения» готов.

В качестве результата вам показывается видео с преображением вашей фотографии. Чтобы получить фото «до/после», надо развернуть страницу сайта на полный экран и нажать внизу левую кнопку, верхний край которой еле виден. Впрочем, сайт сделан скорее под мобильные устройства, поэтому, возможно, с телефонов пользоваться им будет удобнее (но это не точно).

Продвинем ваш бизнес

В Google и «Яндексе», соцсетях, рассылках, на видеоплатформах, у блогеров

Подробнее

Аниме-персонажи из фотографий

Конечно, мы протестировали возможности нейросети. Вот как преобразилось фото с моего паспорта:

Китайская нейросеть генерирует аниме персонажей

Попробовал еще раз — получил другой результат (посмотрите на левую часть усов, волосы и одежду):

Китайская нейросеть генерирует аниме персонажей

Приятель попробовал — вот что вышло у него:

Китайская нейросеть генерирует аниме персонажей

А вот это получилось, когда я загрузил его фотографию в нейросеть:

Персонажи аниме от нейросети

В общем, результат всегда оказывается разный, сколько раз ни загружай одну и ту же фотку. Мы предполагали, что это не нейросеть, а просто накладывание на фото фильтра, стилизующего картинку под аниме. Но тот факт, что сервис выдает каждый раз разные фотки, меняя черты лица, задний фон или другие детали, означает, что работает он при помощи нейросети. И мы даже знаем, какой.

Все дело в том, что сервис находится на поддомене основного сайта qq.com — китайского мессенджера, созданного компанией Tencent. У этой же компании есть проект ARC — лаборатория, занимающаяся, в том числе, нейросетями. Несколько алгоритмов связаны с обработкой изображений — вы можете сами протестировать их по этой ссылке. Один из алгоритмов позволяет улучшать качество изображения в аниме, мы предполагаем, что описанный выше сервис строится на этих нейросетях.

Еще один факт в подтверждение «нейросетевой» природы сервиса — программа иногда принимает морщины за руку:

Ошибка нейросети

А у вас получилось сгенерировать анимешного аналога себя самого? Кидайте результат в комментарии.

Аналоги аниме нейросети Tencent

После всплеска популярности сервера нейросети Tencent стали давать сбои из-за наплыва пользователей. Поэтому, если вдруг эта нейросеть стала недоступной, у нее есть один аналог — китайское приложение Meitu. В этой статье мы рассказали, как им пользоваться.

Читайте также:

Сбер обновил свою нейросеть – тест Kandinsky 2.0

Нейросеть от ​​DeviantArt возмутила художников. Она крадет их работы

Нейросеть DALLE 2 теперь доступна всем

13 лучших генераторов изображений с искусственным интеллектом, которые вы можете попробовать в 2022 году

Искусственный интеллект меняет ландшафт многих отраслей, и одной из областей, где ИИ оказывает большое влияние, является создание изображений.

Существует множество генераторов изображений с искусственным интеллектом, которые преобразуют текст в изображения с использованием алгоритмов искусственного интеллекта. Эти инструменты искусственного интеллекта могут стать отличным способом быстро превратить ваши идеи или концепции в визуальные представления всего за несколько секунд.

Итак, какой генератор изображений с искусственным интеллектом лучше? В этой статье мы рассмотрим 13 лучших генераторов изображений с искусственным интеллектом на рынке в 2022 году.

Мы также обсудим плюсы и минусы каждого создателя изображения AI, чтобы вы могли выбрать тот, который подходит вам лучше всего. Давайте начнем.

Содержание

  • Что такое генератор изображений ИИ?
  • 13 лучших генераторов изображений AI
  • №1. Фотор
  • №2. Ночное кафе
  • №3. Мечта от WOMBO
  • №4. ДАЛЛ-Е 2
  • №5. Середина путешествия
  • №6. Dream Studio (стабильная диффузия)
  • №7. Мел
  • №8. Генератор глубоких снов
  • №9. Звездный AI
  • №10. Артбридер
  • №11. Фотосоник
  • №12. Глубокий ИИ
  • №13. Большой сон
  • Заключительные мысли

Что такое генератор изображений AI?

Генератор изображений AI — это инструмент, который можно использовать для создания реалистичных изображений из текста. Такой инструмент основан на алгоритме глубокого обучения, который был обучен на большом наборе изображений и соответствующих им описаний.

Генераторы изображений ИИ можно использовать для различных целей, например, для создания вдохновения для ваших творческих проектов, визуализации ваших идей, изучения различных сценариев или концепций или просто для развлечения с ИИ.

Вы можете использовать генераторы изображений AI, чтобы быстро создавать изображения пейзажей, животных, объектов, персонажей, 3D-моделей или чего-либо еще, что вы можете себе представить, и изменять их с помощью различных параметров настройки и деталей.

13 лучших генераторов изображений AI

1. Генератор изображений AI от Fotor

Fotor, онлайн-редактор фотографий с миллионами пользователей по всему миру, недавно выпустил генератор изображений с искусственным интеллектом.

Его очень легко использовать. Вам просто нужно ввести текстовые подсказки и посмотреть, как генератор искусственного интеллекта Fotor преобразует текст в изображение за считанные секунды. Вы можете использовать его для создания реалистичных изображений лиц, трехмерных и аниме-персонажей, картин и цифрового искусства любого типа.

Самое приятное в генераторе изображений AI от Fotor заключается в том, что его можно использовать бесплатно и вы можете экспортировать сгенерированное изображение в полном разрешении. Это отличный вариант как для начинающих, так и для продвинутых пользователей.

Основные характеристики :

  • 10 бесплатных поколений изображений в день
  • 2 модели преобразования изображений: текст в изображение и изображение в изображение
  • Режим быстрой генерации изображений
  • Возможность создавать отличные изображения из текста
  • 9 различных стилей преобразования на выбор

2.

Ночное кафе

NightCafe — один из самых популярных на рынке генераторов преобразования текста в изображения с помощью ИИ. Говорят, что у него больше алгоритмов и опций, чем у других генераторов. Он поставляется с 2 моделями преобразования: текст в изображение и перенос стиля.

Текст в изображение: вам просто нужно ввести текст описания, и NightCafe автоматически сгенерирует изображение соответствующей сцены на основе вашего описания.

Передача стиля: загрузите изображение в NightCafe, и оно превратит ваши изображения в стиль известных картин.

NightCafe основан на кредитной системе. Чем больше у вас кредитов, тем больше изображений вы можете создать. Вы можете зарабатывать кредиты, участвуя в сообществе или совершая покупки.

Основные характеристики:

  • Простота использования
  • Быстрый процесс создания изображения
  • 5 бесплатных поколений изображений в день
  • Различные художественные стили на выбор
  • Возможность генерировать изображения высокого разрешения для печати

3.

Мечта от WOMBO

Dream by WOMBO был создан канадским стартапом в области искусственного интеллекта WOMBO. Многие считают его лучшим универсальным генератором изображений AI из текста.

Процесс использования Dream by WOMBO очень похож на NightCafe. Напишите предложение, выберите художественный стиль, и пусть Dream by WOMBO сгенерирует изображение для вас.

Одна из лучших частей Dream от WOMBO заключается в том, что он позволяет загружать изображение в качестве эталона, чтобы вы могли создавать изображения, которые лучше соответствуют вашему видению.

Основные характеристики:

  • Простота использования
  • Доступны различные художественные стили
  • Неограниченное количество генераций изображений бесплатно
  • Продавайте сгенерированные изображения как NFT

4. ДАЛЛ-Е 2


DALL-E 2 — это передовой генератор изображений с искусственным интеллектом, разработанный OpenAI, той же командой, которая создала GPT-3, лучший алгоритм машинного обучения на естественном языке.

Таким образом, DALL-E 2 становится самым передовым генератором изображений с искусственным интеллектом на рынке, который может создавать различные цифровые изображения и иллюстрации из текста.

Просто введите текст, и Dall-E 2 создаст серию изображений на основе вашего текста. Вы можете использовать его для создания иллюстраций, дизайна продуктов и генерирования новых идей для бизнеса.

Одной из лучших функций DALL-E 2 является кисть, которая позволяет добавлять к изображению такие детали, как тени, блики, цвета, текстуры и т. д.

Основные характеристики:

  • Создание нескольких изображений за раз в минутах
  • Превосходное качество и точность изображения
  • Возможность редактирования сгенерированных изображений

5. Середина пути


Midjourney также является одним из лучших генераторов изображений ИИ с широкими возможностями и чрезвычайно быстрой генерацией изображений. Введите текстовое приглашение, и пусть Midjourney сделает все остальное.

Многие художники используют Midjourney для создания изображений, которые они хотят использовать в качестве вдохновения для своей работы.

Картина с искусственным интеллектом «Пространственный театр Оперы», созданная с помощью Midjourney, получила первый приз в конкурсе изобразительного искусства на Ярмарке штата Колорадо, обойдя 20 других художников.

Однако на данный момент Midjourney размещается на сервере Discord. Чтобы создавать изображения с помощью MidJourney, вы должны присоединиться к его серверу и использовать команды бота Discord для создания изображений. Но это легко, вы можете легко начать работу в течение нескольких минут.

Основные характеристики:

  • Легко начать
  • Быстрое создание изображения, сгенерированного ИИ
  • Отличное качество сгенерированных изображений
  • 4 выходных изображения за раз

6.

Dream Studio (стабильная диффузия)

В настоящее время Dream Studio, также известная как Stable Diffusion, является одним из самых популярных генераторов искусственного интеллекта для преобразования текста в изображение. Это модель с открытым исходным кодом, которая преобразует текстовые подсказки в изображения за считанные секунды. Кроме того, он может создавать фотореалистичные произведения искусства, комбинируя загруженную фотографию и письменное описание.

Dream Studio можно использовать для создания фотографических изображений, иллюстраций, 3D-моделей, логотипов и практически любого изображения, которое вы можете себе представить.

Основные характеристики:

  • Быстрое создание изображений ИИ
  • Создание нескольких изображений за раз
  • Результаты отличаются высоким качеством
  • Параметры настройки для редактирования сгенерированных изображений AI
  • Доступ к API

7.

Мел

Craiyon ранее назывался DALL-E mini. Он был разработан исследователями Google и Hugging Face. Просто введите текстовое описание, и оно сгенерирует 9различные изображения, сделанные из введенного вами текста.

Craiyon — отличный бесплатный генератор изображений с искусственным интеллектом, для которого не требуется страница регистрации. Вы можете ввести любые ключевые слова и через несколько минут увидеть созданное AI изображение!

Основные характеристики:

  • Простота использования
  • Не требуется регистрация или регистрация
  • Неограниченное бесплатное создание изображений ИИ
  • Создание 9 изображений за раз забавным и творческим способом

8. Генератор глубоких снов


Deep Dream — популярный онлайн-инструмент для создания изображений с искусственным интеллектом. Он очень прост в использовании и поставляется с набором инструментов искусственного интеллекта для создания визуального контента.

Deep Dream может генерировать фотореалистичные изображения из текстовых подсказок, объединять базовое изображение с известным стилем рисования или генерировать новое изображение на основе исходного изображения, используя глубокую нейронную сеть, обученную на миллионах изображений.

Основные характеристики:

  • Простота использования
  • Способность создавать реалистичные и абстрактные изображения
  • 3 модели ИИ на выбор

9. Звездный AI


StarryAI — это автоматический генератор изображений AI, который превращает изображения в NFT. Он может обрабатывать изображения с помощью алгоритмов машинного обучения и не требует ввода данных пользователем.

Одна из лучших особенностей StarryAI заключается в том, что он предоставляет вам полное право собственности на созданные изображения, которые можно использовать в личных или коммерческих целях.

Основные характеристики:

  • Быстрый и простой в использовании
  • Приложение для создания изображений AI для устройств Android и iOS
  • Может использоваться как генератор NFT
  • Возможность создавать реалистичные изображения, абстрактные изображения и рендеринг продукта

10.

Артбридер

Используя машинное обучение, Artbreeder создает креативные и уникальные изображения путем их повторного микширования. Вы можете использовать его для создания пейзажей, анимированных персонажей, портретов и других изображений.

Однако качество сгенерированных изображений не такое хорошее, как у других генераторов изображений AI.

Одной из дополнительных функций Artbreeder является то, что он предлагает тысячи иллюстраций и позволяет пользователю управлять ими в папках и загружать их в формате JPG или PNG.

Основные характеристики:

  • Создание различных вариантов изображения
  • Создавайте пейзажи, персонажей аниме, портреты и многое другое
  • Управление иллюстрациями в папках, загружаемых в форматах JPG и PNG

11. Фотосоник


Photosonic — это веб-инструмент для создания изображений с искусственным интеллектом, который позволяет создавать реалистичные или художественные изображения из любого текстового описания, используя современную модель искусственного интеллекта для преобразования текста в изображение. Он позволяет вам контролировать качество, разнообразие и стиль изображений, сгенерированных ИИ, путем корректировки описания и повторного запуска модели.

Основные характеристики:

  • Легко и быстро использовать
  • 10 бесплатных поколений изображений
  • Полные права на использование сгенерированных изображений в любых личных или коммерческих целях
12. DeepAI

Это генератор искусственного интеллекта для преобразования текста в изображение. Его модель искусственного интеллекта основана на Stable Diffusion и может создавать изображения с нуля из текстового описания.

DeepAI бесплатен и позволяет создавать неограниченное количество изображений, каждое из которых уникально. Он также имеет бесплатный API преобразования текста в изображение, который разработчик может использовать для подключения к другому программному проекту. Однако качество не такое фотореалистичное, как у других генераторов изображений AI, перечисленных в этой статье.

Основные характеристики:

  • Простота использования
  • Неограниченное количество поколений изображений бесплатно
  • Доступ к API преобразования текста в изображение
  • Создавайте уникальные и креативные изображения AI

13. Большой сон


Big Sleep — это генератор изображений с искусственным интеллектом из текста, который основан на Python и использует нейронную сеть для создания изображений. Он находится на GitHub и имеет открытый исходный код.

Основные характеристики:

  • Бесплатно
  • Способность создавать отличные изображения из текста
  • Возможность экспорта изображений с разрешением до 1024×1024

Последние мысли

Являетесь ли вы профессиональным графическим дизайнером или просто случайным пользователем, который хочет повеселиться, создавая изображения, для вас есть генератор изображений с искусственным интеллектом. С таким количеством вариантов на выбор, легко найти тот, который лучше всего соответствует вашим потребностям. Мы надеемся, что этот список помог вам сделать именно это!

Передача произвольного стиля в браузере

Передача произвольного стиля в браузере

  • Стилизация изображения
  • Совместить два стиля

Размер изображения содержимого
Выбрать содержимоеСделать снимокВыбрать из файлаstatadianagolden_gatebeachchicagostatue_of_liberty

Размер изображения стиля
Выбрать стильВыбрать из файлаСлучайное изображение из wikiart. orgudniestripesbrickscloudstowerssketchgzaportred_circleszigza0003


Сила стилизации

Style A Size
Select a styleSelect from fileRandom image from wikiart.orgudniestripesbrickscloudstowerssketchseaportred_circleszigzag

Style B Size
Select a styleSelect from fileRandom image from wikiart.orgudniestripesbrickscloudstowerssketchseaportred_circleszigzag

Content image size «/>
Select contentTake a pictureSelect from filestatadianagolden_gatebeachchicagostatue_of_liberty


Коэффициент стилизации

[Быстро] Дистиллированная модель в стиле MobileNet (9,6 МБ) [Высокое качество] Оригинальная модель в стиле Inceptionv3 (36,3 МБ)

[Быстро] Трансформатор Separable_conv2d (2,4 МБ) [Высокое качество] Оригинальная модель трансформера (7,9 МБ)

Что это?

Это реализация алгоритма передачи произвольного стиля работает исключительно в браузере с использованием TensorFlow.js. Как и все нейронные алгоритмы передачи стиля, нейросеть пытается «нарисовать» один картинка, Содержание (обычно фотография), выполненная в чужом стиле, Стиль (обычно живопись).

Хотя существуют и другие реализации переноса стилей в браузерах, обычно они ограничены заранее выбранным набором стилей из-за требование об обучении отдельной нейронной сети для каждого образ в стиле.

Передача произвольного стиля обходит это ограничение, используя отдельная сеть в стиле , которая учится разбивать любое изображение на 100-мерный вектор, представляющий его стиль. Этот вектор стиля затем подается в другую сеть, трансформаторная сеть , вдоль с изображением содержимого, чтобы создать окончательное стилизованное изображение.

Я написал сообщение в блоге объясняя этот проект более подробно.

Мои данные в безопасности? Вы видите мои фотографии?

Ваши данные и изображения никогда не покидают ваш компьютер! Фактически, это одно из главных преимуществ работы нейронных сетей в вашем браузере. Вместо того, чтобы отправлять нам ваши данные, мы отправляем *вам* как модель *и* код для запуска модели. Это тогда запускается вашим браузером.

Что это за разные модели?

В исходной статье используется модель Inception-v3. как сеть стилей, которая занимает ~ 36,3 МБ при переносе в браузер как FrozenModel.

Чтобы сделать эту модель меньше, MobileNet-v2 был используется для извлечения знаний из предварительно обученного Inception-v3 сеть стилей. Это привело к уменьшению размера чуть менее чем в 4 раза, с ~36,3 МБ до ~9.6MB, за счет некоторого качества.

Для трансформаторной сети в оригинальной статье используется модель, использующая простые сверточные слои. При портировании на браузера, эта модель занимает 7,9 МБ и отвечает для большинства расчетов при стилизации.

Чтобы сделать модель трансформатора более эффективной, большую часть простые слои свертки были заменены разделяемыми по глубине извилины. Это уменьшило размер модели до 2,4 МБ, а резко повысить скорость стилизации.

Эта демонстрация позволяет использовать любую комбинацию моделей, по умолчанию к сети в стиле MobileNet-v2 и разделяемой свертке трансформаторная сеть.

Насколько велики модели, которые я загружаю?

Сеть в дистиллированном стиле составляет ~ 9,6 МБ, в то время как разделяемая свертка сеть трансформатора составляет ~ 2,4 МБ, в общей сложности ~ 12 МБ. Так как эти модели подходят для любого стиля, вы только нужно скачать их один раз!

Как работает сочетание стилей?

Поскольку каждый стиль можно сопоставить со 100-мерным вектор стиля сетью стилей, мы просто берем средневзвешенное значение двух, чтобы получить новый вектор стиля для трансформаторной сети.

Это также то, как мы можем контролировать силу стилизации. Мы берем средневзвешенное значение стиля векторов и контента и стилевых изображений и использования это вход в трансформаторную сеть.

Является ли код открытым исходным кодом?

Ага! Код размещен на Github.

Кредиты

Это демо было собрано Рейичиро Накано. но не обошлось без следующего:

  • Авторы переводная бумага произвольного стиля.
  • Репозиторий Magenta для передачи произвольного стиля.
  • Авторы статьи MobileNet-v2.
  • Авторы статьи, описывающей дистилляцию знаний нейронной сети.
  • Библиотека TensorFlow.js.
  • Сотрудничество Google, с которым я смог провести все необходимые тренировки, используя бесплатный (!) GPU.
    Нейросеть онлайн фото: Нейросетевой эффект для фото онлайн

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Пролистать наверх