Обучение картинки: Обучение картинки для презентации — 78 фото — Главная

Содержание

Нейросеть рисует: как пользоваться новой фишкой

За короткое время графические нейронные сети превратились из развлечения для гиков в рабочий инструмент для иллюстраторов и контент-менеджеров. Всё труднее отличить изображения, созданные машиной, от нарисованных художниками. Нейросети могут помочь создать изображения для блогов, контента в соцсетях, NFT и многого другого.

В этой статье мы вместе поисследуем, как нейросети генерируют изображения, где это можно применить, а также протестируем разные сервисы для создания картинок.

Оглавление

Что такое нейросети
Пробуем рисовать картинку нейросетью: обзор сервисов
- Midjourney.com
- Crayon (бывшая Dall-E mini)
- ruDALL-E
- Starryai
- WomboArt
Какие ещё нейросети можно попробовать
Где и как использовать изображения от нейросетей

Что такое нейросети

Нейронная сеть — это набор алгоритмов, имитирующих работу человеческого мозга. Как и наш мозг, нейросеть распознаёт взаимосвязи между огромными объёмами данных. Она может накапливать знания и применять их на практике.

Нейронная сеть представляет собой систему из множества процессоров (аналогов нейронов в мозге). Простые по отдельности эти процессоры соединены в огромную сложную систему. Однажды запрограммированные или обученные, дальше нейросети учатся сами по себе. Благодаря этому они способны выполнять сложные задачи: собирать информацию, анализировать её или даже создавать новые данные. Сегодня нейросети могут классифицировать информацию, группировать данные и прогнозировать результаты.

Чтобы нейросеть могла всё это делать, сначала её необходимо обучить. Например, в случае создания картинки по тексту ей «показывают» текст и изображение. По сути, таким образом ей объясняют — это дом, а это дерево. Ведь для того чтобы генерировать новые изображения лиц, компьютер должен понимать, что такое лицо.

Когда пользователь отправляет в нейросеть свой запрос в форме текста, запрос преобразуется в набор цифр, а цифры внутри сети с помощью сложных алгоритмов превращаются в картинку.

Разработкой нейросетей занимаются специалисты по искусственному интеллекту и машинному/глубокому обучению (Machine Learning и Deep Learning). Таких специалистов пока ещё немного, а востребованность их высока. Оставим ниже несколько курсов по этой теме на случай, если вам интересно узнать, каким навыкам нужно обучиться, чтобы создавать нейросети.

Курс

Школа

Рейтинг

Стоимость

Рассрочка

Длительность

Ссылка

Machine Learning. Professional

OTUS

4.7

82 500 ₽

—

5 месяцев

Сайт школы

Профессия Machine Learning Engineer

Skillbox

4.6

190 765 ₽

6 154 ₽/мес

24 месяца

Сайт школы

Data Science & Machine Learning

Skillbox

4.6

100 000 ₽

—

48 месяцев

Сайт школы

Машинное обучение

Нетология

4.6

49 000 ₽

2 722 ₽/мес

5 месяцев

Сайт школы

Факультет искусственного интеллекта

GeekBrains

4. 4

150 975 ₽

4 194 ₽/мес

18 месяцев

Сайт школы

Machine Learning и Deep Learning

SkillFactory

4.4

63 000 ₽

—

5 месяцев

Сайт школы

Курс по нейронным сетям

SkillFactory

4.4

41 400 ₽

—

2.5 месяца

Сайт школы

Новая реальность вместе с ChatGPT

Inbox Marketing

0.0

5 000 ₽

—

Сайт школы

Больше курсов

Вы наверняка слышали о программах, которые могут преобразовывать речь в текст или распознавать лица. В их основе как раз лежит работа нейросетей.

Текстовая нейросеть Яндекса «Балабоба» продолжила первые две строки «Божественной комедии» Данте

В жизни искусственные нейронные сети можно использовать разными способами: в финансовых услугах, маркетинговых исследованиях, оценке рисков, развлекательной индустрии. Вот лишь несколько примеров практического применения нейросетей.

Приложение FaceApp, показывающее, как человек будет выглядеть через какое-то количество лет.
«Умные» плейлисты, например, Яндекс.Музыка или Spotify, которые делают уникальные подборки музыки на основе ваших интересов.
Прогнозирование погоды — специальные алгоритмы на основе нейронных сетей предсказывают метеорологические изменения с точностью до минуты.

Поиск в Google, Яндексе и любом другом сервисе — это большое количество алгоритмов, многие из которых основаны на нейросетях.

Нейросети ускоряют рутинную работу: классифицируют изображения, генерируют и классифицируют тексты и даже пишут музыку. Они также хорошо зарекомендовали себя для решения задач на основе визуальных данных.

Первая в мире обложка журнала, разработанная нейросетью DALL-E 2. Источник: cosmopolitan.com

Пробуем рисовать картинку нейросетью: обзор сервисов

Мы подобрали и опробовали несколько онлайн-сервисов, которые работают на основе нейронных сетей и могут создавать разные изображения. Некоторые приложения бесплатны и доступны всем желающим. Посмотрите вместе с нами, как нейросеть рисует по словам онлайн бесплатно и попробуйте сами. Только осторожно, можно залипнуть на весь день!

Midjourney.com

Сайт midjourney.com

Популярный сервис, который генерирует практически любые картинки по текстовому описанию. Работает только в формате бота в Discord.

Плюсы:

платформа с открытым доступом,
изображения получаются в хорошем разрешении,
высокая детализация картинок.

Минусы:

ограничение в 25 бесплатных генераций, после нужно оформлять платную подписку.

Где работает: в форме бота в популярном среди геймеров мессенджере Discord.

Условия использования. Первые 25 генераций картинок бесплатные, затем нужно оформлять платную подписку. 200 попыток генерации изображения в месяц — 10$⁣, безлимитный тариф — 30$. К сожалению, с российских карт оплатить подписку нельзя.

Как пользоваться. Сначала заходим на сервер Midjourney в Discord и присоединяемся к каналу. Если у вас нет учётной записи в этом сервисе, её нужно будет создать. Затем выбираем в меню слева один из чатов newbies и пишем в чате /imagine. Появляется плашка prompt.

После плашки вбиваем запрос на английском языке. Можно писать всё что угодно, кроме явно запрещённых вещей. Мы написали запрос «samurai dog on the streets of new york». Нажимаем «отправить».

Важно: в чат одновременно поступают десятки запросов от пользователей, поэтому уследить за своим может быть сложно. Если успеете, увидите, как нейросеть рисует ваш арт. В любом случае бот присылает в чат готовое изображение через несколько секунд. Найти готовое изображение можно в папке уведомлений в виде конверта, которая находится справа сверху.

Вот что получилось по нашему запросу.

Картинка по запросу «samurai dog on the streets of new york», сгенерированная Midjourney

Теперь сделаем более детализированный запрос: «A black french bulldog wearing a in formal suit and glasses, close-up photo,cinematic light, hyper realistic, 3d rendering, character design,25mm + extremely detailed + ultra-realistic, soft shadows + photorealistic skin».

Изображение получилось таким.

Подробный запрос на Midjourney даёт детализированное изображение

Crayon (бывшая Dall-E mini)

Сайт craiyon.com

Сервис Crayon — это бывший сайт Dall-E mini, который, в свою очередь, был упрощённой версией нейросети Dall-E 2. Dall-E 2 — самая продвинутая нейросеть по генерации изображений на основе текста, но к ней нет свободного доступа. Зато Crayon — совершенно открытый и бесплатный сервис.

Плюсы:

бесплатный и открытый сервис,
простой интерфейс.

Минусы:

изображения получаются низкого разрешения,
невысокая детализация.

Где работает: сервис работает на сайте craiyon.com и через телеграм-бот.

Условия использования: полностью бесплатный и без регистрации.

Как пользоваться.

На сайте не нужно авторизовываться и что-то настраивать, достаточно сформулировать запрос на английском и нажать на кнопку.

Простой запрос «samurai dog on the streets of new york» дал не самый вдохновляющий результат.

Изображение по запросу «samurai dog on the streets of new york» в Crayon

Но, например, марсианский пейзаж по описанию «martian landscape, cinematic light, 3d rendering, extremely detailed, ultra-realistic» получился довольно реалистичным.

Марсианский пейзаж, нарисованный в Crayon. Качество картинки зависит не только от нейросети, но и от текстового описания.

ruDALL-E

Сайт rudalle.ru

Генератор изображений по текстовому описанию и проект команды Sber AI, SberDevices, Самарского университета, AIRI и SberCloud. Качество изображений уступает тому же Midjourney, зато можно написать текстовый запрос на русском языке.

Плюсы:

бесплатный и открытый сервис,
простой интерфейс,
работает с запросами на русском языке,
в приложении можно сделать голосовой запрос.

Минусы:

время ожидания на сайте и в приложении 5–6 минут и больше,
изображения лишь частично соответствуют запросу.

Где работает: в приложении Салют, в боте в Discord и на сайте.

Условия использования: полностью бесплатный и без регистрации на сайте, в приложении нужно залогиниться под своим персональным Сбер ID.

Как использовать. Старая модель ruDALL-E по запросу «корова на летнем поле, иллюстрация, высокое качество», выдала следующий рисунок.

Картинка по запросу в rudalle.ru

В приложении «Салют», которое использует обновлённую модель ruDALL-E Kandinsky и голосового помощника, время ожидания составило ещё больше, около 7 минут. По тому же запросу про корову изображение получилось такое. Вы видите корову? И мы нет.

Рисунок нейросети в приложении «Салют» по запросу «корова на летнем поле, иллюстрация, высокое качество». Иногда нейросеть не слишком хорошо отражает запрос.

Starryai

Сайт create.starryai.com

Сервис создаёт изображения на основе текстовых описаний и позиционируется как нейросеть для генерации NFT. Приложение работает на основе трёх алгоритмов: Altair рисует фантазийные, сказочные картинки, Orion — более реалистичные и сложные, Argo задуман для создания художественных и продуктовых рендеров.

Плюсы:

бесплатный и открытый сервис,
простой интерфейс с удобными настройками.

Минусы:

есть ограничение в виде системы кредитов.

Где работает: на сайте.

Условия использования. Используется система кредитов, одна генерация — один кредит. Изначально пользователь получает 5 кредитов. Их также можно купить и заработать, например, посмотрев рекламу или поделившись своим артом в соцсетях.

Как использовать. В настройках сайта можно выбрать желаемый стиль изображения и загрузить картинку-референс. Также можно задать соотношение сторон готового изображения и время выполнения (чем дольше, тем качественнее готовая картинка и тем больше спишут кредитов). В день можно создавать до пяти изображений бесплатно.

Мы выбрали режим Altair и вбили запрос «Sunset At Sea, National Geographic Photo, Painting, Complex, Golden Hour, Landscape, Mysterious». Получилось симпатично.

Изображения морского заката, полученные на Starryai

WomboArt

Сайт и приложение для создания картинок и артов по заданной теме. В настройках сервиса можно выбрать художественный стиль и загрузить референс.

Плюсы:

бесплатный и открытый сервис,
простой интерфейс,
большой выбор стилей.

Минусы:

нельзя выбрать размеры изображения,
на изображение при скачивании добавляется водяной знак.

Где работает: на сайте и в приложении.

Условия использования: полностью бесплатный и без регистрации.

Как использовать. На сайте можно залогиниться, но это необязательно. В окне Prompt вбиваем текстовое описание на английском языке, у нас это будет «metal flower». Выбираем стиль realistic. Затем нажимаем Generate и ждём, пока нейросеть сгенерирует иллюстрацию. В конце можно сохранить картинку с помощью кнопки Save. Наш результат выглядит так.

«Metal flower» по версии WomboArt

Какие ещё нейросети можно попробовать

Сайты, где можно увидеть, как нейросети рисуют по словам, не ограничиваются нашей подборкой. Таких сервисов много и у всех есть свои особенности. Перечислим ещё несколько популярных.

ThisPersonDoesNotExist — генератор реалистичных фотографий лиц людей, которых на самом деле не существует.
Colorize.cc — сайт, где можно раскрасить чёрно-белое фото.
DALL-E 2 — способна генерировать высококачественные изображения, считается одной из передовых нейросетей. В 2022 году к системе открыли доступ в некоторых странах (России в списке нет).
GauGan 2 — генератор изображений ландшафтов, зданий.
Nvidia InPainting — сайт для замены изображений или удаления ненужных деталей на фотографии.

Где и как использовать изображения от нейросетей

В качестве иллюстраций для блога. Такой визуальный контент получается полностью оригинальным и можно не беспокоиться об авторских правах на изображение. К тому же нейросети часто рисуют в подчёркнуто фантазийном стиле, что используют авторы фанфиков и разнообразных артов. Более реалистичные картинки можно использовать в соцсетях и на сайтах.

Арт в стиле фэнтези. Источник: vk.com/midjourney_app

Для ретуши фотографий. Нейросети могут удалить ненужные детали с фото, поменять фон, омолодить, состарить человека на фото и добавить цвет в чёрно-белое изображение.

Фото, отреставрированное с помощью нейросети. Источник: naukatehnika.com

Создать реалистичное изображение человеческого лица. Алгоритмы генерируют фотографии несуществующих людей из тысяч реальных изображений.

Пример фото, сгенерированного на сайте thispersondoesnotexist.com

Создать логотип. Есть онлайн-сервисы, которые генерируют уникальные логотипы, если пользователь задал название компании, сферу деятельности, указал референсы и цветовую гамму.

Пример логотипа, созданного на сайте looka.com

Обучение модели с помощью LoRA (версия для десктопа). На примере датасета полученного из самой нейронки — Гайды на DTF

TLDR: Че тут происходит вообще? Я тут делюсь своим опытом по работе с нейронками. Если тебе эта тема интересна, но ты только начал вникать загляни ко мне в профиль или в конец статьи, там есть полезные ссылки. Сейчас это может быть слишком сложным для тебя.

3428 просмотров

Это расширение уже имеющейся статьи по обучению Лоры в гугл колабе. Я периодически буду ссылаться на нее. Полезно прочитать обе статьи. Все на примере Kohya ss.

В прошлый раз я делал что-то вроде этого:

Сегодня я научу вас тренировать модель на лицах, причем я буду использовать синтетический датасет, чтобы показать что это можно делать так же как и с фото людей.

Если в ходе установки или работы у вас возникнут какие-то проблемы вы можете обратиться за помощью в наш чат.

Установка:

Зависимости:

Установите Python 3.10 Убедитесь что при установке поставили галочку add Python to the ‘PATH’
Установите Git
Установите Visual Studio 2015, 2017, 2019, and 2022 redistributable

Предоставляем доступ для оболочки PowerShell, чтобы она могла работать со скриптами:

Запустите PowerShell от имени администратора (ПКМ по значку Windows — Windows PowerShell administrator)
Запустите команду Set-ExecutionPolicy Unrestricted ответьте ‘A’
Закройте PowerShell

Если в ходе выдачи доступа возникает ошибка в предоставлении этого самого доступа. Что-то вроде этого:

Оболочка Windows PowerShell успешно обновила вашу политику выполнения, но данный параметр переопределяется политикой, определенной в более конкретной области. В связи с переопределением оболочка сохранит текущую политику выполнения «Unrestricted». Для просмотра параметров политики выполнения введите «Get-ExecutionPolicy -List». Для получения дополнительных сведений введите «Get-Help Set-ExecutionPolicy».

Нажмите Win + R. Введите gpedit.msc. Энтер. Пройдите по пути как на скрине, дважды нажмите на “Включить выполнение сценариев”:

Далее. Ставим включить. В политике выполнения выбираем “Разрешить все сценарии”.

Закройте PowerShell.

Перейдите в папку где вы хотели бы хранить файлы скрипта. Нажмите на путь и введите вместо него PowerShell. Энтер. Так мы будем выполнять скрипты из этой папки.

Скопируйте скрипт ниже и вставьте в ваш PowerShell. Энтер.

git clone https://github.com/bmaltais/kohya_ss. git cd kohya_ss python -m venv venv .\venv\Scripts\activate pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 —extra-index-url https://download.pytorch.org/whl/cu116 pip install —use-pep517 —upgrade -r requirements.txt pip install -U -I —no-deps https://github.com/C43H66N12O12S2/stable-diffusion-webui/releases/download/f/xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl cp .\bitsandbytes_windows\*.dll .\venv\Lib\site-packages\bitsandbytes\ cp .\bitsandbytes_windows\cextension.py .\venv\Lib\site-packages\bitsandbytes\cextension.py cp .\bitsandbytes_windows\main.py .\venv\Lib\site-packages\bitsandbytes\cuda_setup\main.py accelerate config

Ждем пока не появится вот такая строка

Нажмите энтер, начнется настройка. Что вам нужно выбирать написано на скрине ниже.

Выбираем цифрами. 0 — это первый пункт, 1 — второй и т.д. Либо будет предложено ввести yes или no.

Опциональный блок для владельцев карт 30\40 серии:

Скачайте архив. Поместите папку из него (cudnn_windows) в корневую папку куда вы устанавливаете скрипты в данный момент. В командной строке, из корневой папки со скриптами выполните данные команды. По информации с гитхаба может дать значительный прирост скорости обучения.

.\venv\Scripts\activate python .\tools\cudann_1.8_install.py

На этом установка и настройка завершены. Если вы хотите обновить скрипты. То опять же. Запуск командной строки из папки со скриптами. Вставить. Энтер

git pull .\venv\Scripts\activate pip install —use-pep517 —upgrade -r requirements.txt

На этом вообще можно было бы и закончить и отправить вас читать версию для коллаба, но я продолжу

Тренируем:

Запустите оболочку через gui.bat

После запуска переходим на http://127.0.0.1:7860/?__theme=dark (ну или http://127.0.0.1:7861/?__theme=dark если был запущен автоматик)

Сразу переходим во вкладку Dreamboot LoRA. Тут нужно либо выбрать модель на вашем ПК нажав на белый листик и указав путь. Либо модель из списка. Она будет скачана скриптом.

v2 — Ставите галку если тренируете на второй версии диффузии

v_parameterization — если на версии 2.1 с параметризацией то и эту

Save trained model as — в каком формате будет сохранена ваша модель. Для автоматика, на текущую дату, оставляйте safetensors.

После выбора модели идем на вкладку Folders. Я буду пробовать тренировать на Deliberate 2. Хотя обычно делаю это на SD 1.5.

Image folder — Тут указываем папку на ваш датасет, не прямо на картинки с описанием, а на папку, где эта самая папка лежит.

Как подготовить дата сет я писал в гайде по коллабу, так как эта инфа верна на 101% и для этого способа, чтобы не раздувать статью просто прочитайте часть про датасет по ссылке.

Output folder — папка куда будет сохранен файл модели

Regularisation folder — папка в регуляризационными фотографиями. Если кратко нужны, чтобы избавиться от стиля. Туда кладутся фотки без какой-то стилизации напоминающие то на что вы тренируете. Я ни разу не использовал. По идее если хотите натренировать на стилизованного персонажа можно выбрать туже папку с датасетом. Видел как так делают. Работает ли? Не знаю

Logging folder — укажите куда будут сохраняться логи.

Model output name — имя итогового файла модели. Только файла. К ключевому слову тригеру отношения не имеет. Тригер задается в датасете.

Training comment — просто комментарий который будет добавлен в метедату файла модели.

Идём на Training parameters:

Lora type — что-то новенькое. Судя по репозиторию LoCon должен обучать модель более эффективно. Но сегодня без экспериментов. (Для меня. Вы конечно попробуйте и поделитесь результатом)

LoRA network weights — указать путь к уже существующей Лора, чтобы продолжить тренировку.

Caption extension — расширение файлов подсказки. Те самые которые должны лежать у вас рядом с картинками вашем датасете. у меня это “.txt”.

Train batch size — Оставляю 1. Эта настройка может ускорить обучение, но в тоже время это происходит из за того что сеть берет сразу несколько картинок и берет как бы среднее значение между ними. Логично что жрет VRAM так что у кого мало много не выкрутить.

Epoch — сколько эпох. Если просто это кол-во проходов по вашему датасету. Например, у вас два варианта. Оставить тут 1, а папку с датасетом назвать 100_keyword, тогда сеть пройдет по картинкам 100 раз. А можно назвать папку 10_keyword. Поставить 10 эпох. Значит сеть пройдет 10 раз по 10 в итоге снова 100. Но эпохи можно сохранять в разделе Save every N epochs. Поставив например 2. У вас в итоге получится 5 файлов Лора каждый из которых натренирован на разном количестве проходов. Это удобный способ избежать недотренированности\перетренированности, вы просто проверяете все файлы и оставляете лучший.

Mixed precision и Save_precision — точность. Все ставят fp16 и я ставлю. Хотя моя карта поддерживает bf16 и она вроде как точнее и потребляет меньше памяти, но я что-то меняю когда что-то не получается. А тут все получается.

Number of CPU threads per core — количество потоков на ядро. У меня два. У вас гуглите.

Learning rate scheduler — кривая обучения. Не уверен, что вы захотите это читать. Кратко, по какой кривой менять скорость обучения. Мне нравится constant. То есть, не меняется.

seed — хорошая идея его фиксировать для обучения. Потому что например вы сделали Лору, а она не ок. Как можно быть уверенным что просто не повезло с сидом? Такое бывает. Сид не лег на тренировку. Поэтому можно оставить тот же сид, но поменять параметры. Или наоборот, поменять сид не меняя параметры.

Learning rate — он перекрывается Юнит леарнинг рейтом. Не трогаю.

LR warmup (% of steps) — разминочные проходы на низкой скорости. Для константы ставлю 0

Cache latent — кэширует некоторые файлы, что ускоряет обучение.

Text Encoder learning rate — управляет тем как ИИ понимает текстовые подсказки. Если ваша модель выдает слишком много нежелательных объектов(могла нахвататься с вашего дата сета) уменьшите это значение. Если наоборот объекты плохо проявляются. Увеличьте или вместо этого увеличьте количество шагов обучения. Стандартное значение 5e-5 что равно 0.00005. Его и оставлю

Unet learning rate — что-то вроде памяти, имеет информацию о том как элементы взаимодействуют друг с другом. Первое куда стоит смотреть если обучение не получилось. Сначала рекомендую пройтись со стандартными параметрами и что-то крутить только когда вроде все должно было получиться, но не получилось. Если итоговая модель выдает визуальный шум вместо нормального изображения то значение слишком высокое. попробуйте слегка уменьшить и повторить. Тоже не трогаю

Network Rank (Dimension) — ****во первых это повлияет на итоговый размер вашего файла Лора, примерно 1 за 1 мегабайт. Во вторых чем выше значение тем выше выразительность вашего обучения. 128 как по мне является хорошим соотношением. Его оставляем, но если вашей итоговой модели этой самой выразительности не хватает попробуйте увеличить. Быстрая скорость обучения развязывает руки для экспериментов.

Network Alpha — во первых это значение должно быть ниже либо равным network_dim и нужно для предотвращения ошибок точности. Чем ниже значение тем сильнее замедляет обучение. Зачем замедлять обучение? Это точно в другой раз, иначе эта статья не кончится 😅. Я ставлю равным Network Rank (Dimension).

Max resolution — Максимальное разрешение

Stop text encoder training — когда остановить кодер. Никогда не использовал и не видел чтобы кто-то как-то применял.

Enable buckets — даст возможность использовать изображения не квадратным соотношением сторон, обрезав их. Но лучше готовить датасет нормально.

Дополнительные настройки:

Flip augmentation — Если набор совсем маленький можно попробовать включить. Дополнительно создаст отраженные версии картинок

Clip skip — Нейросеть работает слоями. Эта цифра означает сколько последних слоев мы хотим пропустить, обычно она выбирает в зависимости от модели. Тут стоит два так как колаб был рассчитан на аниме модель. Чем раньше остановились тем меньше слоев нейросети обработали подсказку. Комментарий с вики: Некоторые модели были обучены с использованием такого рода настроек, поэтому установка этого значения помогает добиться лучших результатов на этих моделях. Я поставлю 1. Я не тренил на делиберейт и не знаю что тут на самом деле лучше.

Memory efficient attention — если не хватает памяти

Noise offset — Если коротко дает диффузии больше простора для внесения изменений. В основном влияет на яркость\затемненность картинки. Длинно тут. В прошлом гайде ставил 0, с того момента кое-что почитал, ставлю 0.1. Сможем делать более темные и светлые картинки чем по дефолту.

Resume from saved training state — если тренировка по какой-то причине была прервана тут вы можете ее продолжить. Чтобы такая возможность была, поставьте галку на Save training state.

Optimizer — В подробном объяснение будут такие слова как квантование, стохастические градиенты и так далее. Оставляем по умолчанию. Я видел тесты людей, и этот показывал себя хорошо. Думаю ничего не изменилось.

Все настройки можно сохранить чтобы не вбивать заново. В самом верху раскройте меню. Укажите папку куда хотите сохранить, имя файла и расширение json. Save

Итоговые настройки у меня будут такие(дополнительные по умолчанию):

Они зависят от того на чем и что тренируете, если что-то сработает для меня не значит что так же сработает и у вас.

Мой датасет выглядит вот так(выложил на своем бусти, 768х768). Он синтетический, то есть сгенерирован, я натренирую так чтобы бы это лицо я мог вызывать по желанию на разных моделях. Рекомендуется использовать 25-30 фотографий если речь о лице. Для стиля можно и 100, но их можно и не описывать. Посмотрим чего можно добиться с 8ю и с неидеально совпадающей внешностью.

Как видите моя версия файла настройки и название будущего файла Лора совпадает, рекомендую делать так же.

Колличество проходов по папке установлено в 20*5 эпох 100 проходов. Это по каждой картинке, а картинок у нас 8 итого получим 800 проходов. Для лица это нормальная цифра.

Процесс пошел:

Через несколько минут наши лора готовы. У меня они сразу лежат где надо так как я указал сохранять их в папку с лора.

Генерируем:

Rev Animated

Deliberate:

Модели разные, а лицо одинаковое. Чтд. Идеальны ли они? Конечно нет. Перечислю ошибки которые вам лучше не допускать чтобы результаты были лучше.

Подход к датасету. У меня он синтетический(это не плохо, просто я не готовил его специально, а взял первое попавшееся), они не супер похожи, он очень маленький и так же важно то что разрешение было 512, а лица на фото мелкие, для лица лучше тренировать на фотографиях примерно от верхней части груди это самое близкое и по пояс самое далекое. (Примерно!).

Тренировка на разрешении 768 чуть улучшило бы ситуацию. Но я этого делать не буду. Это был урок, о том как тренировать на ПК, так как многим не удобно пользоваться коллабом. Как это делать хорошо и на разных вещах таких как предметы, персонажи целиком, стили и тд. В следующих гайдах. Подписывайтесь 🙄.

Поделиться результатом или задать вопрос вы можете в нашем комьюнити.

Больше гайдов на моем канале, подписывайтесь чтобы не пропустить:

На моем бусти вы сможете найти датасеты для обучения, доп материалы к гайдам.

Дрессировка с помощью картинок с Дейвом Кройером: Учимся учиться, DVD

Дрессировка с помощью картинок с Дэйвом Кройером: Учимся учиться, DVD

Это исчерпывающее руководство по первым 6-8 месяцам жизни или работы со щенком, получившее 7 международных наград. собака с 10-кратным членом команды World Team Дэйвом Кройером! Известный как учитель тренеров, спортсмен и тренер, Дэвид Кройер и его ученики стояли на подиумах на аренах Schutzhund/IPO, Mondio и French Ring Sport, Police K9., послушание AKC, маневренность, SAR и отслеживание AKC. Он представлял Соединенные Штаты на международном уровне в нескольких мировых командах, получив известность как внутри страны, так и за рубежом. Дэйв, изучающий поведение животных, подходит к обучению интуитивно, расчетливо и использует инструменты и методы многих дисциплин и стилей в системе обучения, которая помогла его ученикам добиться национального и международного успеха.

В большинстве систем обучения постоянное подкрепление в непосредственной близости от дрессировщика создает искусственную «привязь», которая является постоянным препятствием для успешной работы на расстоянии. Дейв полностью обходит эту проблему с самого начала с 7-недельными щенками путем целенаправленного обучения. Сама процедура целенаправленного обучения устанавливает понимание необходимости работать вдали от вознаграждения для его достижения. Это основа для успешных двигательных упражнений, отталкивания, охраны объекта, указания запаха, тренировки ловкости с препятствиями, прыжков и многого другого.

Как только цель достигнута, Дейв демонстрирует первые два этапа соревновательной тренировки гребли у стены и с помощью упражнения, которое он называет «Вход». Гимнастические навыки формируются с помощью «Вращения», которое учит гибкости и осознанию задних конечностей, необходимых для поворотов влево, вправо, вокруг и вокруг поворотов. Установление двигательных паттернов также обусловлено, чтобы избежать распространенных ошибок, возникающих при обучении извлечению и отзыву. Эти базовые упражнения формируют основу для правильного законченного поведения щенков и взрослых собак, будь то новички или переучивающиеся.

Благодаря детальному и систематическому прогрессу собаку учат полностью усваивать основную концепцию «сначала поведение, а затем вознаграждение», которую многие системы дрессировки с трудом достигают. Неспособность достичь свободного владения этой концепцией — одна из самых постоянных проблем, с которыми Дейв сталкивается на семинарах. Многие собаки никогда не достигают своего полного потенциала из-за препятствий, создаваемых самим процессом обучения: стремление к вознаграждению (отслеживание знаков), обучение поведению или позициям, а не истинное участие, работа ИЗ-ЗА вознаграждения, а не ради вознаграждения и многое другое. УЧИТЬСЯ УЧИТЬСЯ — это первый шаг не только к достижению целей в соревновательной рабочей собаке, но и к созданию сильного, интерактивного ученика, который понимает свою часть процесса!

Благодаря четкому, систематическому подходу, который приводит к прочному партнерству, основанному на доверии, надежном, чистом диалоге и привычке к правильной работе, методы в системе Дейва постоянно демонстрируют, как создать картину превосходства и сформировать из вашей собаки нетерпеливую, желающий, интерактивный ученик, способный добиться успеха, к которому вы стремитесь, независимо от дисциплины.

Эта игра, содержащая подробные обучающие кадры, красивую иллюстрированную графику и пошаговое развитие первых 8 месяцев системы Дэйва, идеально подходит для тех, кто хочет получить обширную и всестороннюю базу в собачьем спорте. Это название является многомерным, и концепции, которым его обучают, полезны для ЛЮБОГО вида спорта с собаками: послушания клуба собаководства, IPO, спорта на ринге, аджилити, работы с носом, полиции K9 и других. В этом названии представлены редкие кадры отца классического условного рефлекса Ивана Павлова и его экспериментов со слюнными выделениями. Полезно для владельцев щенков, дрессировщиков проблемных собак или всех, кто хочет получить более четкое представление о том, как изолировать поведение. Всем, кто хочет создать динамичного, интерактивного работника при установлении общего языка, это название просто необходимо!

16: 9 Расчетный DVD

Военно-обучающий фондовый фтои Und Bilder

Creative
Редакция
Videos

Beste übereinstimling

Обучение картинки: Обучение картинки для презентации — 78 фото

Нейросеть рисует: как пользоваться новой фишкой

Что такое нейросети

Пробуем рисовать картинку нейросетью: обзор сервисов

Midjourney.com

Crayon (бывшая Dall-E mini)

ruDALL-E

Starryai

WomboArt

Какие ещё нейросети можно попробовать

Где и как использовать изображения от нейросетей

Обучение модели с помощью LoRA (версия для десктопа). На примере датасета полученного из самой нейронки — Гайды на DTF

Дрессировка с помощью картинок с Дейвом Кройером: Учимся учиться, DVD

Военно-обучающий фондовый фтои Und Bilder

Добавить комментарий Отменить ответ