E foto: E-FOTO download | SourceForge.net — Главная

Содержание

Сплиттер для микрофона PSE-MIC-E: фото, характеристики, сертификаты

Главная
Каталог
Сетевое оборудование
Оборудование для PoE

Код товара: 2045

630

Цена с НДС

Купить

Сплиттер для микрофона. Предназначен для питания микрофонов и другого оборудования напряжением 12 В от кабеля сети Ethernet, запитанного по технологии PoE. Устанавливается в разрыв между POE-коммутатором и IP-видеокамерой. Диапазон входного напряжения — 27…57 В, выходное напряжение — 12 В, выходной ток — 200 мА. Скорость передачи данных 10/100/1000 Мбит/с. Поддерживает питание PoE по стандартам 802.3af и 802.3at (методы A и B). Расширенный температурный диапазон — -40°C… +50°C. Встроенный фильтр. Защита от внешних помех. Компактные размеры. Бескорпусное исполнение.

Расширенная гарантия.

Код товара: 2045

Сплиттер для микрофона. Предназначен для питания микрофонов и другого оборудования напряжением 12 В от кабеля сети Ethernet, запитанного по технологии PoE. Устанавливается в разрыв между POE-коммутатором и IP-видеокамерой. Диапазон входного напряжения — 27…57 В, выходное напряжение — 12 В, выходной ток — 200 мА. Скорость передачи данных 10/100/1000 Мбит/с. Поддерживает питание PoE по стандартам 802.3af и 802.3at (методы A и B). Расширенный температурный диапазон — -40°C… +50°C. Встроенный фильтр. Защита от внешних помех. Компактные размеры. Бескорпусное исполнение.
Расширенная гарантия.

630

Цена с НДС

Купить

Описание
Характеристики
Гарантия
Документация

Сплиттер для микрофона PSE-MIC-E предназначен для питания микрофонов и другого оборудования напряжением 12 В постоянного тока от кабеля сети Ethernet, запитанного по технологии PoE.

Изделие поддерживает питание PoE по стандартам 802.3af и 802.3at (методы A и B).

PSE-MIC-E подключается в разрыв Ethernet-кабеля, идущего от PoE-коммутатора / инжектора к IP-камере. На колодку ВЫХОД 12 В подаётся напряжение 12 В для питания микрофона. На нижней стороне платы присутствует двухсторонний скотч для крепления.

Особенности PSE-MIC-E

питание микрофонов и другого оборудования напряжением постоянного тока 12 В с током нагрузки 0,2 А;
защита от внешних помех;
защита от импульсных помех за счёт встроенного фильтра питания;
возможность использования на улице при установке в герметичный корпус.

Технические характеристики PSE-MIC-E

1	Входное напряжение, В		27…57
2	Номинальное напряжение на колодке ВЫХОД, В		12
3	Ток на колодке ВЫХОД, А, не более		0,2
4	Скорость передачи данных, Мбит/с		10 / 100 / 1000
5	Рекомендуемый тип кабеля		Cat5e UTP
6	Сечение провода, зажимаемого в клеммах выходной колодки 12 В, мм²		0,2. ..1
7	Габаритные размеры ШхГхВ, мм, не более	без упаковки	55х40,5х16
		в упаковке	80х80х40
8	Масса, НЕТТО (БРУТТО), не более, г		16 (29)
9	Диапазон рабочих температур, °С		-40…+50
10	Относительная влажность воздуха при 25°С, %, не более		80
	ВНИМАНИЕ! Не допускается наличие в воздухе токопроводящей пыли и паров агрессивных веществ (кислот, щелочей и т.п.)
11	Степень защиты оболочкой по ГОСТ 14254-2015		IP20

Специально для пользователей оборудования «Бастион» мы увеличиваем срок гарантии на ключевые линейки.

Пожизненная гарантия распространяется на срок службы, указанный в паспорте каждого товара.

Расширенную гарантию можно получить практически на всю продукцию компании.

Мы уверены в качестве своего оборудования и готовы поделиться своей уверенностью с вами.

Получить расширенную (от 1,5 до 7 лет) или пожизненную (на весь срок службы прибора: от 10 до 60 лет) гарантию можно в нашем профессиональном сообществе – Профи-клубе.

Стандартная гарантия
1,5 года

фото, характеристики и полный разбор нового электрического кроссовера

Хочешь узнавать о горячих и интересных автомобильных новостях первым? Подписывайся на наш Telegram!

В ближайшие недели компания Next Car привезет в Украину первый экземпляр электрического кроссовера Ford Mustang Mach-E. По этому случаю редакция решила подробно изложить (а кому-то может просто напомнить) о том, что же представляет собой этот автомобиль.

Начнем с того, что Ford Mustang Mach-E – это второй электромобиль марки после Ford Focus Electric (снят с производства). Однако если «Фокус» был создан из бензиновой машины (то, есть, это была, по сути, обычная переделка), то Мач-И – созданный с нуля электрокар. Благодаря такому правильному подходу у фордовцев получился отличный автомобиль.

Дизайн Ford Mustang Mach-E

Слово «Мустанг» неспроста присутствует в названии модели. Во многом электрокроссовер вдохновлен решениями легендарной американской модели (в частности, у его кузова такие же линии), но при этом отличается полностью сплошной «решеткой радиатора». ДНК оригинального пони-кара прослеживается в длинном и мускулистом капоте, приподнятых задних крыльях, «острых» фарах с хитрым прищуром, а также трёхсекционных блоках фонарей.

Внутри модель отличается большим 15,5″-дюймовым экраном мультимедиа – через него водитель управляет большей частью настроек машины. Слева – за рулевым колесом – находится еще один большой дисплей: как несложно догадаться, речь идет о полностью цифровой приборной панели.

Mustang Mach-E обладает хорошим габаритами: его длина составляет 4,71 м, ширина — 1,93 м, высота — 1,62 м. Кроссовер может принять на борт до 5 пассажиров, вместительность багажника — 402 литра. Также есть еще отсек для поклажи спереди (под капотом) объемом 81 литр.

Длина	4713 мм
Ширина со свернутыми зеркалами	1930 мм
Ширина с развернутыми зеркалами	2097 мм
Высота	1624 мм
Колесная база	2984 мм
Радиус разворота	11,6 м
Объем багажника	402 литра
Объем багажника при сложенных сиденьях	1420 литров
Объем багажника спереди	81 литр

Силовая установка Ford Mustang Mach-E

Ford Mustang Mach-E заявлен с двумя типом приводов. Заднеприводные версии развивают мощность от 269 до 294 л.с. и крутящий момент в 430 Нм, полноприводные варианты — от 269 до 351 л.с. и тягу в 580 Нм. Также есть модификация GT, мощность которой достигает 456 л.с., а крутящий момент — 830 Нм.

Водитель может выбрать один из трех режимов движения, которые будут менять характеристики автомобиля и его поведение на дороге: Engage, Whisper и Unbridled.

Версия	Мощность	Тяга	Разгон 0-100 км/ч
Mach-E 76 кВтч, задний привод (Mach e)	269 л.с.	430 Нм	6,9 c
Mach E 99 кВтч, задний привод (Mach e X)	294 л.с.	430 Нм	7,0 c
Mach-E 76 кВтч полный привод (Mach e 4)	269 л. с.	580 Нм	6,3 c
Mach-E 99 кВтч полный привод (Mach e 4 X)	351 л.с.	580 Нм	5,8 c

Батареи и запас хода Ford Mustang Mach-E

Чтобы лучше адаптироваться к потребностям своих клиентов, Ford предлагает две батареи на выбор. Первая – емкостью 75,7 кВтч, она состоит из 288 литий-ионных элементов и дает запас хода от 400 до 440 км по циклу WLTP (оценка) в зависимости от выбранного типа силовой установки. Вторая АКБ уже идет до 98,8 кВтч, в ней 376 ячеек, а заявленный запас хода — от 540 до 610 км без подзарядки.

На оба аккумулятора Ford предлагает гарантию сроком на 8 лет или 160 000 км пробега.

Емкость	75,8 кВтч	98,8 кВтч
Кол-во ячеек	288	376
Запас хода RWD	440 км	610 км
Запас хода AWD	400 км	540 км
Запас хода GT	Н.Д.	500 км

Зарядка Ford Mach-E

Зарядный лючок Ford Mustang Mach-E расположен на левом переднем крыле автомобиля, под ним прячется комбинированный разъем чарджера. Машина с младшей АКБ способна заряжаться с максимальной мощностью в 115 кВт, со старшей – 150 кВт.

В домашних условиях Mach-E можно заряжать от бытовой розетки или настенного бокса мощностью от 7 до 12 кВт.

Производство и цены Ford Mustang Mach-E

Ford Mustang Mach-E собирается в Мексике, но это глобальная модель: ее продают, в том числе, в Европе, где за вариант с задним приводом просят от 48 990 евро, а за версии 4х4 – от 65 500 евро. Поставки машины американцы начали с «First Edition» — полноприводной версии с аккумулятором большей емкости. Вскоре за ней последуют заднеприводные и обычные полноприводные версии. А вот модификацию GT выпустят позже — ее поставки должны начаться не раньше лета 2021 года.

Емкость АКБ	Запас хода	Привод	Мощность	Цена
76 кВтч	440 км	Задний привод	269 л. с.	€49 990
76 кВтч	400 км	Полный привод	269 л.с.	€56 500
99 кВтч	610 км	Задний привод	294 л.с.	€56 500
99 кВтч	540 км	Полный привод	351 л.с.	€65 500

Автор: Виталий Сазонов

Цифровое фото
Спонсируется
Один из лучших фото- и видеоредакторов Zoner Photo Studio X (ZPS X) часто дополняется обновлениями и по-прежнему стоит всего 59 долларов в год. Обновления этого года наверняка придутся по вкусу более чем 100 000 пользователей Zoner в США (и миллионам по всему миру). Улучшения включают в себя увеличенное рабочее пространство, более быстрый рабочий процесс и поддержку файлов изображений RAW для более чем 50 дополнительных камер. И вишенка на торте: новые возможности Zonerama.

Усовершенствования рабочего процесса

Токены метаданных: Вы сэкономите время и количество нажатий клавиш благодаря автозаполнению. Вам больше не нужно вручную вводить строки формата метаданных (ISO, дата, местоположение, выдержка и т. д.) для предварительного просмотра и пакетных операций. Просто начните вводить необходимую информацию, а ZPS X автоматически заполнит остальные. Конечно, вы можете настроить результаты в соответствии с вашими потребностями. Лучше всего то, что ранее сохраненные строки формата автоматически преобразуются в токены метаданных. Просмотр в модуле разработки: Одной из лучших функций ZPS X долгое время был сверхэффективный доступ к просмотру/редактированию/печати/и т. д. все режимы в рамках одного программного обеспечения. Сделав еще один шаг вперед, браузер теперь доступен в модуле «Разработка». Пользователи могут сэкономить время и переключаться между режимом редактирования и режимом браузера, просто дважды щелкнув. Индивидуальные настройки папок: Для большего удобства и эффективности теперь вы можете настроить каждую папку на сортировку и фильтрацию в соответствии с вашими потребностями. Создайте настройки отображения по умолчанию для остальных папок. Полноэкранное рабочее пространство для фотографий: Теперь пользователи могут использовать весь свой монитор при редактировании фотографий. В режиме полного просмотра пользователи могут скрыть все, что им кажется ненужным, но при этом получить доступ ко всем функциям ZPS X, тем самым предлагая совершенно новый уровень настройки.

Обновлена поддержка обработки файлов RAW

Добавлено более 50 новых моделей: Zoner Photo Studio X поддерживает все популярные полнокадровые беззеркальные камеры, цифровые зеркальные камеры и высококачественные компакты. В ходе непрерывного и высокоточного процесса каждая новая поддерживаемая модель камеры подвергается строгому профилированию DCP при полном спектральном освещении, контролируемом спектрофотометром. Результатом являются реалистичные цвета при просмотре и редактировании на калиброванном мониторе. Посмотрите видео о поддержке файлов Native RAW здесь. Новые профили DCP: Существуют также новые профили DCP, которые индивидуально откалиброваны для камер, которые в настоящее время поддерживаются, с невероятно точными, истинными цветами, которые на уровень выше конкурентов. Перфекционисты берут на заметку.

Улучшения Zonerama

Неограниченное хранилище Zonerama Бесплатно для пользователей Zoner: Zonerama — это бесплатная онлайн-галерея фотографий и видео, размещенная Zoner для пользователей Zoner Photo Studio X. Для пользователя это бесплатно, а пространство для хранения файлов не ограничено. Да, пользователям предоставляется неограниченное пространство для фотографий и видео — в исходном, несжатом формате. Доступ к файлам изображений защищен индивидуальными настройками конфиденциальности и общего доступа. Весной 2022 года Zonerama добавила второй центр обработки данных во Флориде, чтобы обеспечить еще более быструю загрузку фотографий. Делитесь альбомами Zonerama: В последней версии пользователи Zonerama теперь могут делиться альбомами. Это означает, что пользователь может создать общий альбом и пригласить других добавить свои изображения в пул. Какой отличный способ поделиться фотографиями из отпуска, отпуска и событий. Как и все Zonerama, альбомы и изображения защищены, поэтому вам не нужно беспокоиться о том, что посторонние вторгаются в вашу личную жизнь. Видео 4K и формат AV1 на Zonerama: Zoner поддерживает разрешение до 4k и включает новый формат AV1 для каждого пользователя Zonerama. Наслаждайтесь самыми красивыми видео, которые вы можете создавать, хранить и публиковать в Интернете — бесплатно.

Обзор Zoner Photo Studio X

Если вы еще не являетесь пользователем Zoner Photo Studio X, вот некоторая информация, которая может оказаться полезной. Штаб-квартира Zoner Inc, основанная в 1993 году, расположена в Чешской Республике и США, а дополнительные корпоративные офисы расположены в Северной Америке, Центральной Европе и Японии. В настоящее время программой Zoner Photo Studio пользуются более 100 000 клиентов в США и миллионы клиентов по всему миру. В прошлом году (2021) ZPS X получил две престижные награды за Лучшее программное обеспечение для редактирования фотографий от всемирно известных ассоциаций TIPA и EISA. Загрузите полнофункциональную бесплатную 30-дневную пробную версию и убедитесь сами. Лицензия на Zoner Photo Studio X стоит всего 59 долларов в год или 5,99 долларов в месяц.

Что такое Zoner Photo Studio X?

Zoner Photo Studio X — недорогой, но очень мощный программный инструмент Windows для просмотра, управления, улучшения, редактирования и печати фото- и видеофайлов, включая формат Raw. Zoner Photo Studio X имеет пять интерфейсных модулей, представленных в виде вкладок с метками «Менеджер», «Разработка», «Редактор», «Печать» и «Видео». Вы можете удобно переключаться с одного модуля на другой, не выходя из программы Zoner. Также есть гибкие варианты компоновки рабочего пространства. Кроме того, вы можете выбрать представление «Браузер» и просмотреть все изображения в определенной папке, не выходя из рабочего пространства Photo Studio. Используйте ZPS X для редактирования изображений JPEG и RAW (включая использование слоев и масок) и с легкостью выполняйте все операции обрезки, удаления дефектов, клонирования и других операций с фотографиями. Уникальная кисть для ретуширования и инструмент «Черты лица» в подменю «Пластика» позволяют легко улучшить портрет. Редактировать видео. Превратите свои фотографии в видео, презентацию или замедленную съемку, не переключая программное обеспечение. Наслаждайтесь творческими пресетами. Измените все настроение фотографии одним щелчком мыши (одна из самых популярных функций в ZPS X). Каталогизируйте изображения для удобной организации и поиска. Просмотрите их по дате, месту съемки, ключевым словам или папкам.

Заключение

Не верьте нам на слово, убедитесь сами. Загрузите полнофункциональную бесплатную 30-дневную пробную версию для ПК с Windows и убедитесь сами. Если вам нравится обрабатывать ваши изображения и видео в рабочем пространстве Zoner Photo Studio X, вы можете приобрести лицензионный ключ всего за 59 долларов США в год или 5,99 долларов США в месяц.

DALL·E: создание изображений из текста
Прочитать код paperView
DALL·E — это версия GPT-3 с 12 миллиардами параметров, обученная генерировать изображения из текстовых описаний с использованием набора данных пар текст-изображение. Мы обнаружили, что он обладает разнообразным набором возможностей, включая создание антропоморфных версий животных и объектов, правдоподобное объединение несвязанных концепций, рендеринг текста и применение преобразований к существующим изображениям.

См. также: DALL·E 2, который создает более реалистичные и точные изображения с 4-кратным увеличением разрешения.

Текстовая подсказка

иллюстрация редиски дайкон в пачке, выгуливающей собаку

изображения, сгенерированные искусственным интеллектом . . . .

Сгенерировано ИИ
изображения

Подсказка редактирования или просмотра дополнительных изображений

Текстовая подсказка

витрина магазина, на которой написано слово «openai». . . .

изображения, созданные искусственным интеллектом

Подсказка редактирования или просмотра дополнительных изображений больше изображений

GPT-3 показал, что язык можно использовать для указания большой нейронной сети выполнять различные задачи по генерации текста. Image GPT показал, что тот же тип нейронной сети можно использовать для создания изображений с высокой точностью. Мы расширили эти результаты, чтобы показать, что манипулирование визуальными понятиями с помощью языка теперь доступно.

Обзор

Как и GPT-3, DALL·E представляет собой языковую модель преобразователя. Он получает и текст, и изображение в виде единого потока данных, содержащего до 1280 токенов, и обучается с использованием максимальной вероятности генерировать все токены один за другим. ^[1] Эта обучающая процедура позволяет DALL·E не только генерировать изображение с нуля, но и регенерировать любую прямоугольную область существующего изображения, простирающуюся до нижнего правого угла, таким образом, чтобы это соответствовало тексту. быстрый.

Мы понимаем, что работа с генеративными моделями может иметь значительные и широкие социальные последствия. В будущем мы планируем проанализировать, как такие модели, как DALL·E, связаны с социальными проблемами, такими как экономическое влияние на определенные рабочие процессы и профессии, потенциальная систематическая ошибка в результатах модели и долгосрочные этические проблемы, связанные с этой технологией.

Возможности

Мы обнаружили, что DALL·E может создавать правдоподобные образы для самых разных предложений, исследующих композиционную структуру языка. Мы проиллюстрируем это с помощью серии интерактивных изображений в следующем разделе. Образцы, показанные для каждой подписи в визуальных элементах, получены путем выбора 32 лучших из 512 после повторного ранжирования с помощью CLIP, но мы не используем никакого ручного выбора, кроме миниатюр и отдельных изображений, которые появляются снаружи. ^[2]

Управление атрибутами

Мы проверяем способность DALL·E изменять несколько атрибутов объекта, а также количество его появления.

Нажмите, чтобы отредактировать текстовую подсказку или просмотреть больше изображений, созданных искусственным интеллектом

зеленые пятиугольные часы. зеленые часы в форме пятиугольника.

navigationdownwide

navigationupwide

Текстовое приглашение

Генерируемые AI
изображения

Мы обнаружили, что DALL·E может отображать знакомые объекты в многоугольных формах, которые иногда вряд ли встречаются в реальном мире. Для некоторых объектов, таких как «рамка для картины» и «тарелка», DALL·E может надежно нарисовать объект любой из многоугольных форм, кроме семиугольника. Для других объектов, таких как «крышка люка» и «знак остановки», вероятность успеха DALL·E для более необычных форм, таких как «пятиугольник», значительно ниже.

Для некоторых визуальных элементов в этом посте мы обнаружили, что повтор подписи, иногда с альтернативными формулировками, улучшает согласованность результатов.

navigationupwide

куб из дикобраза. куб с текстурой дикобраза.

navigationdownwide

navigationupwide

Текстовая подсказка

Созданные искусственным интеллектом
изображения

Мы обнаружили, что DALL·E может наносить текстуры различных растений, животных и других объектов на трехмерные тела. Как и в предыдущем изображении, мы обнаружили, что повторение подписи с альтернативной формулировкой улучшает согласованность результатов.

navigationupwide

коллекция очков лежит на столе

navigationdownwide

navigationupwide

Текстовая подсказка

Созданные AI
изображения

Мы обнаружили, что DALL·E может рисовать несколько копий объекта сделать это, но не может надежно сосчитать до трех. Когда предлагается нарисовать существительные, для которых есть несколько значений, таких как «стаканы», «чипсы» и «чашки», он иногда рисует обе интерпретации, в зависимости от используемой формы множественного числа.

navigationupwide

Рисование нескольких объектов

Одновременное управление несколькими объектами, их атрибутами и их пространственными отношениями представляет собой новую задачу. Например, рассмотрим фразу «ежик в красной шапке, желтых перчатках, синей рубашке и зеленых штанах». Чтобы правильно интерпретировать это предложение, DALL·E должен не только правильно скомпоновать каждый предмет одежды с животным, но и сформировать ассоциации (шапка, красный), (перчатки, желтый), (рубашка, синий) и (штаны, зеленый). ), не смешивая их. ^[3] Мы проверяем способность DALL·E делать это для относительного позиционирования, укладки объектов и управления несколькими атрибутами.

маленький красный блок, расположенный на большом зеленом блоке

navigationdownwide

navigationupwide

Текстовое приглашение

изображения, сгенерированные искусственным интеллектом

Мы обнаружили, что DALL·E правильно реагирует на некоторые типы относительных положений, но не на другие. Варианты «сидеть на» и «стоять впереди» иногда работают, а «сидеть внизу», «стоять позади», «стоять слева» и «стоять справа» — нет. DALL·E также имеет более низкий уровень успеха, когда его просят нарисовать большой объект, расположенный поверх меньшего, по сравнению с наоборот.

navigationupwide

стек из 3 кубов. красный куб находится сверху, сидя на зеленом кубе. зеленый куб находится посередине, сидя на синем кубе. синий куб находится внизу.

navigationdownwide

navigationupwide

Текстовая подсказка

Созданные ИИ
изображения

Мы обнаружили, что DALL·E обычно генерирует изображение с одним или двумя объектами, имеющими правильные цвета. Однако только в нескольких образцах для каждой настройки обычно имеется ровно три объекта, окрашенных точно так, как указано.

navigationupwide

эмодзи пингвиненка в синей шапке, красных перчатках, зеленой рубашке и желтых штанах обычно создает изображение с двумя или тремя предметами одежды, имеющими правильные цвета. Однако лишь немногие из образцов для каждой обстановки, как правило, имеют все четыре предмета одежды указанных цветов.

navigationupwide

Хотя DALL·E предлагает некоторый уровень контроля над атрибутами и позициями небольшого числа объектов, вероятность успеха может зависеть от того, как сформулирован заголовок. По мере того, как вводится больше объектов, DALL·E склонен путать ассоциации между объектами и их цветами, и вероятность успеха резко снижается. Мы также отмечаем, что DALL·E хрупок в отношении перефразирования подписи в этих сценариях: альтернативные, семантически эквивалентные подписи часто не дают правильной интерпретации.

Визуализация перспективы и трехмерности

Мы обнаружили, что DALL·E также позволяет управлять точкой обзора сцены и трехмерным стилем, в котором визуализируется сцена.

очень крупный план водосвинки, сидящей в поле

navigationdownwide

navigationupwide

Текстовая подсказка разные взгляды. Некоторые из этих видов, такие как «вид сверху» и «вид сзади», требуют знания внешнего вида животного с необычных ракурсов. Другие, такие как «крайний план», требуют знания мелких деталей кожи или меха животного.

navigationupwide

капибара из вокселей, сидящая в поле животных в соответствии с выбранным 3D-стилем, таким как «глиняный» и «сделанный из вокселей», и визуализировать сцену с правдоподобным затенением в зависимости от положения солнца. «Рентгеновский» стиль не всегда работает надежно, но он показывает, что DALL·E иногда может ориентировать кости внутри животного в правдоподобных (хотя и не анатомически правильных) конфигурациях.

navigationupwide

Чтобы продвинуться дальше, мы проверяем способность DALL·E многократно рисовать голову известной фигуры под каждым углом из последовательности равноотстоящих углов и обнаруживаем, что можем восстановить плавную анимацию вращения глава.

фотография бюста Гомера

navigationdownwide

navigationupwide

текстовая подсказка

графическая подсказка

AI-сгенерированные
изображения

мы подсказываем DALL·E с подписью и описанием известной фигуры область изображения, показывающая шляпу, нарисованную под определенным углом. Затем мы просим DALL·E завершить оставшуюся часть изображения с учетом этой контекстной информации. Мы делаем это неоднократно, каждый раз поворачивая шляпу еще на несколько градусов, и обнаруживаем, что можем восстановить плавную анимацию нескольких хорошо известных фигур, при этом каждый кадр соответствует точным спецификациям угла и окружающего освещения.

navigationupwide

DALL·E может применять некоторые типы оптических искажений к сценам, как мы видим с параметрами «вид объектива «рыбий глаз»» и «сферическая панорама». Это побудило нас исследовать его способность генерировать отражения.

простой белый куб, смотрящий на свое отражение в зеркале. простой белый куб, смотрящий на себя в зеркало.

navigationdownwide

navigationupwide

Текстовое приглашение

Графическое приглашение

изображения, сгенерированные искусственным интеллектом

Подобно тому, что было сделано ранее, мы предлагаем DALL·E заполнить нижние правые углы последовательности кадров, каждый из которых содержит зеркало и отражающий пол. Хотя отражение в зеркале обычно напоминает объект за его пределами, оно часто не передает отражение физически правильным образом. Напротив, отражение объекта, нарисованного на отражающем полу, обычно более правдоподобно.

navigationupwide

Визуализация внутренней и внешней структуры

Образцы в стиле «очень крупный план» и «рентген» позволили нам дополнительно изучить способность DALL·E визуализировать внутреннюю структуру с помощью поперечных сечений и внешнюю структуру с помощью макрофотографий.

вид грецкого ореха в разрезе

navigationdownwide

navigationupwide

Текстовая подсказка

изображения, сгенерированные искусственным интеллектом

Мы обнаружили, что DALL·E может рисовать внутренности нескольких различных типов объектов.

navigationupwide

макрофотография мозгового коралла

navigationdownwide

navigationupwide

Текстовая подсказка

Созданные искусственным интеллектом
изображения объекты. Эти детали видны только при близком рассмотрении объекта.

navigationupwide

Определение контекстных деталей

Задача преобразования текста в изображения недостаточно конкретизирована: одна подпись обычно соответствует бесконечному количеству правдоподобных изображений, поэтому изображение не определяется однозначно. Например, рассмотрим подпись «картина с изображением капибары, сидящей в поле на восходе солнца». В зависимости от ориентации водосвинки может возникнуть необходимость нарисовать тень, хотя эта деталь никогда не упоминается явно. Мы изучаем способность DALL·E устранять недочеты в трех случаях: изменение стиля, обстановки и времени; рисование одного и того же объекта в различных ситуациях; и создание изображения объекта с написанным на нем определенным текстом.

рисунок водосвинки, сидящей в поле на восходе солнца

navigationdownwide

navigationupwide

Текстовая подсказка

изображения, сгенерированные искусственным интеллектом стилей и может адаптировать освещение, тени и окружающую среду в зависимости от времени суток или времени года.

navigationupwide

витраж с изображением синей клубники

navigationdownwide

navigationupwide

Текстовое приглашение

Созданные ИИ
изображения

Мы обнаружили, что DALL·E может гибко адаптировать представление объекта в зависимости от среды, на которой он рисуется. Для «фрески», «банки с газировкой» и «чашки» DALL·E должен изменить способ рисования объекта в зависимости от угла и кривизны поверхности рисования. Для «витража» и «неоновой вывески» он должен изменить внешний вид объекта по сравнению с тем, каким он обычно выглядит.

navigationupwide

витрина магазина, на которой написано слово «openai». фасад магазина, на котором написано слово «openai». фасад магазина, на котором написано слово «openai». Фасад магазина «Опенай».

navigationdownwide

navigationupwide

Текстовое приглашение

Генерируемые AI
изображения

Мы обнаружили, что DALL·E иногда может отображать текст и адаптировать стиль письма к контексту, в котором он появляется. Например, «пакет чипсов» и «номерной знак» требуют разных типов шрифтов, а «неоновая вывеска» и «надпись в небе» требуют изменения внешнего вида букв.

Как правило, чем длиннее строка, которую DALL·E предлагается записать, тем ниже вероятность успеха. Мы обнаружили, что вероятность успеха повышается, когда части подписи повторяются. Кроме того, вероятность успеха иногда повышается по мере снижения температуры выборки изображения, хотя образцы становятся более простыми и менее реалистичными.

navigationupwide

С различной степенью надежности DALL·E обеспечивает доступ к подмножеству возможностей механизма 3D-рендеринга с помощью естественного языка. Он может независимо контролировать атрибуты небольшого числа объектов и в ограниченной степени, сколько их и как они расположены по отношению друг к другу. Он также может управлять местоположением и углом, с которого визуализируется сцена, и может генерировать известные объекты в соответствии с точными спецификациями угла и условий освещения.

В отличие от механизма 3D-рендеринга, входные данные которого должны быть указаны однозначно и во всех подробностях, DALL·E часто может «заполнить пробелы», когда заголовок подразумевает, что изображение должно содержать определенную деталь, которая явно не указана.

Применение предыдущих возможностей

Далее мы рассмотрим использование предыдущих возможностей для моды и дизайна интерьера.

Композиционная природа языка позволяет нам объединять концепции для описания как реальных, так и воображаемых вещей. Мы обнаружили, что DALL·E также может комбинировать разрозненные идеи для синтеза объектов, некоторые из которых вряд ли существуют в реальном мире. Мы исследуем эту способность в двух случаях: перенос качеств различных концепций на животных и создание продуктов, черпая вдохновение из несвязанных концепций.

улитка из арфы. улитка с текстурой арфы.

navigationdownwide

navigationupwide

Текстовое приглашение

Генерируемые AI
изображения

Мы обнаружили, что DALL·E может генерировать животных, синтезированных из различных понятий, включая музыкальные инструменты, продукты питания и предметы домашнего обихода. Хотя это и не всегда удается, мы обнаруживаем, что DALL·E иногда принимает во внимание формы двух объектов, решая, как их объединить. Например, когда ему предлагается нарисовать «улитку, сделанную из арфы», он иногда связывает столб арфы со спиралью раковины улитки.

В предыдущем разделе мы видели, что чем больше объектов вводится в сцену, тем чаще DALL·E путает ассоциации между объектами и их указанными атрибутами. Здесь мы видим иной вид отказа: иногда вместо того, чтобы привязать какой-либо атрибут заданного понятия (скажем, «кран») к животному (скажем, «улитке»), ДАЛЛ·И просто рисует их как отдельные предметы.

navigationupwide

Иллюстрации животных

В предыдущем разделе мы исследовали способность DALL·E комбинировать несвязанные концепции при создании изображений объектов реального мира. Здесь мы исследуем эту способность в контексте искусства для трех видов иллюстраций: антропоморфные версии животных и предметов, химеры животных и смайлики.

иллюстрация редиски дайкон в балетной пачке, выгуливающей собаку Мы обнаружили, что DALL·E иногда может передавать некоторые виды человеческой деятельности и предметы одежды животным и неодушевленным предметам, таким как продукты питания. Мы включили «пикачу» и «владение синим световым мечом», чтобы изучить способность DALL·E использовать популярные медиа.

Нам интересно, как DALL·E адаптирует части человеческого тела к животным. Например, когда его просят нарисовать редис дайкон, сморкающийся, потягивающий латте или катающийся на одноколесном велосипеде, ДАЛЛ·И часто рисует платок, руки и ноги в правдоподобных местах.

navigationupwide

Профессиональная высококачественная иллюстрация химеры черепахи-жирафа. жираф, имитирующий черепаху. жираф из черепахи.

navigationdownwide

navigationupwide

Текстовое приглашение

Генерируемые AI
изображения

Мы обнаружили, что DALL·E иногда может комбинировать различных животных правдоподобным образом. Мы включаем «пикачу», чтобы исследовать способность DALL·E использовать знания популярных медиа, и «робот», чтобы исследовать его способность создавать животных-киборгов. Как правило, черты второго животного, упомянутого в подписи, имеют тенденцию быть доминирующими.

Мы также обнаружили, что вставка фразы «профессиональное высокое качество» перед словами «иллюстрация» и «эмодзи» иногда улучшает качество и согласованность результатов.

navigationupwide

профессиональные высококачественные смайлики влюбленной чашки боба

navigationdownwide

navigationupwide

Текстовая подсказка

Созданные AI
изображения

и неодушевленные предметы, такие как продукты питания. Как и в предыдущем изображении, мы обнаружили, что вставка фразы «профессиональное высокое качество» перед «эмодзи» иногда улучшает качество и согласованность результатов.

navigationupwide

Zero-Shot Visual Reasoning

GPT-3 может быть проинструктирован выполнять многие виды задач исключительно на основе описания и подсказки для получения ответа, предоставленного в его подсказке, без какого-либо дополнительного обучения. Например, на запрос фразы «вот предложение «человек, выгуливающий свою собаку в парке», переведенное на французский язык:», GPT-3 отвечает: «un homme qui promène son chien dans le parc». Эта способность называется рассуждениями с нулевым выстрелом. Мы обнаружили, что DALL·E расширяет эту возможность до визуальной области и может выполнять несколько видов задач преобразования изображения в изображение при правильном запросе.

точно такой же кот вверху, как и набросок внизу

navigationdownwide

navigationupwide

Текстовое приглашение

Графическое приглашение

Сгенерированное ИИ
изображения

Мы обнаружили, что DALL·E может применять несколько видов преобразования изображений к фотографиям животных с разной степенью надежности. Самые простые из них, такие как «фотография, окрашенная в розовый цвет» и «фотография, отраженная вверх ногами», также, как правило, являются наиболее надежными, хотя фотография часто не копируется или не отражается точно. Преобразование «животное в очень крупном плане» требует, чтобы DALL·E распознал породу животного на фотографии и воспроизвел ее с соответствующими деталями. Это работает менее надежно, и для некоторых фотографий DALL·E генерирует правдоподобные завершения только в одном или двух случаях.

Другие трансформации, такие как «животное в солнечных очках» и «животное в галстуке-бабочке», требуют размещения аксессуара на нужной части тела животного. Те, которые изменяют только цвет животного, такие как «животное окрашено в розовый цвет», менее надежны, но показывают, что DALL·E иногда способен отделить животное от фона. Наконец, трансформации «набросок животного» и «чехол для мобильного телефона с животным» исследуют использование этой возможности для иллюстраций и дизайна продукта.

navigationupwide

точно такой же чайник сверху с надписью «gpt» снизу E может применять несколько различных видов преобразования изображений к фотографиям чайников с разной степенью надежности. Помимо возможности изменять цвет чайника (например, «синий цвет») или его рисунок (например, «с полосами»), DALL·E также может отображать текст (например, «с надписью «gpt» на нем» ) и расположите буквы на изогнутой поверхности чайника правдоподобным образом. С гораздо меньшей надежностью может вытянуть и чайник меньшего размера (для варианта «малюсенький») и в разбитом состоянии (для варианта «разбитый»).

navigationupwide

Мы не ожидали, что эта возможность появится, и не вносили никаких изменений в нейронную сеть или процедуру обучения, чтобы поощрять ее. Руководствуясь этими результатами, мы измеряем способность ДАЛЛ-И решать задачи на рассуждения по аналогии, проверяя ее на прогрессивных матрицах Равена — визуальном тесте IQ, который широко использовался в 20-м веке.

последовательность геометрических фигур.

navigationdownwide

navigationupwide

Текстовое приглашение

Пример подсказки изображения

Сгенерированные AI
изображения

Вместо того, чтобы рассматривать IQ-тест как задачу с множественным выбором, как предполагалось изначально, мы просим DALL·E заполнить нижний правый угол каждого изображения, используя выборку argmax, и считаем его завершение правильным, если оно близко визуально соответствует заданному. оригинал.

DALL·E часто может решать матрицы, которые включают в себя непрерывные простые шаблоны или базовые геометрические рассуждения, например, в наборах B и C. Иногда он может решать матрицы, которые включают распознавание перестановок и применение логических операций, таких как те, что в наборах B и C. набор D. Экземпляры в наборе E, как правило, самые сложные, и DALL·E почти ни один из них не дает правильного ответа.

Для каждого из наборов мы измеряем производительность DALL·E как на исходных изображениях, так и на изображениях с инвертированными цветами. Инверсия цветов не должна создавать дополнительных трудностей для человека, но в целом ухудшает работу DALL·E, предполагая, что его возможности могут быть непредсказуемыми.

navigationupwide

Географические знания

Мы обнаружили, что DALL·E узнал о географических фактах, достопримечательностях и районах. Его знание этих понятий удивительно точно в одних отношениях и ошибочно в других.

фото китайской еды

navigationdownwide

navigationupwide

Текстовая подсказка

изображения, сгенерированные искусственным интеллектом

Мы проверяем понимание DALL·E простых географических фактов, таких как флаги стран, кухня и местная дикая природа. В то время как DALL·E успешно отвечает на многие из этих вопросов, например, о национальных флагах, он часто отражает поверхностные стереотипы выбора, такие как «еда» и «дикая природа», в отличие от представления всего разнообразия, встречающегося в реальном мире.

navigationupwide

фотография площади Аламо, Сан-Франциско, с улицы ночью некоторых мест в Сан-Франциско. Для мест, знакомых авторам, таких как Сан-Франциско, они вызывают чувство дежа вю — жуткие симулякры улиц, тротуаров и кафе, которые напоминают нам об очень конкретных местах, которых не существует.

navigationupwide

фотография моста «Золотые ворота» в Сан-Франциско

navigationdownwide

navigationupwide

Текстовая подсказка

Подсказки к изображениям На самом деле, мы даже можем указать, когда была сделана фотография, указав первые несколько рядов неба. Например, когда небо темное, DALL·E распознает ночь и включает свет в зданиях.

navigationupwide

Знания о времени

В дополнение к изучению знаний DALL·E о концепциях, которые меняются в пространстве, мы также изучаем его знания о концепциях, которые меняются во времени.

фотография телефона 20-х годов

navigationdownwide

navigationupwide

Текстовая подсказка

Подсказка с изображением

Сгенерированные искусственным интеллектом
изображения десятилетия. Технологические артефакты, по-видимому, проходят через периоды взрывного изменения, резко меняясь в течение десятилетия или двух, а затем меняясь постепенно, совершенствуясь и совершенствуясь.

navigationupwide

Резюме подхода и предыдущей работы

DALL·E — это простой преобразователь только для декодера, который получает и текст, и изображение как единый поток из 1280 токенов — 256 для текста и 1024 для изображения — и моделирует все из них авторегрессивно. Маска внимания на каждом из 64 слоев внутреннего внимания позволяет каждому маркеру изображения уделять внимание всем текстовым маркерам. DALL·E использует стандартную причинно-следственную маску для текстовых токенов и разреженное внимание для токенов изображения со строкой, столбцом или сверточным шаблоном внимания, в зависимости от слоя. Мы предоставляем более подробную информацию об архитектуре и процедуре обучения в нашей статье.

Синтез текста в изображение был активной областью исследований со времен новаторской работы Reed et. al, чей подход использует GAN, основанный на встраивании текста. Вложения создаются кодировщиком, предварительно обученным с использованием контрастных потерь, мало чем отличающихся от CLIP. StackGAN и StackGAN++ используют многомасштабные GAN для увеличения разрешения изображения и улучшения визуальной точности. AttnGAN объединяет внимание между текстовыми и графическими функциями и предлагает контрастную характеристику текста и изображения, соответствующую потере, в качестве вспомогательной цели.
E foto: E-FOTO download | SourceForge.net