Нова нейронна мережа під назвою DALL-E запропонована дослідниками з компанії OpenAI. Мережа може створювати зображення і фотографії на базі лише текстового опису. Для навчання нейромережі розробники використали 12 мільярдів зображень з інтернету, які містили текстовий підпис. Внаслідок цього, алгоритми не шукають зображення у відкритих джерелах – нейромережа створює їх сама, зазначається на сайті OpenAI.
У липні 2020 року компанія OpenAI представила алгоритм GPT-3, який може створювати текст, близький до написаного людиною, на базі заданих параметрів. Новинка DALL-E – це розширення GPT-3, яке аналізує англомовні текстові запити, а згодом – видає зображення. Система може генерувати реалістичні фото, ілюстрації, нові комбінації об’єктів. Крім того, нейромережа здатна розміщувати текст на зображенні та виконувати IQ тести.
Автори нейромережі пояснили, що назва DALL-E – це анаграма з імені художника Сальвадора Далі (Dali) та відомого робота з мультфільму WALL-E.
Приклади зображень, які створила нейромережа DALL-E
1) Малюнки за ключовими словами: “п’ятикутний зелений годинник” / Фото OpenAI
2) Малюнки за ключовими словами: “вітальня з двома білими кріслами і картиною Колізею” / Фото OpenAI
3) Малюнки за ключовими словами: “професійне високоякісне емодзі закоханої склянки бабл-ті” / Фото OpenAI
4) Малюнки за ключовими словами: “крісло у формі авокадо” / Фото OpenAI
5) Зображення за ключовими словами: “Сан-Франциско з вулиці вночі”/ Фото OpenAI
Варто зауважити, що алгоритм може не тільки розуміти слова, а й знаходити зв’язок у словосполученнях. Відзначається, що на якість роботи нейромережі значно впливає рівень складності запиту. Незабаром розробники представлять опис роботи DALL-E.