Kandinsky 2.1 - новая модель российской нейросети - была представлена 4 апреля 2023 года Сбером, с перечислением всех генеративных функций. Нейросеть способна понимать запросы пользователей на 101 языке и создавать не только новые изображения по текстовым запросам, но и дорисовывать другие изображения, объединять несколько рисунков в один, а также может формировать изображения в формате бесконечных полотен (inpainting/outpainting).
Как сообщают в пресс-службе Сбера, Kandinsky 2.1 понимает запросы на 101 языке, и работает в самых разнообразных стилях. Основой стала предыдущая версия, обученная на миллиарде примеров формата «текст - изображение», а затем дообучена на 172 млн пар высококачественных изображений. Также в новую модель нейросети встроили обновлённый автоэнкодер, за счёт которого сеть обладает функционалом из 3,3 млрд параметров, вместо 2 млрд из предыдущей версии.
«Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов», - заявил первый заместитель Председателя Правления Сбербанка Александр Ведяхин.
При этом работать с новой нейросетью можно совершенно бесплатно, на официальной промо-странице Kandinsky 2.1, либо в мобильном приложении «Салют», на платформах ML Space и Fusion Brain, а также в Телеграм-боте.
Вот некоторые примеры изображений, созданных нейросетью по текстовому описанию:
Сгенерированное нейросетью изображение "пейзаж загадочной дикой планеты" в стиле "Аниме"
Сгенерированное нейросетью изображение "заяц в лесу" без стиля
Сгенерированное нейросетью изображение "Национальная служба экономической разведки" в стиле "Иконопись"
По материалам КП.ру