Яндекс представил новую диффузионную нейросеть Yandex AI Rendering Technology (YandexART). Она создаёт более детализированные изображения и анимацию по текстовым запросам. Её уже можно протестировать в приложении «Шедеврум»
По заявлениям разработчиков YandexART — генеративная модель, которая воплощает идеи в жизнь. Она создаёт реалистичные, детальные изображения и анимацию по текстовому запросу. Изображения создаются методом каскадной диффузии. При обучении модели изображения «портят», добавляя к ним случайный шум, как при диффузии жидкости или газа. Затем их показывают модели, задача которой — «восстановить» изображение.
Как отметили в компании, YandexART «понимает российский культурный код». ИИ знает известные места и города страны, выдающихся личностей разных эпох и знакомых с детства персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу.
По сравнению с предыдущим поколением диффузионной модели, которая использовалась в «Шедевруме», YandexART в большинстве случаев создаёт более реалистичную и детализированную картинку. ИИ уже интегрирован в приложение «Шедеврум», а вскоре появится в «Клавиатуре» для мобильных устройств и других сервисах компании.
По материалам shedevrum