Google представила новую модель для генерации изображений Nano Banana

Google рассказала, что ее загадочная модель искусственного интеллекта "nano banana", которая в последние недели возглавляла рейтинги по редактированию изображений, теперь официально доступна в приложении Gemini в составе новой модели Gemini 2.5 Flash Image.

Обновление, которое начнет распространяться во вторник для всех пользователей Gemini, решает давнюю проблему в редактировании изображений с помощью ИИ: сохранение согласованности изображения объекта при множественных изменениях. В отличие от конкурирующих инструментов, таких как ChatGPT или Grok компании xAI, которые часто искажают лица или изменяют фон при простых изменениях, например цвете рубашки, Gemini 2.5 Flash Image сохраняет целостность лиц, животных и других деталей на протяжении всего процесса редактирования. Эта модель позволяет пользователям преобразовывать объекты на фото в различные костюмы, прически или окружения, при этом сохраняя их легко узнаваемыми.

Character-consistency.gif

Также теперь пользователи могут объединять несколько фотографий для создания композитных изображений, например разместить человека и домашнего питомца вместе на баскетбольной площадке, используя отдельные фотографии. Многоэтапное редактирование позволяет выполнять последовательные изменения одного изображения, давая пользователям возможность перекрашивать стены, добавлять мебель и вносить другие изменения без необходимости начинать заново.

Модель теперь доступна на всех платформах ИИ Google, включая Gemini API, Google AI Studio и Vertex AI, при этом все сгенерированные или отредактированные изображения имеют видимые водяные знаки и невидимую идентификационную систему SynthID от Google.

Комментарии
Пока нету комментариев...