☕️ Кава з пінкоюнотатки про ШІ, технології та творчість
Читати в Telegram →
18 березня 2025 · переглядів у Telegram

Тест Gemini 2.0 Flash Image Generation: редагування фото за текстовим запитом

Тест Gemini 2.0 Flash Image Generation: редагування фото за текстовим запитом

Короче я потестував цю функцію редактування картинок в Gemini 2.0 Flash (Image Generation) Experimental. Можна поки не сильно переживати, але напрягтись можна)

Плюси для авторів контенту:

1. воно ужимає до 1024 px по довгій стороні.

2. якість картинки значно гірша на виході

3. з деякими елементами справляється погано, прозорі ватермарки, наприклад.

4. деякі елементи на фото просто генерить заново і візуально це відрізняється від оригіналу в деталях

Зрозуміло, що це питання часу, коли ці інстурменти зможуть повністю прибирати ватермарки, але і стоки не стоять на місці, там активно працюють на вирішенням питання. Наприклад змінюють періодчно форму ватермарків. Тоді тренувати модель потрібно додатково)

Для побутових використань може проканати і в такому вигляді, як є зараз. Нажаль.

Я більше 15 років займаюсь стоками і можу впевнено сказати, що той, хто хоче вкрасти і не платити за контент - зробить це і без нейронок.

↗ Оригінал поста в Telegram
Довідка

Gemini 2.0 Flash (Image Generation) — модель Google, що поєднує генерацію та редагування зображень за текстовим промптом; доступна через Gemini та API; швидша і дешевша, ніж Gemini Pro, але менш деталізована.

Як відредагувати фото через Gemini 2.0 Flash?
Завантажте зображення в Gemini і опишіть зміни текстом; функція доступна через web-версію Gemini або API.
Наскільки Gemini Flash кращий за ChatGPT у редагуванні фото?
Швидкість порівнянна; якість деталізації залежить від задачі — тестуйте обидва під конкретний кейс.

Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.

Підписатися в Telegram