Тест Gemini 2.0 Flash Image Generation: редагування фото за текстовим запитом
Короче я потестував цю функцію редактування картинок в Gemini 2.0 Flash (Image Generation) Experimental. Можна поки не сильно переживати, але напрягтись можна)
Плюси для авторів контенту:
1. воно ужимає до 1024 px по довгій стороні.
2. якість картинки значно гірша на виході
3. з деякими елементами справляється погано, прозорі ватермарки, наприклад.
4. деякі елементи на фото просто генерить заново і візуально це відрізняється від оригіналу в деталях
Зрозуміло, що це питання часу, коли ці інстурменти зможуть повністю прибирати ватермарки, але і стоки не стоять на місці, там активно працюють на вирішенням питання. Наприклад змінюють періодчно форму ватермарків. Тоді тренувати модель потрібно додатково)
Для побутових використань може проканати і в такому вигляді, як є зараз. Нажаль.
Я більше 15 років займаюсь стоками і можу впевнено сказати, що той, хто хоче вкрасти і не платити за контент - зробить це і без нейронок.
Gemini 2.0 Flash (Image Generation) — модель Google, що поєднує генерацію та редагування зображень за текстовим промптом; доступна через Gemini та API; швидша і дешевша, ніж Gemini Pro, але менш деталізована.
Як відредагувати фото через Gemini 2.0 Flash?
Наскільки Gemini Flash кращий за ChatGPT у редагуванні фото?
Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.
Підписатися в Telegram