☕️ Кава з пінкоюнотатки про ШІ, технології та творчість
Читати в Telegram →
12 грудня 2024 · переглядів у Telegram

Google Gemini 2.0 Streaming API: нейронка бачить і коментує відеопотік з камери в реальному часі

Гугл вчора релізнув Gemini 2.0 і streaming api - пускаєте трансляцію з камери телефона+аудіо і нейронка може коментувати реал тайм голосом все, що бачить та чує 😲 правда не може гуглити те, що знайшла. Скоріше всього потім цю функцію додадуть в стандартну апку Гугла і вона замінить google lens, або інтегрується з нею.

І це не фантастика, а реальність, спробуйте тут:

https://aistudio.google.com/live

↗ Оригінал поста в Telegram
Довідка

Gemini 2.0 (Google) — Нова мультимодальна модель Google (грудень 2024); вміє отримувати відеопотік і аудіо в реальному часі та відповідати голосом.

Streaming API — Інтерфейс для потокової передачі даних у реальному часі: дані обробляються по мірі надходження, без чекання завершення.

Де спробувати Gemini 2.0 streaming?
На aistudio.google.com/live — через браузер на десктопі або мобільному.
Чи замінить Gemini 2.0 Google Lens?
Можливо — потенційно функцію можуть інтегрувати в стандартний застосунок Google для заміни Google Lens.

Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.

Підписатися в Telegram