Реальний приклад галюцинації LLM: модель об’єднала три дослідження в одне й зробила некоректні висновки. Чому фактчекінг відповідей ШІ обов’язковий.
Як зробити персонального погодного агента з ШІ, що завчасно попереджає про дощ і грозу за різким падінням атмосферного тиску та прив’язкою до локації.
Як працюють safety-запобіжники нової моделі Claude: на чутливих темах (кібербезпека, біологія) вона автоматично перемикається на простішу модель.
Реальний кейс prompt injection: у джерело даних, яке обробляє LLM, вбудовані приховані інструкції, що змушують ШІ радити конкретний товар. Як це виявити у Claude Code.
Бот збирає цікаві події Києва з багатьох джерел — технології, AI та інше, без концертів і театрів. Огляд на тиждень уперед.
У Google AI Studio з'явилась можливість безкоштовно генерувати Android-застосунки з підключенням до Google-сервісів — автор протестував додаток для редагування Google Sheets.
Автор запустив Hermes-агента, який щовечора читає 30–50 Telegram-каналів (технології + економіка), прибирає дублікати та формує стислий дайджест із посиланнями через Claude.
Огляд ідей маніфесту Palantir: CEO Алекс Карп критикує Big Tech за уникнення оборонних та соціальних викликів на користь рекламних алгоритмів. Контекст: Instagram блюрить відео обстрілів Києва.
Згенерована AI-фотографія пройшла відбір у фінал Hasselblad Masters 2026 від спільноти, але після дискваліфікації автора виявилось — люди спочатку самі проголосували за неї.
Підбірка актуальних онлайн-карт для відстеження руху дронів в Україні: Dimap із AI-симуляцією траєкторій, mapa.ua та канал «Ринда» з картою kudyletyt.com.
Автор розповідає про розвиток свого AI health-агента: дані з Apple Watch і Oura Ring, алергени, аналізи Dila, модель прогнозування головного болю та свіже дослідження Google Fitbit про ранні маркери хвороби.
Система агрегування та моніторингу використання штучного інтелекту у вищих навчальних закладах України — дашборд доступний за адресою shimon.info/ua_dashboard.
Автор і команда Fractal створили безкоштовний базовий курс по Claude Cowork — для тих, хто хоче розібратись як використовувати Claude для роботи з файлами на комп'ютері.
В Claude з'явився офіційний конектор Adobe for Creativity, що дозволяє використовувати інструменти Adobe прямо в чаті — для базового редагування без відкриття Photoshop.
OpenAI випустили ChatGPT Images 2.0 — перша їхня модель з «міркуванням» перед генерацією, з акцентом на якісний текст у зображеннях. Генерація до 2K через API.
Оповідання Айзека Азімова 1956 року про комп'ютер, що відповідає на будь-які питання — в українській аудіо-версії на 42 хв. Автор проводить паралель із сучасними LLM.
Офіційний браузерний розширення Claude від Anthropic для Chrome — дозволяє AI бачити вміст сторінки, запускати скрипти та натискати кнопки. Налаштування та сценарії використання.
Інсайти з Adobe Summit у Лас-Вегасі: 70% споживачів дають бренду 2–5 секунд; AI-агенти читають ваші сторінки і вирішують рекомендувати бренд чи ні; контент має бути структурованим для машин.
Автор за 2 вечори створив власний MacOS-додаток для генерації метаданих фотостоків через Claude Opus 4.7. Замінив платний ChatGPT GPT — тепер все в одному інтерфейсі.
Автор (юрист за освітою) описує кейс використання Claude Skills для аналізу договорів, перевірки контрагентів за відкритими джерелами та порівняння пропозицій підрядників.
Anthropic випустили окремий продукт Claude Design з підтримкою Claude Code та конектором Figma. Автор згенерував інтерактивну презентацію з 1 промпту за 5 хвилин.
Оновлена десктопна версія Claude отримала редизайн і підключення до зовнішніх серверів — тепер можна керувати Claude на власному сервері прямо з iPhone без додаткових програм.
Автор побудував особистого health-агента на Claude Opus: дані сенсорів Apple Watch, медичні консультації, аналізи за 10 років, щоденник головного болю, бази ліків і наукових статей. Відповідає через Telegram-бот із озвучкою.
Огляд документу OpenAI про промислову AI-політику: профілактика інцидентів, автоматизація та зростання «людиноцентричних» професій. Контекст — переговори OpenAI з Пентагоном.
Автор розповідає як його систему відеонагляду зламали через ін'єкцію команди в закодоване зображення (Base64), встановивши майнер крипти. Пояснює як Claude розпізнає такі спроби.
Огляд виступу фахівця з кібербезпеки: методи обходу захисту LLM через кодування промптів (Base64, Morse, емодзі), інструмент Parseltongue для автоматизації атак та анти-класифікатор.
OpenAI інтегрували ChatGPT в Apple CarPlay — функція стала доступна з iOS 26.4. Автор показує як це виглядає у машині.
Автор описує досвід фонового вайбкодингу: Claude Code на сервері 24/7 сам додав озвучку відповідей у Telegram-бот, поки автор займався іншими справами — лише погоджував кроки через Telegram.
Автор місяць диктує більше ніж друкує — на ноуті і телефоні. Порівняльна таблиця PDF з більшістю застосунків для голосового вводу, критерій: якість розуміння суміші мов в одному реченні.
Пилосос Matic використовує NVIDIA Jetson Orin Nano для локальної AI-обробки відео з камер — без передачі даних у хмару. Той самий чіп, що й на шахедах.
Автор ділиться кейсом: Claude Cowork зібрав повноцінну презентацію з фотографій — зайняло б пів дня вручну. Пояснює що таке Cowork-режим і як підключати конектори.
Автор налаштував Claude в Telegram через офіційний плагін Anthropic: доступ до сервера, Home Assistant, локальне розпізнавання голосових через Whisper. Пояснює як це працює.
Безкоштовний MacOS-застосунок Handy конвертує голос у текст локально через модель Whisper Large — без хмари, API і реєстрації. Опціонально: обробка через OpenAI API.
Автор активно використовує локальний voice-to-text застосунок для вайбкодингу та роботи за кермом, але застерігає: компанія з китайськими коренями — не передавати чутливу інформацію.
Meta купує стартап — аналог соціальної мережі для AI-агентів (Open Claw). Засновника Open Claw найняв OpenAI. Автор пояснює що таке Open Claw і чому це важливо.
Anthropic офіційно відмовилась надати Пентагону доступ для масового стеження і автономної зброї. Пітт Хегсет оголосив Anthropic «ризиком для ланцюга постачання».
Anthropic отримала ультиматум від Пентагону — надати доступ до Claude «без обмежень». Контекст: дослідження про те, як LLM оцінюють ядерну зброю як «логічний наступний крок».
Автор після місяця на Claude пояснює різницю між режимами: Chat для побутових запитів, Cowork для файлів на комп'ютері, Code в терміналі для розробки без знань програмування.
Stetophone — застосунок, що перетворює iPhone на стетоскоп для дистанційного прослуховування лікарем. Сертифікований як медичний пристрій у США, Канаді та Україні. AI аналізує патології серця.
ByteDance (TikTok) випустили Seedance 2.0 — модель генерації відео з кінематографічними кадрами, монтажем і реалістичними звуковими ефектами та синхронізованою мовою.
Speakly — нова AI-застосунок від Genspark для Mac і Windows: натискаєте клавішу, говорите, текст вставляється в активне вікно. Автоматично розставляє розділові знаки, розуміє українську.
Автор показує реальний кейс: Sonnet не міг вирішити технічну задачу в Claude Chrome-аддоні, Opus 4.5 у план-режимі вирішив її за одну ітерацію.
Кейс: скрипт опису 5000 фото через Gemini API працював надто повільно. Gemini запропонував 15 паралельних процесів замість одного — 15-кратне прискорення. Урок: питай у різних моделей.
Автор описує рік прогресу: від нуля до створення систем через Claude Code в VS Code з підключенням n8n — без знань програмування. Пояснює чому ліміти Claude — корисна перерва.
Автор підключив Claude Desktop до Home Assistant через MCP — тепер пишеш задачу в чаті, Claude знаходить потрібні дані, пропонує рішення і сам вносить зміни в автоматизацію.
Практичний кейс: бот для Google Таблиць на Apps Script — Gemini і ChatGPT застрягли, Claude за 10 хвилин вирішив і додав додаткову логіку. Claude Code для внеску в чужий GitHub-проект.
Китайський стартап представив Eva.i на Kickstarter — людиноподібного робота-компаньйона з біонічною електронною шкірою, сенсорами тиску/температури і підігрівом за $7000.
Особисте спостереження: радіо вже використовує AI-синтез для новин — інтонаційні особливості помітні тим, хто сам робив TTS-озвучку.
На виставці CES 2026 Govee представила новий смарт-світильник для стелі з відображенням AI-генерованого арту — поєднання дизайнерської підсвітки та генеративного контенту.
Різдвяна AI-реклама McDonald's для нідерландського ринку була знята через масову негативну реакцію — навіть агенція прибрала її зі своїх соцмереж. Та сама агенція зняла прекрасний стоп-моушен.
Фейкова, але правдоподібна новина про арешт AI-міністра Дьелли в Албанії: модель проаналізувала 30 років тендерів і вирішила, що хабар — це «стандартний протокол», а не злочин.
Гра Arc Raiders замінила акторів озвучки на TTS-систему, навчену на їхніх голосах, — при цьому головний дизайнер публічно заперечує використання AI у грі.
ChatGPT Deep Research отримав режим для покупок: ставите умови — отримуєте мінітест і персоналізовані варіанти; можна скіпати і уточнювати до потрібного. Працює з українськими магазинами.
Google Gemini 3 запровадив Visual Chain of Thought для зображень: модель спочатку планує композицію, освітлення й анатомію, потім генерує — параметр thinking_level в API.
Детальний whitepaper від Google на Kaggle пояснює що таке AI-агенти, як вони влаштовані і як будувати агентні системи — англійською, безкоштовно.
Google запустив безкоштовний англомовний курс «AI for Business» про побудову AI-агентів із живими стрімами керівників AI-відділів Google і текстовими уроками.
Різдвяна AI-реклама Coca-Cola викликала хвилю критики — її зняли. Тим часом та сама агенція зробила прекрасний стоп-моушен ролик, що довів цінність людської праці в рекламі.
Photoshop 27 приніс Nano Banana (Gemini) у стабільну гілку, нативну інтеграцію Topaz Gigapixel/Denoise/Sharpen, апскейл до 6144px і функцію Harmonize для вписування вирізок.
ChatGPT Atlas — браузер з агентним режимом, що самостійно клікає, заповнює форми і збирає дані на сайтах. Перший AI-браузер, який пройшов практичний тест із чекбоксами.
Google оновила VEO до версії 3.1; тепер генератор відео доступний прямо в Gemini через чатовий інтерфейс, а не лише через API або Flow.
OpenAI Platform отримала Agent Builder — візуальний конструктор для побудови AI-агентів і автоматизацій без коду, схожий на n8n.
Genspark-агент вміє самостійно встановлювати і запускати локальні AI-моделі — показаний конкретний кейс без ручних налаштувань.
Anthropic оновила Claude Sonnet 4.5 з функцією Context Editing (видалення застарілих результатів пошуку, до 84% економії токенів) та Memory tool для збереження між сесіями.
INSAIT Institute випустив MamayLM-Gemma-3-12B — мультимодальну open-source LLM, натреновану на українському контенті; підтримує текст і зображення, можна розгорнути локально.
Оновлення Photoshop Beta додало нативну підтримку Google Gemini 2.5 Flash та Flux 1 Kontext Pro — сторонні плагіни більше не потрібні. Доступно в Україні.
Сервіс для AI-мудбордів Adobe Firefly Boards офіційно вийшов з бети з новими відеоможливостями; доступний з України без VPN.
Безкоштовний вебінструмент Pixshop від Google дозволяє редагувати зображення 1184×864 через Nano Banana прямо в браузері без сторонніх плагінів.
Nano Banana Pro для Photoshop перейшов зі скрипта на повноцінний плагін з прямою інтеграцією Gemini API (Google AI Studio) без сторонніх прокладок.
Topaz Labs об'єднав Photo AI, Video AI та інші апки в єдину підписку $37/міс через Studio. Користувачі з кількома ліцензіями отримали знижки.
Parallel.ai розбиває дослідницькі запити на частини й обробляє їх паралельно, претендуючи на вищу якість ніж ChatGPT Deep Research. При реєстрації $20 кредитів.
Практичний приклад використання Genspark-агента для автоматичного порівняння цін у реселерів ЄС — проти ChatGPT, який виконав те саме за 40 хвилин.
Adobe виплатила третій бонус авторам контенту, чиї матеріали використовувались для навчання Firefly. Перевірити виплату можна в розділі Other Payments.
Генератор відео VEO 3 від Google перейшов з preview у стабільну версію і подешевшав вдвічі — до $3.2 за 8 сек. Відео без аудіо коштує ще менше.
Практичне порівняння Genspark, ChatGPT 5, Perplexity та Claude при пошуку польських новин: швидкість, точність і агентський режим.
Огляд мережі угод і судових позовів між AI-компаніями та видавцями. OpenAI лідирує за кількістю позовів, Cohere — найпроблемніший гравець з порушенням 4000+ авторських прав.
Google AI Studio рекомендує описувати сцену розповідним абзацом, а не переліком ключових слів — це дає цілісніший і якісніший результат від моделі Gemini.
Модель gemini-2.5-flash-image-preview (Nano Banana) генерує складні деталі й точково замінює елементи фото без зміни решти зображення. Інтеграція в Photoshop через Replicate обходиться $0.039 за генерацію.
Topaz Photo AI запустив бету Dust and Scratches для відновлення старих фото. Вимоги: Windows — 8 ГБ VRAM, Mac — M-chip з 16 ГБ RAM; Intel Mac не підтримується.
Система обробляє файли локально через vision-модель, генерує ключові слова та описи через GPT RAG-агент з базою гайдів фотобанків, пакує в JPEG і зберігає на Google Drive — 27 файлів за 34 хвилини без участі людини.
Якщо розмова містить потенційну загрозу іншим людям, вона потрапляє до модераторів і може бути передана правоохоронцям. Водночас розмови про суїцид залишаються конфіденційними.
Google випустив можливість редагувати фото текстовими інструкціями через модель gemini-2.5-flash-image-preview в AI Studio — фактично Photoshop через промпти без знання програми.
За даними Bloomberg, Apple розглядає можливість використання Google Gemini AI для оновлення Siri. Переговори тривають на фоні відставання Apple у розвитку власного AI.
GPT-5 самостійно шукає інформацію, аналізує матеріали й видає комплексні відповіді. Краще зберігає контекст у довгих діалогах порівняно з попередньою версією.
Нова кнопка Harmonize в Photoshop видаляє фон навколо об'єкта та гармонійно вписує його в кадр за допомогою AI — без ручного ретушування країв і кольорової корекції.
Diia Browser (не українська Дія) — це Chromium зі вбудованим AI-асистентом, який може клікати, скролити та читати вміст веб-сторінок. Корисний для аналізу відгуків та контенту сайтів.
Comet від Perplexity — це звичайний Chrome з усіма вашими вкладками й розширеннями плюс AI-асистент збоку. Краще справляється з контекстом сторінки, ніж конкуренти.
Проект: брати новини з Telegram-каналів, генерувати резюме через локальну LLM (Meta Llama 3.1 8B) і надсилати MP3 у Telegram-бот — усе безкоштовно на власному сервері без хмарних сервісів.
Replicate дозволяє запускати сотні AI-моделей (текст, фото, відео, аудіо) через єдиний веб-інтерфейс або API. Imagen-4 від Google доступний від $0.04 за зображення.
Українські дослідники створили ZNOVision — перший мультимодальний тест для AI українською мовою. Жодна модель не набрала 70%: Gemini Pro — 67.5%, GPT-4o — лише 47%. Найбільші проблеми — з візуальними елементами.
MCP (Model Context Protocol) сервери переводять Claude в іншу вагову категорію: пам'ять між діалогами, доступ до терміналу Mac, читання й зміна n8n-автоматизацій і файлової системи — все через природну мову.
Огляд AI-браузерів з вбудованими асистентами: Comet від Perplexity, Genspark, Diia Browser (Chromium) та Microsoft Edge. Comet поки недоступний звичайним підписникам за $20.
Українська компанія MacPaw створює AI-асистент Еней для Mac, що розуміє запити природною мовою, виконує рутинні дії, автоматизує складні задачі та сканує систему на загрози.
Дослідження Netcraft: лише 66% посилань від ChatGPT є правильними, 29% ведуть на неіснуючі сайти. Хакери реєструють ці домени і запускають фішинг-схеми, отримуючи трафік від ChatGPT.
Сервіс gitingest.com трансформує будь-який GitHub-репозиторій в єдиний текстовий блок — ідеально для передачі документації або коду в контекст ChatGPT чи Claude.
Getty Images не змогла довести порушення авторських прав і відмовилась від основного позову проти Stability AI у США. Британський позов триває.
У справі Bartz проти Anthropic суд відхилив позов авторів книг, що оскаржували спосіб отримання Anthropic їхніх творів. AI-компанії застосовують доктрину fair use як захист.
11.ai від ElevenLabs має інтеграцію з Perplexity та Google Calendar. Українська мова не підтримується за замовчуванням. Вартість: ~88 кредитів за 6 хвилин ($0.0086). Безкоштовний план — 10 000 кредитів на місяць.
Андрій Карпаті — колишній директор AI Tesla (розробка автопілота) та співзасновник OpenAI — прочитав базову лекцію про напрямки розвитку LLM для студентів стартап-школи.
Сервіс Rotato використовує AI для визначення оптимальних параметрів стиснення відео. Також вміє прискорювати, обрізати та кропати. Безкоштовно, без реєстрації і без лімітів.
Шведська Klarna, що замінила підтримку на AI, тепер запускає пілот з людьми. Причина: клієнти не хочуть спілкуватись з нейромережами. Компанія позиціонує це як «ексклюзивність ручної роботи».
Disney і Universal звинуватили Midjourney в навчанні на захищених зображеннях і генерації персонажів без ліцензії. Позивачі назвали сервіс «бездонною ямою плагіату».
Бриф, згенерований ChatGPT, містить «палевні маркери»: таблиці, структуровані списки, надлишок води. Рішення — живе обговорення: з 10 аркушів AI-тексту залишилось 10 чітких речень.
Genspark (засновники з Google і Baidu) автоматично комбінує GPT-4o, Claude 3.7 Sonnet, DeepSeek та генератори зображень і відео. Може робити презентації, таблиці, переклади.
Стартап BuilderAI 8 років продавав «AI-розробку додатків», приховуючи що 700 людей у Індії пишуть код вручну. Залучили $445 млн, включаючи від Microsoft. Офіційно визнано банкрутом.
Практичний кейс: кастомний GPT, навчений на гайдах фотобанків, генерує метадані для стокових фото. 50 рядків Python-коду на основі скріншотів замінили людей-аутсорсерів.
Adobe Stock посилив модерацію через перенасичення AI-контентом. Рівень прийняття фото впав з 90% до 20% у деяких авторів. Люди створили 300 млн фото за 20 років, AI — за 3 роки.
В Україні запрацював AI Overview — функція Google, яка показує коротке ШІ-резюме прямо під рядком пошуку, конкуруючи з Perplexity.
Google NotebookLM отримав мобільний застосунок для iOS та Android і підтримку подкастів українською: завантажте PDF або відео — отримайте аудіо-пояснення без галюцинацій.
Adobe Boards — новий інструмент для створення мудбордів і роботи над візуальними проектами з генерацією варіантів через Adobe Firefly; поки у закритому бета-тесті.
У Каліфорнії відкрився ресторан BurgerBots, де роботи збирають бургери за 27 секунд. Проект готувався з 2022 року і вже став атракціоном для сімей.
Сервіс Krea інтегрував апскейлер від Topaz Labs — хмарна альтернатива локальному Topaz Video AI ($300), зручна для разового використання.
Наталія Могилевська випустила кліп «Я весна» — повністю створений за допомогою ШІ. Це сигнал, що AI-відео-продакшн входить у мейнстрім музичної індустрії.
Детальний прогноз від команди дослідників: AGI очікується у 2027–2028, до 2030–2035 — або синергія людини з ШІ, або сценарій «захоплення контролю». Адаптивна інфографіка на ai-2027.com.
ШІ-ведучий австралійської радіостанції 9 годин на день спілкувався з аудиторією, крутив треки та вів вікторини — жоден слухач не запідозрив підміну. Профспілки б'ють на сполох.
Google додала у Gemini вбудований редактор зображень — можна змінювати як фото з телефону, так і раніше згенеровані ШІ-картинки.
Adobe Camera Raw 17.3 отримав дві ШІ-функції: Distracting People Removal (видалення випадкових людей з кадру) та Reflection Removal (прибирання відображень). Обидві у статусі Tech Preview.
Perplexity отримав доступ до системного асистента iOS — тепер українською мовою можна шукати в інтернеті, замовляти Uber, знаходити YouTube-відео та керувати календарем.
Дослідження (Gemini Deep Research + Claude) виявило 10 ключових трендів предметної фотографії: мінімалізм, лайфстайл-контекст, тактильність, ретро, гіперреалізм, ШІ та CGI.
Harvard Business Review описує реальні юзкейси генеративного ШІ у 2025 році та порівнює з 2024: що змінилось, як зросло ділове застосування ШІ-інструментів.
Perplexity запустив Telegram-бот @askplexbot — задавайте питання прямо в чаті або тегайте бота у групах, безкоштовно і без налаштувань.
Midjourney V7 — найважливіше оновлення: нейромережа враховує ваші уподобання, Draft Mode генерує у 10 разів швидше і вдвічі дешевше, додано голосовий ввід промптів.
Автор зробив з Claude простий погодний аналізатор для метеочутливих людей — наочний приклад практичного застосування ШІ для персонального автоматизованого інструменту.
Дослідження виявило, що ШІ-зображення їжі майже не відрізняються від реальних фото — з практичними наслідками для фудфотографів і маркетологів.
Adobe Stock отримав функцію Customize — дозволяє генерувати нові варіанти зображень на базі ліцензованих фото зі стоку за допомогою Adobe Firefly.
Cloudflare представив новий механізм захисту від ШІ-ботів — сайти можуть заблокувати автоматичне сканування їхнього контенту для навчання мовних моделей.
OpenAI випустив зручний сервіс озвучки тексту з вибором голосу — підтримує українську, дозволяє генерувати аудіо для дайджестів і подкастів.
Повне дослідження трендів фуд-фотографії на основі Gemini Deep Research та Claude: від автентичності та мінімалізму до ШІ-інтеграції. Доступні текстова і аудіо версії.
Автор протестував Gemini Deep Research: попросив дослідити ринок фуд і предметної фотографії в Україні — детальний звіт про можливості та обмеження інструменту.
Реальний тест функції редагування фото у Gemini 2.0 Flash — що вийшло, що ні, порівняння з Photoshop і ChatGPT за швидкістю та якістю.
Дослідження Roboflow «2025 Visual AI Trends» описує розвиток систем комп'ютерного зору: нові моделі, галузеві застосування, зростання точності розпізнавання.
До офіційного запуску ШІ-редактора фото в Gemini вже виник скандал: модель дозволяла змінювати расу людей і вносити маніпулятивні зміни у зовнішність на фотографіях.
Китайська модель Kontext (Black Forest Labs) дозволяє точково редагувати фото за текстовим описом: змінювати окремі об'єкти, не торкаючись решти зображення.
Нова бета-функція Photoshop на базі ШІ видаляє фон одним кліком — пряма конкуренція Remove.bg та Canva, але з якістю та контролем Photoshop.
Google NotebookLM нарешті відкрили для України — ШІ-інструмент для роботи з власними документами, подкастів із PDF і пошуку по записах зустрічей.
Порівняння Perplexity з DeepSeek, Gemini Deep Research та o1 від OpenAI у практичних задачах — що реально економить час.
Microsoft додав до безкоштовного Copilot thinking-режим на базі моделі o1 OpenAI — у відповідь на появу DeepSeek.
Perplexity додав китайську модель DeepSeek з режимом reasoning — покроковим описом логіки. Враження: може бути кращою за o1 від OpenAI.
У Samsung Galaxy S25 з'явилася AI-функція заміни обличчя із серії фотографій — щоб на груповому знімку всі дивились у кадр.
На Всесвітньому економічному форумі 2025 бізнес-лідери обговорили нову реальність: інтеграцію автономних ШІ-агентів у робочі команди, KPI для AI та появу «менеджерів ШІ».
YouTube вводить обов'язкове маркування згенерованого відео та надає музичним партнерам право видаляти AI-контент, що імітує їхній голос.
Adobe розширила Firefly функцією Bulk Create — можна генерувати до 10 000 зображень одночасно, робити ресайз під різні формати та змінювати фон у пакетному режимі.
Adobe Stock змінив налаштування: тепер згенерований AI-контент не показується в результатах пошуку за замовчуванням — його треба включати вручну у фільтрах.
NotebookLM від Google дозволяє додавати PDF, посилання на YouTube і задавати питання по матеріалу — на базі Gemini 2.0, безкоштовно (потрібен VPN).
Функція Spaces у Perplexity дозволяє створити AI-простір із власними файлами та інструкціями — наприклад, бота для рекомендацій фільмів або помічника по фото-техніці.
Особистий тест трьох AI-моделей на аналізі МРТ хребта: ChatGPT відмовився, Gemini — нестабільний, Claude — найкращий результат за 1 запит.
Поліція оприлюднила листування з ChatGPT, де підозрюваний у теракті в Лас-Вегасі розпитував про вибухівку — новий виклик для безпеки AI-систем.
ElevenLabs випустила застосунок Reader для iOS — озвучує статті, тексти і книги за посиланням багатьма мовами, включно з українською.
ElevenLabs представила AI-дублювання відео: інтерв'ю на YouTube доступне трьома мовами з войсовером, що зберігає тембр і емоції оригінального спікера.
Google презентував Veo 2 — нову модель txt2vid з помітно покращеною симуляцією фізики порівняно з попередником.
Особистий тест: Kling AI впорався з завданням з першого разу, тоді як Sora і Luma Dream Machine провалились після кількох спроб. Черга на безкоштовному плані — 2 години.
Порівняння ChatGPT Plus ($20/міс, Sora включена) і Google One AI Premium ($20/міс, Gemini + 2TB Drive): що вигідніше, і де Claude та Perplexity.
Gartner опублікував звіт про 10 стратегічних технологічних трендів 2025 року — PDF на 28 сторінок із детальним аналізом актуальних напрямків.
Оновлення iOS 18.2 принесло вбудований AI-рендер Playground — малюєте скетч (ідеально стілусом), а iPhone генерує зображення. Також глибша інтеграція ChatGPT з Siri.
Google випустив Gemini 2.0 зі streaming API — можна запустити трансляцію з камери смартфона, і AI коментує все, що бачить та чує, голосом у реальному часі.
YouTube тестує функцію автоматичного дублювання відео за допомогою AI: 8 мов для англомовного контенту та переклад в англійську з інших мов.
OpenAI запустив Sora для підписників ChatGPT Plus: генерація відео до 20 секунд та 1080p, 50 генерацій на місяць або необмежено за $200.
Topaz Gigapixel AI — провідний AI-інструмент для збільшення роздільної здатності фотографій. Ціна під час акції: $99 (нова ліцензія) або $54 (апгрейд).
OpenAI повідомив платним підписникам в Україні про введення 20% ПДВ («податок на Google») з початку 2025 року.
Perplexity AI запустив функцію Shopping: пошук товарів за текстовим запитом з порівнянням варіантів, а Snap to Shop — покупка за фото знайденого об'єкта.
VisualMind.ai — інструмент для автоматичного розпізнавання деталей фото і генерації метаданих для завантаження на фотостоки; альтернатива PhotoTag.
Актуальна версія робота Atlas від Boston Dynamics самостійно перекладає деталі між ящиками, використовуючи комп'ютерний зір — без операторського втручання.
Есе засновника Y Combinator Пола Грема: розвиток ШІ перетворить вміння писати на рідкісну навичку вибору, а не необхідності — що створить нову форму нерівності.
ChatGPT отримав власну пошукову функцію: відповідає на запити розмовною мовою і надає структуровані результати з посиланнями — прямий конкурент Google.
New York Times подав позов проти OpenAI за використання статей для навчання GPT — OpenAI відповіли, що NYT отримує нових читачів завдяки їм. Позов ілюструє ширші суперечки про авторські права і ШІ.
У 2023 році фейковий трек Drake & The Weeknd, згенерований ШІ з імітацією голосів, завірусився, заробив $10 тис. і був номінований на Grammy — після чого лейбли заблокували використання свого контенту для навчання нейромереж.
Midjourney запустили веб-редактор зображень — тепер можна завантажувати власні фото і редагувати їх ШІ-інструментами прямо в браузері.
Photoshop версії 25 при використанні генеративних інструментів автоматично вшиває мітку Content Credentials у файл — без можливості відключення; способи обійти через перезбереження.
Adobe Project Hi-Fi — майбутній плагін для Photoshop: малюєте базовий ескіз і в сусідньому вікні Firefly рендерить реалістичний об'єкт з правильним освітленням у реальному часі.
На конференції Adobe MAX 2024 представили Firefly 3, нейронку для генерації відео і окреме вікно варіацій — тепер можна робити варіації вибраного зображення, як у Midjourney.
Photoshop версії 26 автоматично знаходить і видаляє дроти, кабелі та людей на фоні, плюс нова функція Generate Similar для генерації схожих варіантів вибраного елемента.
На HuggingFace з'явився безкоштовний інструмент для автоматичного видалення фону з відеозаписів за допомогою нейромережі — без реєстрації.
Tesla офіційно представила гуманоїдних роботів Optimus вартістю $20 000 — для виробничих ліній та побутових завдань, у продажу з 2027.
tl;dv — сервіс для автоматичного конспектування відеозустрічей: бот приєднується до Google Meet, записує, транскрибує з розбивкою по спікерах і надсилає резюме на email. Розуміє українську.
ElevenReader — безкоштовний iOS-застосунок для озвучування будь-якого тексту ШІ-голосом: розуміє українську, англійську і мікс мов, замінює читання для довгих статей.
FLUX 1.1 — новий ШІ-генератор зображень, що відрізняється екстремальною швидкістю генерації; є демо де зображення оновлюється після кожного введеного символу промпту.
OpenAI Dev Day 2024: новий Realtime API дозволяє розробникам вбудовувати голосового асистента, що розмовляє як людина — демо показало дзвінок і замовлення 400 полуниць у кафе.
Американська компанія DoNotPay, що рекламувала ШІ-замінника юристів, виплатила $193 000 FTC за порушення: продукт не мав юридичної кваліфікації і не залучав фахівців для перевірки документів.
Sembly AI — сервіс для автоматичного конспектування онлайн-зустрічей: підключається до Google Meet, записує, транскрибує і генерує структуроване резюме.
Безкоштовний ШІ-інструмент на HuggingFace для заміни виділених об'єктів на фото — на основі Diffusers fast inpaint, без реєстрації.
Adobe Stock нарахував річний бонус контрибуторам за ліцензійний рік (червень 2023 — червень 2024) — компанія платить за використання фото/відео для навчання Adobe Firefly.
OpenAI представила модель o1, яка пройшла норвезький тест Mensa і продемонструвала рівень інтелекту вищий за 90% населення. Огляд можливостей нової моделі.
FLUX — безкоштовний AI-генератор картинок у браузері, що оновлює зображення в реальному часі під час введення запиту, без обмежень та реєстрації.
Автор перевірив OpenAI o1 на реальному питанні з логіки — розповідає, чим покроковий процес «думання» o1 відрізняється від GPT-4o і чому це корисно для наукових задач.
Короткий довідник по новій моделі o1-preview: відсутність пошуку та завантаження файлів, ліміт 30 запитів на тиждень, призначення для складних задач з фізики, хімії та коду.
Перше враження: o1 відмовляється відповідати, якщо не має інформації, і демонструє покрокові міркування — принципова відмінність від попередніх моделей.
Під час Apple Event шахраї запустили фейкову трансляцію з діпфейком CEO Тіма Кука і зібрали криптовалюту від 355 тисяч глядачів під виглядом «благодійності».
Adobe представила Firefly Video — модель для генерації відео через ШІ. Відкрито запис у бета-тестування.
LeiaPix — AI-сервіс, що перетворює плоске фото на зображення з ефектом паралаксу і глибиною. На старті дають 100 безкоштовних кредитів.
Midjourney запустив повноцінну браузерну версію і зробив базовий доступ безкоштовним — нові користувачі отримують 25 зображень, стрічку та перегляд кращих промптів.
McDonald's Japan у співпраці з AI-художником Kaku Drop створив рекламний ролик за допомогою Luma AI — приклад комерційного використання відеогенерації.
Огляд FLUX від Black Forest Labs — open source модель генерації картинок на рівні Midjourney за бенчмарками. Зібрані посилання: браузерні демо, генератор промптів та завантаження.
DeepLiveCam — популярний open source інструмент для створення діпфейків через веб-камеру: одна фотографія замінює обличчя в реальному часі, адаптується до освітлення.
Rows.com — сервіс таблиць з вбудованими AI-функціями та інтеграціями з популярними застосунками, що розширює можливості звичних Google Sheets.
Midjourney анонсував Editor — вбудований інструмент для внесення правок у вже згенеровані зображення прямо у вікні браузера без сторонніх редакторів.
Rotato — безкоштовний онлайн-інструмент зі вбудованим AI для стиснення відео до 90% з мінімальною втратою якості, без реєстрації та вотермарок.
Раніше AI-функції Google Фото були доступні лише на Pixel з підпискою Google One. Тепер видалення об'єктів, переміщення елементів і Magic Eraser — безкоштовні для всіх.
Огляд Perplexity.ai — пошукового сервісу на базі LLM: безкоштовна версія, мобільний застосунок, зручне вікно поряд з браузером. Автор майже не використовує Google.
OpenAI анонсував SearchGPT — прототип пошукового сервісу на базі ChatGPT. Поки доступний лише за wait list записом.
Ілон Маск оголосив, що заборонить iPhone у Tesla, SpaceX і X у відповідь на партнерство Apple з OpenAI для інтеграції ChatGPT в iOS 18.
Огляд нових функцій iOS 18 з акцентом на майбутню інтеграцію ChatGPT через партнерство Apple та OpenAI — відео з офіційної презентації.
GPT-4o розписала, які спеціальності під найбільшим ризиком заміни ШІ — детальний аналіз уразливих до автоматизації ролей.
Вийшов офіційний macOS-застосунок ChatGPT з функціями аналізу скріншотів екрану та голосовим режимом — аналогічний мобільній версії.
OpenAI показала, як GPT-4o може бути персональним вчителем — адаптований пояснення, голосовий діалог, інтерактивне навчання. Функція обіцяна у майбутньому.
Google інтегрував Gemini в Gmail, Google Maps та Google Drive — тепер можна ставити запити в контексті власних листів, місцезнаходження та файлів.
Берлінський фотобанк EyeEm, куплений Freepik, вирішив продати базу фотографій для тренування ШІ без згоди авторів. Якщо у вас є знімки там — є сенс їх видалити.
Phototag.ai — платний AI-сервіс для автоматичного прописування метаданих (ключових слів, описів) для мікростокових фотографій. 10к кредитів за $49 з промокодом 100OFF.
Adobe розробила ШІ-модель VideoGigaGAN, що підвищує роздільну здатність відео у 8 разів — з 128×128 до 1024×1024, усуваючи розмитість і артефакти. Дата релізу не оголошена.
Арт-проект NUCA — кастомна камера на базі Stable Diffusion, що генерує зображення тіла без одягу для дискусії про згоду, прозорість алгоритмів та суспільний вплив ШІ. Не продається.
29-річний Ноланд Арбо — перша людина з імплантом Neuralink — керував курсором і грав у шахи лише думкою. Стартап Ілона Маска презентував результат у березні 2024.
MacWhisper — застосунок для Mac на базі моделі Whisper від OpenAI. Large v3 модель добре розпізнає українську мову. Одноразова покупка, без підписки.
FigureAI та OpenAI показали робота Figure 01, що розуміє мову (ChatGPT), бачить (GPT-4 Vision) та чує (WhisperJAX) — і вміє самостійно аналізувати та складати посуд.
Business Insider опублікував перелік професій, що найбільше під загрозою від штучного інтелекту: дизайнери, бухгалтери, аналітики, журналісти, програмісти та інші.
Getty Images (iStock) додали до свого AI-генератора функції інпейнтингу — заміну елементів фото та generative expand на базі моделі Picasso від Nvidia.
Мексиканський Playboy вперше розмістив на обкладинці ШІ-модель Саманту Еверлі — весь контент якої генерується нейромережами, а бот спілкується з підписниками їхньою мовою.
Огляд чотирьох ШІ-сервісів для озвучки тексту: ElevenLabs (найдешевший, підтримує українську), Respeecher (українські корені), Wellsaid та AI Voicer (знаменитості).
Розгорнутий авторський аналіз: як Shutterstock AI (на базі DALL-E 3 та EXAONE), відбракування контенту для тренування моделей і генерація відео Sora змінюють бізнес-модель фотостоків і майбутнє авторів.
Стаття Time про те, як Україна стала майданчиком для випробування бойових AI-систем, зокрема Palantir — і які глобальні наслідки це матиме для майбутніх воєн.
OpenAI разом із learnprompting.org опублікували безкоштовний курс з 23 уроків про ефективне складання запитів до ChatGPT — на реальних прикладах користувачів, проходиться за 1 годину.
Google запустив платну підписку на найпотужнішу версію Gemini — Google One AI Premium за $20/міс (включно з 2 TB Google Drive). Для тих, хто вже платить $10 за Drive — доплата лише $10.
Midjourney V6 отримав команду --sref (style reference): завантажуєш зображення-референс, описуєш бажаний результат — і нейромережа генерує зображення у стилі референса.
Цікаве інтерв'ю (англ.): ШІ-ринок праці виявився зворотним — першими постраждали творчі індустрії, а не ручна праця. OpenAI першочергово хотів робити роботів, але зупинився на мовних моделях через браку інтелекту.
Google Bard оновився і став Gemini Pro — тепер доступний в Україні з генерацією зображень на базі ImageFX (з обмеженням на людей) і персоналізованими можливостями.
Prompting Guide (promptingguide.ai) — відкритий підручник з усіма техніками промтингу для ChatGPT, GPT-4, LLaMA, Mistral, Gemini, Phi-2 та інших мовних моделей.
Добірка перевірених промтів для генерації мокапів із зеленим екраном в Midjourney та DALL-E 3: MacBook, iPhone, кінотеатр, рука з телефоном та Мона Ліза з iPhone.
Данські дослідники створили ШІ-алгоритм, навчений на даних реєстру 6 млн жителів Данії, що прогнозує тривалість життя точніше наявних моделей — з наслідками для страхування та охорони здоров'я.
Рі Кудан — лауреатка престижної японської премії Акутагави — відкрито заявила, що близько 5% її призового роману написано ChatGPT, і планує продовжувати співпрацю зі ШІ.
OpenAI без анонсу змінив умови використання, прибравши заборону на military use case — тепер ChatGPT та API можна офіційно використовувати для військових потреб.
ChatGPT отримав функцію Memory — тепер асистент запам'ятовує контекст і вподобання між різними чатами. З'явились також тимчасові чати без збереження.
Midjourney навчилась генерувати зображення, які неможливо відрізнити від смартфонних фото. Промт: 'phone photo of [опис] posted to reddit in 2019 --style raw'.
Microsoft випустив окремий застосунок Copilot для iOS — чат на базі GPT-4 (безкоштовно, без підписки), без інших функцій Bing.
Відео-лекція, де ексвіцепрезидент Google пояснює різницю між навчанням нейромережі та людського мозку, і чому штучний інтелект потенційно небезпечний.
Squarespace опублікував прогноз трендів веб-дизайну на 2024: штучний інтелект, субтильна ностальгія, гіперреальність, аналоговий стиль і відродження мінімалізму.
Практична інструкція: увімкніть американський VPN, щоб отримати доступ до Gemini-версії Google Bard — за замовчуванням недоступна в Україні.
Google випустив мультимодальну модель Gemini у трьох версіях. Gemini Ultra перевершує GPT-4V в тестах на кілька відсотків. Розбір ключових відмінностей.
У Великій Британії порносайти зобов'язані перевіряти вік через ШІ, документи або банківські картки. Діти вперше стикаються з таким контентом у 13 років за даними досліджень.
Amazon запустив PartyRock — безкоштовний no-code інструмент для створення простих веб-додатків на основі ШІ. Не використовує ChatGPT, працює тільки англійською.
Reuters повідомив про проект Q* всередині OpenAI — потенційний прорив у загальному штучному інтелекті, здатному вирішувати математичні задачі. Саме він міг стати причиною звільнення Альтмана.
Runway.tv — перший онлайн-канал із безперервною стрічкою відео, згенерованих зі тексту. Демонстрація сучасних можливостей txt-to-video генерації.
Після кількаденної кризи Сем Альтман повернувся на посаду CEO OpenAI. Роль Microsoft з їхніми інвестиціями у $10 млрд виявилася ключовою.
Майже всі співробітники OpenAI погрозили звільнитися, якщо рада директорів не піде у відставку. Microsoft заявила про готовність прийняти всіх до себе.
Альтман та Брокман перейшли до Microsoft на чолі нової ШІ-команди. Новим CEO OpenAI став Еммет Шир, співзасновник Twitch.
Застосунок Pixelcut генерує реалістичні тіні для предметних фотографій, замінює фони і покращує якість. Доступний на iOS, Android і в браузері.
Рада директорів OpenAI несподівано звільнила CEO Сема Альтмана. Тимчасовим директором стала технічна директорка Міра Мураті. Причина — недостатня відвертість у спілкуванні.
Дослідники з Австралії, Великої Британії та Нідерландів виявили: 66% ШІ-згенерованих облич оцінюються людьми як реальні проти 51% справжніх фото. Це небезпечно для верифікації особистостей.
Runway анонсував Motion Brush для Gen-2 — інструмент, що дозволяє виділити частину зображення та анімувати лише її, зберігаючи решту статичною.
Adobe Firefly отримав функції переносу стилю між зображеннями та зміни текстури поверхні. Демонстрація нових інструментів генеративного ШІ від Adobe.
Waze буде попереджати водіїв про небезпечні ділянки дороги з частими аваріями, використовуючи звіти спільноти та штучний інтелект. Мета — зменшити 3600 смертей на добу через ДТП.
OpenAI оголосили про лігал-прикриття для корпоративних клієнтів: компанія захищатиме їх у суді при порушенні авторських прав через генерований контент. Не стосується безкоштовних і Plus-підписок.
OpenAI провела DevDay — найважливішу презентацію після першого iPhone: GPT-4-Turbo, всі моделі в одному чаті, GPTs-персоналізація без коду та GPT Store для публікації.
Автор звертає увагу на масове поширення ШІ-згенерованих зображень під час конфліктів і проблему фейкових «фото вибухів» на стоках, що потрапляють у новинні видання.
Runway випустили велике оновлення генератора GEN-2 з суттєво покращеною деталізацією та якістю відео. Всі приклади у пості створені виключно через GEN-2.
Generative Fill у Photoshop обробляється на хмарних серверах Adobe, а не локально. Без інтернету інструмент стає недоступним — незалежно від потужності комп'ютера.
Hackernoon опублікував неупереджений огляд 7 найкращих ШІ-генераторів зображень 2023 року. Що ще є, крім Midjourney.
Boston Dynamics додали ChatGPT до робота Spot, щоб той міг вести діалог і відповідати на запитання. Результат виглядає моторошно.
У ChatGPT Plus з'явилась генерація зображень через DALL-E 3 — швидша за Midjourney. Автор використовує голосовий діалог для мозкового штурму концепцій зйомки.
CTO OpenAI Міра Мураті заявила про новий інструмент визначення ШІ-згенерованих зображень з точністю 99%. Перед публічним запуском проходить внутрішні випробування.
Photofairy.ai — ШІ-редактор у браузері, що замінює базові функції Photoshop: генерація об'єктів, видалення, зміна фону. Не потребує встановлення.
Новий Photoshop може автоматично зберігати в метаданих файлу мітку про використання ШІ-генерації — назву моделі (наприклад, Adobe Firefly). Поки це опція, не обов'язкова вимога.
Adobe та Microsoft просувають стандарт позначення ШІ-контенту через ікону Content Authenticity Initiative. Зображення з Bing Chat вже матимуть таке маркування.
Дизайнер постера до серіалу Локі (Marvel) залишив артефакти ШІ-генерації — розмиті та неправильно відтворені цифри. Черговий приклад неналежного контролю якості ШІ-контенту.
Replicate.com — хмарна платформа для запуску ШІ-моделей з відкритим доступом: генерація зображень, текст, аудіо, відео та інше. Велика бібліотека готових моделей.
Автор помічає: Shutterstock дозволяє файлам, що не підходять для продажу, брати участь у платному навчанні нейромереж. Нова модель монетизації контенту фотографів.
Онлайн-сервіс на основі ШІ для збільшення роздільної здатності фотографій у 4 рази. Підтримує JPG і PNG, пакетна обробка, безкоштовно. Автор зазначає, що Topaz Gigapixel все ще краще.
Онлайн-інструмент генерує кілька варіантів 3D-моделей з готовими текстурами за текстовим промптом. До 5 годин безкоштовної генерації на добу.
Canva оновила угоду з авторами: стокові матеріали тепер можуть використовуватися для розробки та покращення продуктів, зокрема через ШІ та машинне навчання. Автори можуть заборонити це використання.
Adobe переводить генеративну заливку у Photoshop на модель кредитів: тариф Creative Cloud з Photoshop+Lightroom дає 500 генерацій, All Apps — 1000. Після вичерпання генерації уповільнюються або можна докупити.
Getty Images представила генератор фото, навчений виключно на ліцензованому контенті власної бази. Згенеровані зображення будуть «чистими» по правах, а фотографи — отримуватимуть відсоток від продажів.
Після комерційного запуску Adobe Firefly авторам стокового контенту нарахований бонус за участь їхніх фото в тренуванні нейромережі. Виплати відображаються в порталі автора.
Adobe додає AI-інструменти до Premiere Pro: автоматичне видалення стороннього шуму, зачистка слів-паразитів, регулювання рівня шумів. Функції доступні в бета-версіях, повний запуск — 2023 рік.
Adobe перенесла генеративну заливку Firefly з бета-версії до основного Photoshop. Для доступу достатньо оновити програму.
Square Off — фізична шахова дошка, якою керує нейромережа: фігури переміщуються автоматично через магніти. Можна грати з ІІ-опонентом, вчитися з підсвіткою ходів або стежити за чужою грою в реальному часі. Ціна $200–500.
GOYO — онлайн-інструмент на базі ШІ для очищення аудіо від сторонніх шумів. Потрібно лише завантажити файл і активувати плагін — результат готовий без ручного налаштування.
Textify — онлайн-сервіс для заміни «тарабарщини» від нейромереж на коректний текст прямо на зображенні. Виділіть область, введіть потрібний напис — сервіс вбудовує його природно.
Добірка безоплатних онлайн-курсів для початківців у темі ШІ: Основи AI від Google, Prompt Engineering від Prometheus, Machine Learning від Google, AI for Everyone на Coursera та інші.
Amazon тестує в США функцію автоматичного узагальнення відгуків покупців за допомогою генеративного ШІ — на картці товару відображається короткий підсумок ключових думок.
Aixploria — каталог популярних ШІ-інструментів, згрупованих за категоріями: зображення, текст, відео, музика, бізнес тощо. Є рейтинг топ-10 ШІ у кожній категорії.
Google Bard відкрився для українців: чат-бот відповідає українською, підтримує голосові відповіді, експорт Python-коду в Replit та Google Colab, впорядкування розмов.
Plugin.surf — агрегатор плагінів для ChatGPT з зручним пошуком і структурованою базою. Допомагає знайти потрібне розширення серед сотень доступних варіантів.
Більша частина топ-100 книжок на Amazon виявилась згенерованою ШІ з безглуздими назвами. Платформа почала видалення такого контенту, який отримав назву «Books of Nonsense».
Детальна аналітика сервісу Stockperformer: ШІ поки не руйнує стокові продажі — STR для AI-контенту нижчий (9% vs 13%), але RPI/m вищий ($0.17 vs $0.0375). Відео ще не постраждало. Ілюстратори — під загрозою вже зараз.
Стоковий фотобанк 123RF дозволяє клієнтам генерувати зображення на основі ліцензованого контенту — і автор оригінального фото отримує ті самі роялті, що й від звичайного продажу. Роздільна здатність генерацій: 2560×2560 пікселів, 300 dpi.
Shutterstock відкриває для AI-компаній ліцензування контенту, що не пройшов стандартний відбір для продажу. Цей контент відображатиметься в порталі контрибютора у розділі Data Catalog.
Google офіційно рекомендував своїм співробітникам не вводити конфіденційну та персональну інформацію в AI-чатботи — в тому числі в Bard власної розробки — через ризики витоку та відтворення діалогів.
Саммарі лекції Юваля Гарарі про розвиток ШІ: головна загроза — не фізичні роботи, а захоплення мовою і сторітеллінгом. ШІ може маніпулювати через інтимність, руйнувати демократію і створювати «завісу ілюзій».
Новітня лекція Юваля Гарарі про те, як насправді може відбутись «захоплення» людства штучним інтелектом — не фізично, а через чати та соціальні медіа, де вже немає гарантії, що по той бік людина.
Американський адвокат скористався ChatGPT при підготовці документів і подав до суду посилання на вигадані справи — реальний кейс про галюцинації LLM і чому важливі спеціалізовані юридичні моделі.
Огляд агрегатора theresanaiforthat.com — тисячі ШІ-інструментів з пошуком за задачами, без зайвих блогерських списків.
Компанія Neuralink Ілона Маска отримала дозвіл на клінічні випробування нейроімплантів у людей — огляд новини та роздуми про майбутнє комп'ютерних інтерфейсів мозку.
Аналіз тренду: фотостоки будують власні генеративні моделі на ліцензованому контенті, а 123RF зробили крок далі — дозволяючи клієнтам генерувати і одразу ліцензувати зображення для інших.
Посилання на офіційний гайд Adobe по Generative Fill у Photoshop — покрокове використання функції генеративного заповнення на основі Adobe Firefly.
У бета-версії Photoshop з'явився Generative Fill: виділяєш область, описуєш текстом — ШІ вставляє об'єкт. Adobe інтегрувала Firefly безпосередньо в редактор.
Міжнародний фотоконкурс Oneeyeland оновив умови після скандалу зі ШІ-зображенням — генерований контент виключено, бо не відображає вміння фотографа.
Огляд MacWhisper — нативний macOS-застосунок для перетворення аудіо/відео в текст на базі Whisper; базова версія безкоштовна, розуміє українську.
hf.co/chat — безкоштовний чат-бот від Hugging Face на відкритих моделях, доступний без реєстрації та верифікації номера телефону.
Автор ШІ-роботи, яка перемогла у конкурсі Sony World Photography Awards, відмовився від призу — і запропонував передати його одеському кінофестивалю. Організатори в розгубленості.
У бета-версії Photoshop з'явився Remove Tool — ШІ-інструмент видалення об'єктів, значно потужніший за Content-Aware Fill, хоч поки аналізує лише сусідні пікселі.
У Photoshop Beta з'явився Remove Tool — новий ШІ-інструмент для видалення небажаних елементів з фото, значно потужніший за Content-Aware Fill.
Огляд Perplexity.ai — ШІ-пошуковика на базі GPT з веб-інтерфейсом, мобільним додатком і розширенням Chrome; видає структуровані відповіді з посиланнями замість списку сайтів.
Актуальний список стокових майданчиків, що приймають ШІ-контент: Adobe, Dreamstime, Alamy, Freepik, Pond5, Canstockphoto, Ingram — з посиланнями на умови кожного.
Відкритий лист із підписами Ілона Маска, Стіва Возняка та понад тисячі науковців і менеджерів — з вимогою ввести 6-місячний мораторій на тренування систем ШІ, потужніших за GPT-4.
Ключові тези з інтервʼю Сема Алтмана — реальний тренд vs хайп, продукт про який розповідають друзям, оптимізм засновника, «ми розберемось» як мантра і чому новачки роблять неможливе.
Adobe представила Firefly — власну генеративну ШІ-платформу: text-to-image, декоративні літери з тексту та ширший набір інструментів; відкрита бета для реєстрації.
Мисткиня Олена Данилюк використала ШІ для візуалізації стародавнього карпатського вбрання — надихаючий приклад поєднання ШІ-генерації та реальних зйомок в українській культурній стилістиці.
PimEyes — ШІ-сервіс зворотного пошуку зображень по обличчю: знаходить фото конкретної людини навіть якщо зображення змінені, працює тільки з фото обличчя.
Replicate надає доступ до GFP-GAN — нейронної мережі для покращення якості, відновлення деталей та «апскейлу» портретних фотографій прямо через браузер.
PromptBase — перша велика платформа для купівлі-продажу ефективних промптів до популярних нейромереж; дозволяє монетизувати навички prompt engineering.
Порівняння Bing Chat (Microsoft) та Google: пошуковик Microsoft на базі GPT-4 дає конкретніші відповіді з посиланнями, тоді як Google повертав статтю з Вікіпедії та новини.
CarNet.AI — ШІ-інструмент для OSINT: визначає марку, модель, рік і покоління авто за фото; корисний для журналістів та розслідувачів при роботі з корупційними матеріалами.
Кейс Jos Avery: акаунт у Instagram з 32k підписників та схваленими портретами — виявився на 95%+ згенерованим у Midjourney; ніхто не помітив.
Getty Images судиться зі Stability AI у Лондоні — звинувачення у несанкціонованому використанні 12 млн ліцензованих фото для тренування Stable Diffusion; модель навіть генерує логотип Getty.
Відоме американське видавництво Clarkesworld призупинило прийом нових творів після того, як 500 рукописів за лютий 2023 виявились написаними ChatGPT — до запуску таких було ~10/місяць.
Synthesia.io — платформа для створення відео з реалістичними ШІ-аватарами та озвучкою по тексту; підходить для навчальних матеріалів та корпоративних презентацій без знімальної групи.
Засновники Instagram Кевін Систром та Майк Кріґер запустили Artifact — персоналізований новинний агрегатор на базі ШІ; відкрита бета після закритого тестування.
AICyclopedia.com — систематизований каталог понад 1000 ШІ-інструментів з розбивкою за категоріями: текст, зображення, відео, аудіо, продуктивність тощо.
Міжнародна юридична компанія впроваджує чат-бот на базі ChatGPT для первинних консультацій — аналогія з майбутнім впровадженням ШІ в медицину та онлайн-послуги.
Lexica.art — галерея зображень на базі Stable Diffusion 1.5 з можливістю пошуку по базі та перегляду промптів; 100 безкоштовних генерацій для тестування.
Команда Мінцифри після офіційних листів та зустрічей з OpenAI досягла розблокування ChatGPT для України — сервіс доступний на всій підконтрольній території.
Cleanup.pictures — безкоштовний онлайн-сервіс для швидкого видалення непотрібних елементів з фотографій на базі ШІ; аналог Content-Aware Fill без необхідності встановлювати Photoshop.
Практичний приклад: автор написав лише текст запиту, GPT-3 (ChatGPT) згенерував повне вибачення клієнту у діловому стилі — перші враження від інструменту в реальних задачах бізнесу.
Runway (runwayml.com) — платформа з десятками ШІ-інструментів: видалення фону з відео, генерація відео, редагування аудіо; безкоштовний базовий план, платний від $12/місяць.
AutoDraw від Google — безкоштовний онлайн-інструмент: малюєш від руки, ШІ пропонує схожі чисті векторні іконки; PNG на виході, відкрите питання щодо комерційного використання.
Washington Post опублікував інтерактивне пояснення як нейронні мережі генерують зображення — картинка формується з шуму, а не компонується з інших; тренування на захищених авторськими правами фото — окрема проблема.
Apple відкрила оптимізований порт Stable Diffusion для чіпів M1 та M2 — рендеринг однієї картинки займає ~30 секунд без хмари та підключення до GPU-серверів.
Огляд ШІ-інструменту для автоматичної колоризації чорно-білих фотографій — нейронна мережа аналізує контекст і підбирає реалістичні кольори без ручного редагування.
Перший великий фотосток заборонив прийом контенту, згенерованого AI-інструментами. Автор вважає це логічним кроком через невирішені питання авторських прав.
Нейромережа Clipdrop Relight дозволяє коригувати положення та характер освітлення на вже знятих фотографіях — безпосередньо в браузері, без складного ПЗ.
Репозиторій на GitHub із ретельно відібраним списком AI-моделей, інструментів prompt-дизайну та помічників для генерації зображень — від спільноти.
Авторська думка про те, що AI-генерація зображень — природний розвиток мистецтва, як свого часу фотографія. Також про нову спеціалізацію prompt engineer.
Stable Diffusion доступний через зручний сайт DreamStudio.ai і безкоштовну версію на HuggingFace. Автор ділиться першими враженнями та порівнює з Midjourney і DALL-E.
GFP-GAN — відкрита AI-технологія для реставрації пошкоджених та розмитих портретних фото: за кілька секунд заповнює деталі обличчя, зберігаючи ідентичність людини.
Огляд безкоштовних інструментів для синтезу мовлення українською: Google Translate, HuggingFace-моделі wav2vec2 і Coqui TTS з вибором голосу та наголосів.
Krisp.ai прибирає шум, голоси та фонові звуки в реальному часі під час відеодзвінків — за допомогою нейромережі. Безкоштовна версія з лімітом використання.