☕️ Кава з пінкоюнотатки про ШІ, технології та творчість
Читати в Telegram →
30 березня 2026 · переглядів у Telegram

Застосунки для диктування: порівняння voice-to-text рішень на базі Whisper та LLM

Застосунки для диктування: порівняння voice-to-text рішень на базі Whisper та LLM

Я тут писав раніше про апки для диктування. Останній місяць я диктую більше ніж ввожу з клавіатури. І на ноуті і на тел.

Особливо це прикольно з аішкою (клод код, наприклад), коли йому надиктував шо треба зробити, кнопку нажав і займаєшся своїми справами, а воно робиться).

А ще зручно на тел за кермом.

Зробив табличку порівняння в ПДФ більшості апок для переводу голосу в текст на базі різних моделей. Там і посилання і деталі станом на сьогодні. ПДФ в коментарі закину

Для мене ще критично, щоб модель якісно розуміла мікс мов в 1 реченні. Наприклад українська + англ. До речі тому локальний безкоштовний whisper (навіть ультра) не дуже підходить із мого досвіду субʼєктивно.

🌊 А ще я тестую українську голосом класикою:

Реве та стогне Дніпр широкий

Сердитий вітер завива,

Додолу верби гне високі,

Горами хвилю підійма.

На цьому сипеться більшість моделей))

Наразі юзаю Speakly від Genpark поки вона безкоштовна.

↗ Оригінал поста в Telegram
Довідка

Whisper — відкрита модель розпізнавання мовлення від OpenAI; підтримує багато мов і суміші мов; використовується як локальна (без хмари) або хмарна основа для voice-to-text застосунків.

Які застосунки для диктування (voice-to-text) є на Mac і iOS?
Автор порівняв більшість популярних у PDF-таблиці; серед критеріїв — якість розуміння суміші мов (укр + англ) в одному реченні.
Чи можна диктувати українською та англійською в одному реченні?
Так — деякі застосунки (на базі Whisper Large) добре справляються з мікс-мовними реченнями без ручного перемикання мови.

Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.

Підписатися в Telegram