avva: (Default)
[personal profile] avva
Модель Whisper с феноменальным качеством транскрибирования голоса вышла два года назад, но мне все еще очень не хватает следующей простой штуки:

1. втыкаешь в нее URL на ютуб, или засылаешь аудио-файл.
2. получаешь текст: удобно отформатированный, разбитый на абзацы и реплики, со знаками препинания и РАЗБИТЫЙ НА СОБЕСЕДНИКОВ (техническое название "диаризация").
3. Это все. Третьего пункта не надо.

Кто-нибудь знает, есть ли такое? Если есть, я буду постоянно пользоваться, донатить, могу заплатить за сервис (если качество реально офигенное и допиливать руками ничего не надо).

Каждые несколько месяцев я пытаюсь найти такое, нахожу несколько разных Github-репозиторий в духе "соберите сами из Whisper, этой отдельной сетки для диаризации, говна и палок", но оно обычно сырое, или сомнительного качества диаризация, или вообще не работает для не-английского языка. Если есть такое "поднимите сами", но вылизанное, как конфекта, и реально работает, я тоже не против, дайте ссылку. Если есть сайт, дайте сайт. Спасибо!
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

April 2025

S M T W T F S
   1 2 3 45
6 7 89 10 11 12
1314 15 1617 1819
2021 2223242526
27282930   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 23rd, 2025 10:47 am
Powered by Dreamwidth Studios