avva: (Default)
[personal profile] avva
http://www.acapela-group.com/text-to-speech-interactive-demo.html

В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.

Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?
Page 1 of 5 << [1] [2] [3] [4] [5] >>

Date: 2010-07-03 06:43 pm (UTC)
From: [identity profile] xxqs.livejournal.com
у меня трёхлетней давности TomTom-навигатор синтезирует слова на английском вполне прилично. Названия городов почти не врёт.

Date: 2010-07-03 06:44 pm (UTC)
From: [identity profile] xxqs.livejournal.com
на названия швейцарских улиц ему мощности не хватает - заканчивает произносить, когда поворот уже пройден

Date: 2010-07-03 06:45 pm (UTC)
From: [identity profile] ya-doran.livejournal.com
Слова на русском в разы сложнее синтезировать, мне кажется.

Date: 2010-07-03 06:46 pm (UTC)
From: [identity profile] avva.livejournal.com
GPSный голос, подозреваю, на порядок проще синтезировать, чем любой текст - это задача совсем другого уровня сложности. Все основные куски фраз записываются заранее, надо только синтезировать отдельные слова-названия, с интонацией можно не возиться, с паузами тоже, итд.

Date: 2010-07-03 06:47 pm (UTC)
From: [identity profile] xxqs.livejournal.com
правила чтения вполне детерминированные и формализуемые - так что не знаю, насколько сложнее

Date: 2010-07-03 06:48 pm (UTC)
From: [identity profile] xxqs.livejournal.com
согласен. На полноценную речь там всё же цпу недостаточно быстрый. да и не нужна она там :)

Date: 2010-07-03 06:49 pm (UTC)
From: [identity profile] http://users.livejournal.com/_nik_/
Довольно неплохо говорит, да. Немного с ударениями ошибается, но так у всех.
А вот когда же её портируют под android, чтобы мне мой телефон книжки голосом читал? (windows mobile телефон уже несколько лет как книжки голосом читать умеет, а вот новый google nexus one ещё не научился).

Date: 2010-07-03 06:50 pm (UTC)
From: [identity profile] valen00k.livejournal.com
Испытанием "Эйяфьятлайокудль"ем не выдержала, но в целом впечатляет.

Date: 2010-07-03 06:53 pm (UTC)
From: [identity profile] niobium0.livejournal.com
замечательно работает! забавные ошибки начинаются, если кормить синтезатор стихами: все же интонирование заточено под разговорную речь.

Date: 2010-07-03 06:54 pm (UTC)
From: [identity profile] ezhik-israely.livejournal.com
я не знаю про другие фирмы, но мне мои "слушающие" друзья советовали именно эту фирму, с этой "Аленой" как один из лучших (приятный на слух) вариантов озвучки текстов.

"Алена" прочитала это пост с ударением "глючИт" :)

Date: 2010-07-03 06:54 pm (UTC)
From: [identity profile] incogn1too.livejournal.com
Хорошо постарались. Когда последний раз интересовался синтезом голоса - дела обстояли гораздо хуже.

Date: 2010-07-03 06:54 pm (UTC)
From: [identity profile] http://users.livejournal.com/malfet_/
С той поры, как отказались от дифонов и начали использовать Марковские цепи качество синтеза речи сильно повысилось. Если интересно - вот здесь есть небольшая подборка статей по теме.

Date: 2010-07-03 06:57 pm (UTC)
spamsink: (Default)
From: [personal profile] spamsink
"Полили ли лилии?" - очень плохо, и дело не только в ударении в слове "полили".

"На дворе трава. На траве дрова?" - повествовательная и вопросительная интонация не отличаются.

Так что

Date: 2010-07-03 06:58 pm (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Скороговорками ее хорошо кормить.

Date: 2010-07-03 07:06 pm (UTC)
From: [identity profile] zhilyaev-v.livejournal.com
Отличная программа.

Date: 2010-07-03 07:08 pm (UTC)
From: [identity profile] imfromjasenevo.livejournal.com
класс, поймал на зммеееде, длиношеее
тоже не может взять

Date: 2010-07-03 07:08 pm (UTC)
From: [identity profile] klonkaktusa.livejournal.com
"Р" плохо выговаривает.

Date: 2010-07-03 07:10 pm (UTC)
From: [identity profile] anita43765.livejournal.com
ааа, офигенно говорит! огрехи есть, конечно, но у кого их нет.

Date: 2010-07-03 07:14 pm (UTC)
From: [identity profile] gambo.livejournal.com
это как раз показатель правильного синтезатора- его и люди не выдерживают

Date: 2010-07-03 07:23 pm (UTC)
From: [identity profile] the-netwalker.livejournal.com
По сравнению с тем малым, что я слышал - говорит прекрасно.
Однако, на удивление "Алена" споткнулась на простейшем:
"Няка", получилось почему-то "никА".

Date: 2010-07-03 07:24 pm (UTC)

Date: 2010-07-03 07:27 pm (UTC)
From: [identity profile] gruimed.livejournal.com
У Алены смешной акцент на английском

Date: 2010-07-03 07:30 pm (UTC)
From: [identity profile] gaal.livejournal.com
Some of the English ones suck too. But some got me floored.

Date: 2010-07-03 07:31 pm (UTC)
From: [identity profile] baramin.livejournal.com
Я был сильно в теме TTS/ASR по состоянию на 2006 год (SmartphonePro).
Эти парни неплохи, но Real Speaker от разорившейся Lernout&Hauspie звучал лучше (не путать с их же базовым TTS). Их разорение нанесло колоссальный вред индустрии - до того момента они подобрали под себя все приличные начинания. Real Speaker стоил, как живой слон и грузил CPU не хуже ASR, но сгенерированные им сообщения кране мало отличались от дикторских.
Инженеры из L&H И MS соглашались в одном - сделать TTS начального уровня значительно проще, чем ASR командного языка (ограниченной грамматики) "того же" уровня. Сделать приличный TTS, слабо отличающийся от человеческого, сравнимо со свободным распознаванием речи. Чудовищное количество исключений, аббревиатур, дат и числительных.
Вообще как-то все в ступоре. От соответствующего подразделения MS я года 3 ничего не слышал - после SAPI 5.1 они так ничего и не совершили. А была очень сильная команда.
О Dragon Dictation тоже как-то не слышно особо.

Date: 2010-07-03 07:32 pm (UTC)
From: [identity profile] annie-celeblas.livejournal.com
Очень неплохо, особенно prosody, с ударениями тоже справляется (а это очень нетривиально). У нас не так хорошо получается. ;-)
Хотя я про эту фирму даже не слышала. В принципе, хорошей считается Nuance.
Page 1 of 5 << [1] [2] [3] [4] [5] >>

February 2026

S M T W T F S
1 2 3 4 5 67
8 9 10111213 14
15 16 17 18192021
2223 2425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 24th, 2026 03:22 pm
Powered by Dreamwidth Studios