avva | текст в речь

http://www.acapela-group.com/text-to-speech-interactive-demo.html

В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.

Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?

Page 1 of 5 << [1] [2] [3] [4] [5] >>

Threaded | Top-Level Comments Only

From:

xxqs.livejournal.com

у меня трёхлетней давности TomTom-навигатор синтезирует слова на английском вполне прилично. Названия городов почти не врёт.

From:

xxqs.livejournal.com

на названия швейцарских улиц ему мощности не хватает - заканчивает произносить, когда поворот уже пройден

From:

ya-doran.livejournal.com

Слова на русском в разы сложнее синтезировать, мне кажется.

From:

avva.livejournal.com

GPSный голос, подозреваю, на порядок проще синтезировать, чем любой текст - это задача совсем другого уровня сложности. Все основные куски фраз записываются заранее, надо только синтезировать отдельные слова-названия, с интонацией можно не возиться, с паузами тоже, итд.

From:

xxqs.livejournal.com

правила чтения вполне детерминированные и формализуемые - так что не знаю, насколько сложнее

From:

xxqs.livejournal.com

согласен. На полноценную речь там всё же цпу недостаточно быстрый. да и не нужна она там :)

From:

http://users.livejournal.com/_nik_/

Довольно неплохо говорит, да. Немного с ударениями ошибается, но так у всех.
А вот когда же её портируют под android, чтобы мне мой телефон книжки голосом читал? (windows mobile телефон уже несколько лет как книжки голосом читать умеет, а вот новый google nexus one ещё не научился).

From:

valen00k.livejournal.com

Испытанием "Эйяфьятлайокудль"ем не выдержала, но в целом впечатляет.

From:

niobium0.livejournal.com

замечательно работает! забавные ошибки начинаются, если кормить синтезатор стихами: все же интонирование заточено под разговорную речь.

From:

ezhik-israely.livejournal.com

я не знаю про другие фирмы, но мне мои "слушающие" друзья советовали именно эту фирму, с этой "Аленой" как один из лучших (приятный на слух) вариантов озвучки текстов.

"Алена" прочитала это пост с ударением "глючИт" :)

From:

incogn1too.livejournal.com

Хорошо постарались. Когда последний раз интересовался синтезом голоса - дела обстояли гораздо хуже.

From:

http://users.livejournal.com/malfet_/

С той поры, как отказались от дифонов и начали использовать Марковские цепи качество синтеза речи сильно повысилось. Если интересно - вот здесь есть небольшая подборка статей по теме.

From:

spamsink

"Полили ли лилии?" - очень плохо, и дело не только в ударении в слове "полили".

"На дворе трава. На траве дрова?" - повествовательная и вопросительная интонация не отличаются.

Так что

From:

spamsink

Скороговорками ее хорошо кормить.

From:

zhilyaev-v.livejournal.com

Отличная программа.

From:

imfromjasenevo.livejournal.com

класс, поймал на зммеееде, длиношеее
тоже не может взять

From:

klonkaktusa.livejournal.com

"Р" плохо выговаривает.

From:

anita43765.livejournal.com

ааа, офигенно говорит! огрехи есть, конечно, но у кого их нет.

From:

gambo.livejournal.com

это как раз показатель правильного синтезатора- его и люди не выдерживают

From:

the-netwalker.livejournal.com

По сравнению с тем малым, что я слышал - говорит прекрасно.
Однако, на удивление "Алена" споткнулась на простейшем:
"Няка", получилось почему-то "никА".

From:

raydac.livejournal.com

From:

gruimed.livejournal.com

У Алены смешной акцент на английском

From:

gaal.livejournal.com

Some of the English ones suck too. But some got me floored.

From:

baramin.livejournal.com

Я был сильно в теме TTS/ASR по состоянию на 2006 год (SmartphonePro).
Эти парни неплохи, но Real Speaker от разорившейся Lernout&Hauspie звучал лучше (не путать с их же базовым TTS). Их разорение нанесло колоссальный вред индустрии - до того момента они подобрали под себя все приличные начинания. Real Speaker стоил, как живой слон и грузил CPU не хуже ASR, но сгенерированные им сообщения кране мало отличались от дикторских.
Инженеры из L&H И MS соглашались в одном - сделать TTS начального уровня значительно проще, чем ASR командного языка (ограниченной грамматики) "того же" уровня. Сделать приличный TTS, слабо отличающийся от человеческого, сравнимо со свободным распознаванием речи. Чудовищное количество исключений, аббревиатур, дат и числительных.
Вообще как-то все в ступоре. От соответствующего подразделения MS я года 3 ничего не слышал - после SAPI 5.1 они так ничего и не совершили. А была очень сильная команда.
О Dragon Dictation тоже как-то не слышно особо.

From:

annie-celeblas.livejournal.com

Очень неплохо, особенно prosody, с ударениями тоже справляется (а это очень нетривиально). У нас не так хорошо получается. ;-)
Хотя я про эту фирму даже не слышала. В принципе, хорошей считается Nuance.

Page 1 of 5 << [1] [2] [3] [4] [5] >>

Threaded | Top-Level Comments Only

Profile

avva

Website

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Feb. 24th, 2026 03:22 pm

Ни о какой безапелляционности в моих высказываниях не может быть и речи!

(...)

текст в речь

текст в речь

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

February 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags