avva: (Default)
avva ([personal profile] avva) wrote2010-07-03 09:39 pm

текст в речь

http://www.acapela-group.com/text-to-speech-interactive-demo.html

В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.

Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?

[identity profile] xxqs.livejournal.com 2010-07-03 06:43 pm (UTC)(link)
у меня трёхлетней давности TomTom-навигатор синтезирует слова на английском вполне прилично. Названия городов почти не врёт.

[identity profile] xxqs.livejournal.com 2010-07-03 06:44 pm (UTC)(link)
на названия швейцарских улиц ему мощности не хватает - заканчивает произносить, когда поворот уже пройден

(no subject)

[identity profile] ya-doran.livejournal.com - 2010-07-03 18:45 (UTC) - Expand

(no subject)

[identity profile] xxqs.livejournal.com - 2010-07-03 18:47 (UTC) - Expand

(no subject)

[identity profile] avva.livejournal.com - 2010-07-03 18:46 (UTC) - Expand

(no subject)

[identity profile] xxqs.livejournal.com - 2010-07-03 18:48 (UTC) - Expand

[identity profile] http://users.livejournal.com/_nik_/ 2010-07-03 06:49 pm (UTC)(link)
Довольно неплохо говорит, да. Немного с ударениями ошибается, но так у всех.
А вот когда же её портируют под android, чтобы мне мой телефон книжки голосом читал? (windows mobile телефон уже несколько лет как книжки голосом читать умеет, а вот новый google nexus one ещё не научился).

[identity profile] valen00k.livejournal.com 2010-07-03 06:50 pm (UTC)(link)
Испытанием "Эйяфьятлайокудль"ем не выдержала, но в целом впечатляет.

[identity profile] gambo.livejournal.com 2010-07-03 07:14 pm (UTC)(link)
это как раз показатель правильного синтезатора- его и люди не выдерживают

[identity profile] niobium0.livejournal.com 2010-07-03 06:53 pm (UTC)(link)
замечательно работает! забавные ошибки начинаются, если кормить синтезатор стихами: все же интонирование заточено под разговорную речь.
spamsink: (Default)

[personal profile] spamsink 2010-07-03 06:58 pm (UTC)(link)
Скороговорками ее хорошо кормить.

(no subject)

[identity profile] 1master.livejournal.com - 2010-07-03 22:24 (UTC) - Expand

(no subject)

[personal profile] spamsink - 2010-07-04 02:24 (UTC) - Expand

(no subject)

[identity profile] sachse.livejournal.com - 2010-07-04 22:34 (UTC) - Expand

(no subject)

[identity profile] syarzhuk.livejournal.com - 2010-07-16 02:03 (UTC) - Expand

(no subject)

[identity profile] nu57.livejournal.com - 2010-07-07 22:01 (UTC) - Expand

[identity profile] ezhik-israely.livejournal.com 2010-07-03 06:54 pm (UTC)(link)
я не знаю про другие фирмы, но мне мои "слушающие" друзья советовали именно эту фирму, с этой "Аленой" как один из лучших (приятный на слух) вариантов озвучки текстов.

"Алена" прочитала это пост с ударением "глючИт" :)

[identity profile] incogn1too.livejournal.com 2010-07-03 06:54 pm (UTC)(link)
Хорошо постарались. Когда последний раз интересовался синтезом голоса - дела обстояли гораздо хуже.

[identity profile] http://users.livejournal.com/malfet_/ 2010-07-03 06:54 pm (UTC)(link)
С той поры, как отказались от дифонов и начали использовать Марковские цепи качество синтеза речи сильно повысилось. Если интересно - вот здесь есть небольшая подборка статей по теме.

[identity profile] egorfine.livejournal.com 2010-07-03 07:42 pm (UTC)(link)
ухты! цепи маркова для синтеза речи. Это гениально.
spamsink: (Default)

[personal profile] spamsink 2010-07-03 06:57 pm (UTC)(link)
"Полили ли лилии?" - очень плохо, и дело не только в ударении в слове "полили".

"На дворе трава. На траве дрова?" - повествовательная и вопросительная интонация не отличаются.

Так что

[identity profile] tlkh.livejournal.com 2010-07-03 08:37 pm (UTC)(link)
Отличаются, но не всегда заметно.
Попробуйте "И это вопрос" с и без знака.

(no subject)

[identity profile] tlkh.livejournal.com - 2010-07-03 20:40 (UTC) - Expand

[identity profile] zhilyaev-v.livejournal.com 2010-07-03 07:06 pm (UTC)(link)
Отличная программа.

[identity profile] imfromjasenevo.livejournal.com 2010-07-03 07:08 pm (UTC)(link)
класс, поймал на зммеееде, длиношеее
тоже не может взять

[identity profile] ghooky.livejournal.com 2010-07-07 11:07 am (UTC)(link)
с двумя "н" все-таки лучше получается

[identity profile] klonkaktusa.livejournal.com 2010-07-03 07:08 pm (UTC)(link)
"Р" плохо выговаривает.

[identity profile] anita43765.livejournal.com 2010-07-03 07:10 pm (UTC)(link)
ааа, офигенно говорит! огрехи есть, конечно, но у кого их нет.

[identity profile] the-netwalker.livejournal.com 2010-07-03 07:23 pm (UTC)(link)
По сравнению с тем малым, что я слышал - говорит прекрасно.
Однако, на удивление "Алена" споткнулась на простейшем:
"Няка", получилось почему-то "никА".

[identity profile] raydac.livejournal.com 2010-07-03 07:24 pm (UTC)(link)

[identity profile] gruimed.livejournal.com 2010-07-03 07:27 pm (UTC)(link)
У Алены смешной акцент на английском

[identity profile] gaal.livejournal.com 2010-07-03 07:30 pm (UTC)(link)
Some of the English ones suck too. But some got me floored.

[identity profile] baramin.livejournal.com 2010-07-03 07:31 pm (UTC)(link)
Я был сильно в теме TTS/ASR по состоянию на 2006 год (SmartphonePro).
Эти парни неплохи, но Real Speaker от разорившейся Lernout&Hauspie звучал лучше (не путать с их же базовым TTS). Их разорение нанесло колоссальный вред индустрии - до того момента они подобрали под себя все приличные начинания. Real Speaker стоил, как живой слон и грузил CPU не хуже ASR, но сгенерированные им сообщения кране мало отличались от дикторских.
Инженеры из L&H И MS соглашались в одном - сделать TTS начального уровня значительно проще, чем ASR командного языка (ограниченной грамматики) "того же" уровня. Сделать приличный TTS, слабо отличающийся от человеческого, сравнимо со свободным распознаванием речи. Чудовищное количество исключений, аббревиатур, дат и числительных.
Вообще как-то все в ступоре. От соответствующего подразделения MS я года 3 ничего не слышал - после SAPI 5.1 они так ничего и не совершили. А была очень сильная команда.
О Dragon Dictation тоже как-то не слышно особо.

[identity profile] egorfine.livejournal.com 2010-07-03 07:43 pm (UTC)(link)
"Их разорение нанесло колоссальный вред индустрии"

а разве их патенты кто-то не подгреб с тем чтобы потом полицензировать желающим? Это же интеллектуальная собственность компании.

(no subject)

[personal profile] vitus_wagner - 2010-07-03 20:41 (UTC) - Expand

(no subject)

[identity profile] mikhailian.livejournal.com - 2010-07-03 21:21 (UTC) - Expand

(no subject)

[identity profile] avva.livejournal.com - 2010-07-03 20:24 (UTC) - Expand

(no subject)

[identity profile] mikhailian.livejournal.com - 2010-07-03 21:16 (UTC) - Expand

(no subject)

(Anonymous) - 2010-07-03 21:32 (UTC) - Expand

(no subject)

[identity profile] baramin.livejournal.com - 2010-07-03 21:34 (UTC) - Expand

(no subject)

[identity profile] baramin.livejournal.com - 2010-07-03 21:40 (UTC) - Expand

(no subject)

[identity profile] metaclass.livejournal.com - 2010-07-05 18:32 (UTC) - Expand

[identity profile] annie-celeblas.livejournal.com 2010-07-03 07:32 pm (UTC)(link)
Очень неплохо, особенно prosody, с ударениями тоже справляется (а это очень нетривиально). У нас не так хорошо получается. ;-)
Хотя я про эту фирму даже не слышала. В принципе, хорошей считается Nuance.

[identity profile] mikhailian.livejournal.com 2010-07-03 09:17 pm (UTC)(link)
Хочу уточнить, Nuance — это в данном случае бывший Lernout & Hauspie, разработчик RealSpeak.

(no subject)

[identity profile] a-jelly.livejournal.com - 2010-07-03 21:45 (UTC) - Expand

(no subject)

[identity profile] metaclass.livejournal.com - 2010-07-05 18:36 (UTC) - Expand

(no subject)

[identity profile] a-jelly.livejournal.com - 2010-07-05 18:44 (UTC) - Expand

(no subject)

[identity profile] metaclass.livejournal.com - 2010-07-05 18:54 (UTC) - Expand

[identity profile] sorcino.livejournal.com 2010-07-03 07:36 pm (UTC)(link)
Итальянский мужчина тоже звучит неплохо, интонация просто блестящая.

[identity profile] mme-n-b.livejournal.com 2010-07-03 07:41 pm (UTC)(link)
Очень здорово. Ударения глючат, и все голоса слишком торопятся, но тем не менее качество восхищает.

[identity profile] mikhailian.livejournal.com 2010-07-03 09:26 pm (UTC)(link)
У современных TTS скорость речи сложно менять в широких пределах, поэтому уже на этапе сбора материала диктор старается говорить быстро. Это всё потому, что люди с расстройствами зрения предпочитают быструю речь.

(no subject)

[identity profile] mme-n-b.livejournal.com - 2010-07-03 22:41 (UTC) - Expand

(no subject)

[identity profile] yakovis.livejournal.com - 2010-07-04 00:34 (UTC) - Expand

(no subject)

[identity profile] mme-n-b.livejournal.com - 2010-07-04 14:21 (UTC) - Expand

(no subject)

[personal profile] spamsink - 2010-07-04 02:14 (UTC) - Expand
lxe: (связист)

[personal profile] lxe 2010-07-03 07:44 pm (UTC)(link)
Сравнивая связную речь и произвольный набор слогов ("глокую куздру"), быстро приходишь к предположению, что честный синтез подкреплен словарем.
Можно попробовать оценить размер словаря на специализированных текстах, на естественнонаучной лексике какой-нибудь.

[identity profile] klonkaktusa.livejournal.com 2010-07-03 07:54 pm (UTC)(link)
+1 одни слова хорошо, другие хуже.

(no subject)

[identity profile] russian-o.livejournal.com - 2010-07-05 12:19 (UTC) - Expand

[identity profile] lordakryl.livejournal.com 2010-07-03 08:01 pm (UTC)(link)
По-моему, она (девушка-диктор) использует для всех слов двойные и тройные ударения, то есть "на всякий случай" большинство слогов - ударные.

[identity profile] status-constr.livejournal.com 2010-07-03 09:25 pm (UTC)(link)
Не совсем --- попробуйте "Бостон Жмеринки не кучерявей" :)

[identity profile] mi-b.livejournal.com 2010-07-03 08:04 pm (UTC)(link)
сложноподчиненные предложения интонирует совсем плохо. Типа

По всей видимости, адмирал Чичагов, считая как шведских, так и русских моряков не слишком опытными и искусными в управлении своими кораблями, полагал, что преимущество в бою будет на стороне стоящих.

(Anonymous) 2010-07-03 08:14 pm (UTC)(link)
Да, с обработкой запятых у них не очень.
Напимер "По всей видимости, нам, бля пиздец." призосится хорошо, а "По всей видимости, нам, бля, пиздец." - уже совсем неправильно.

[identity profile] dimorlus.livejournal.com 2010-07-03 08:13 pm (UTC)(link)
Да ладно, первый же естественно пришедший в голову тест - "иди на хуй!" она произносит не правильно.

[identity profile] ygam.livejournal.com 2010-07-04 12:57 am (UTC)(link)
"Ющ - пидарас! Ющ - пидарас! С нами Севастополь, Харьков, Донбасс" - все правильно, кроме "Харьков".

(Anonymous) 2010-07-03 08:19 pm (UTC)(link)
Я синтезаторы тестирую на «Серпуховских» Лейбова (http://unclear.rinet.ru/~r_l/serp/), веришь, нет? Алёна неплохо справляется, хотя где ударение в слове «Серпухов», ей неизвестно.

[identity profile] avva.livejournal.com 2010-07-03 08:23 pm (UTC)(link)
Ух ты, отличная идея для тестирования, да.

(no subject)

(Anonymous) - 2010-07-03 21:11 (UTC) - Expand

Page 1 of 2