текст в речь
Jul. 3rd, 2010 09:39 pmhttp://www.acapela-group.com/text-to-speech-interactive-demo.html
В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.
Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?
В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.
Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?
no subject
Date: 2010-07-03 06:43 pm (UTC)no subject
Date: 2010-07-03 06:44 pm (UTC)no subject
Date: 2010-07-03 06:45 pm (UTC)no subject
Date: 2010-07-03 06:46 pm (UTC)no subject
Date: 2010-07-03 06:47 pm (UTC)no subject
Date: 2010-07-03 06:48 pm (UTC)no subject
Date: 2010-07-03 06:49 pm (UTC)А вот когда же её портируют под android, чтобы мне мой телефон книжки голосом читал? (windows mobile телефон уже несколько лет как книжки голосом читать умеет, а вот новый google nexus one ещё не научился).
no subject
Date: 2010-07-03 06:50 pm (UTC)no subject
Date: 2010-07-03 06:53 pm (UTC)no subject
Date: 2010-07-03 06:54 pm (UTC)"Алена" прочитала это пост с ударением "глючИт" :)
no subject
Date: 2010-07-03 06:54 pm (UTC)no subject
Date: 2010-07-03 06:54 pm (UTC)no subject
Date: 2010-07-03 06:57 pm (UTC)"На дворе трава. На траве дрова?" - повествовательная и вопросительная интонация не отличаются.
Так что
no subject
Date: 2010-07-03 06:58 pm (UTC)no subject
Date: 2010-07-03 07:06 pm (UTC)no subject
Date: 2010-07-03 07:08 pm (UTC)тоже не может взять
no subject
Date: 2010-07-03 07:08 pm (UTC)no subject
Date: 2010-07-03 07:10 pm (UTC)no subject
Date: 2010-07-03 07:14 pm (UTC)no subject
Date: 2010-07-03 07:23 pm (UTC)Однако, на удивление "Алена" споткнулась на простейшем:
"Няка", получилось почему-то "никА".
no subject
Date: 2010-07-03 07:24 pm (UTC)no subject
Date: 2010-07-03 07:27 pm (UTC)no subject
Date: 2010-07-03 07:30 pm (UTC)no subject
Date: 2010-07-03 07:31 pm (UTC)Эти парни неплохи, но Real Speaker от разорившейся Lernout&Hauspie звучал лучше (не путать с их же базовым TTS). Их разорение нанесло колоссальный вред индустрии - до того момента они подобрали под себя все приличные начинания. Real Speaker стоил, как живой слон и грузил CPU не хуже ASR, но сгенерированные им сообщения кране мало отличались от дикторских.
Инженеры из L&H И MS соглашались в одном - сделать TTS начального уровня значительно проще, чем ASR командного языка (ограниченной грамматики) "того же" уровня. Сделать приличный TTS, слабо отличающийся от человеческого, сравнимо со свободным распознаванием речи. Чудовищное количество исключений, аббревиатур, дат и числительных.
Вообще как-то все в ступоре. От соответствующего подразделения MS я года 3 ничего не слышал - после SAPI 5.1 они так ничего и не совершили. А была очень сильная команда.
О Dragon Dictation тоже как-то не слышно особо.
no subject
Date: 2010-07-03 07:32 pm (UTC)Хотя я про эту фирму даже не слышала. В принципе, хорошей считается Nuance.