Alek: Все сообщения за 3 Июля 2007 года

Balancer.Ru » старые » пользователи » Alek » все сообщения » » Июль » 3: Alek: Все сообщения за 3 Июля 2007 года

Пн	Вт	Ср	Чт	Пт	Сб	Вс
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Предыдущий день Следующий день

Голосовой ввод, управление компом голосом, распознание речи #03.07.2007 12:35

Alek

опытный

К нечитанному в теме «Голосовой ввод, управление компом голосом, распознание речи»

Роясь в интернете по этой теме нашел вот эту статью ->

расскажу о совершенно умопомрачительной штуке — AT&T Natural Voices. Если что-то и произвело на меня в последние полгода неизгладимое впечатление, так это новая система речевого синтеза (TTS — Text-To-Speech Engine) от великана американской телефонии. TTS я посвятил уже три Голубятни, поэтому четвертая, наверное, смотрелась бы перебором, если бы не качественный прорыв, совершенный Natural Voices. Проще всего пояснить суть вопроса на примере: если заставить любой привычный речевой синтезатор — будь то встроенный движок Микрософта, белорусский Sakrament или французский Digalo — проговаривать текст, мы будем спорить о том, какой из TTS звучит хуже или лучше, однако ни у кого не возникнет сомнения в том, что перед нами искусственная речь робота, а не живого человека. Так было всегда. До тех пор, пока не появился AT&T Natural Voices. Звучание этого речевого синтезатора не просто безупречно, оно идеально. В том смысле, что даже носитель языка почти не в состоянии заподозрить в поразительно плавной, гладкой, чисто интонированной речи Кристал и Майка (так зовут компьютерных говорунов AT&T) природу киборга. Хотя удивляться тут нечему: AT&T Natural Voices — первый 16-килогерцовый синтезатор речи. Платой за качество звука стал размер аллофонной базы: если обычный TTS занимает 5-10 мегабайт, то AT&T Natural Voices 1.2 гигабайта! Но овчинка выделки стоит, поверьте на слово.

Ясное дело, AT&T Natural Voices по-русски разговаривать не умеет. Радует, что в настоящее время предпринимаются попытки портировать движок AT&T на отечественную ниву: этим занимается Сакрамент, хотя и жалуется на нехватку денег, а также Сергей Москалев, автор легендарного переключателя клавиатуры Punto, который собственно и познакомил меня с AT&T Natural Voices. Сергей на нехватку средств не жаловался, зато возмущался инертностью местных умельцев, боящихся неподъемности работы с аллофонной базой такого размера. Хотя, по мнению Сергея, неподъемность эта мнимая — было бы желание.

Источник: Потихоньку торгуем, утверждаем свободу, трепемся

статья написана в 2003 году и предположив что с того времени уже что-то продвинулось, нашел сайт компании Сакрамент Синтез и распознавание речи - Sakrament
Там много чего есть но все проги коммерческие и в основном для коммуникаторов, наладонников.

Будем искать дальше!

Голосовой ввод, управление компом голосом, распознание речи #03.07.2007 13:37 @au#02.07.2007 19:50

Alek

опытный

К нечитанному в теме «Голосовой ввод, управление компом голосом, распознание речи»

au> А есть русский синтезатор лучше чем дигало-николай?

Есть Катерина вот здесь:

404 ← Нонейм

К сожалению, такой страницы не существует. Вероятно, она была удалена с сервера, либо ее здесь никогда не было. Впрочем, если вы уверены, что страница должна быть, сообщите нам об этом, мы разберёмся. // smes.nnm.ru

404 - Ошибка: 404

Вы не можете посетить текущую страницу потому, что: Пожалуйста, попробуйте одну из следующих страниц: Если у вас возникли сложности, пожалуйста, свяжитесь с Администратором этого сайта. Компонент не найден // www.megalib.com

Пока еще не попробовал. Попробую сообщу лучше или нет

Вот так она звучит:

Katerina.mp3

Update Required To play the media you will need to either update your browser to a recent version or update your Flash plugin.

Скачать: Katerina.mp3

Это сообщение редактировалось 03.07.2007 в 17:43

Голосовой ввод, управление компом голосом, распознание речи #03.07.2007 13:39 @semen#03.07.2007 12:51

Alek

опытный

К нечитанному в теме «Голосовой ввод, управление компом голосом, распознание речи»

semen> А погуглить "распознавание и синтез речи"?
semen> Вот, к примеру — Речевые технологии информационный портал - распознавание речи, синтез речи

Это я уже все прочитал. Там только вода! А надо конкретного мяса!

Голосовой ввод, управление компом голосом, распознание речи #03.07.2007 15:36 @au#03.07.2007 09:02

Alek

опытный

К нечитанному в теме «Голосовой ввод, управление компом голосом, распознание речи»

au> Пользуясь случаем

au> А есть ли где причёсанные качественные словари для дигало-николая? (там ударения расставлены и прочие цу)

Вот:

Словарь ударений и правильных произношений для программ синтезации речи Digalo.Michelangelo

// www.mahala.land.ru

Размещение сайтов, регистрация доменов, услуги датацентра Билайн Бизнес Екатеринбург.

Быстрый, надежный хостинг, php, mysql, Apache, FastCGI

// www.vector-ski.ru

Предыдущий день Следующий день

в начало страницы | новое

Balancer.Ru » старые » пользователи » Alek » все сообщения » » Июль » 3