Роясь в интернете по этой теме нашел вот эту статью ->
расскажу о совершенно умопомрачительной штуке — AT&T Natural Voices. Если что-то и произвело на меня в последние полгода неизгладимое впечатление, так это новая система речевого синтеза (TTS — Text-To-Speech Engine) от великана американской телефонии. TTS я посвятил уже три Голубятни, поэтому четвертая, наверное, смотрелась бы перебором, если бы не качественный прорыв, совершенный Natural Voices. Проще всего пояснить суть вопроса на примере: если заставить любой привычный речевой синтезатор — будь то встроенный движок Микрософта, белорусский Sakrament или французский Digalo — проговаривать текст, мы будем спорить о том, какой из TTS звучит хуже или лучше, однако ни у кого не возникнет сомнения в том, что перед нами искусственная речь робота, а не живого человека. Так было всегда. До тех пор, пока не появился AT&T Natural Voices. Звучание этого речевого синтезатора не просто безупречно, оно идеально. В том смысле, что даже носитель языка почти не в состоянии заподозрить в поразительно плавной, гладкой, чисто интонированной речи Кристал и Майка (так зовут компьютерных говорунов AT&T) природу киборга. Хотя удивляться тут нечему: AT&T Natural Voices — первый 16-килогерцовый синтезатор речи. Платой за качество звука стал размер аллофонной базы: если обычный TTS занимает 5-10 мегабайт, то AT&T Natural Voices 1.2 гигабайта! Но овчинка выделки стоит, поверьте на слово.
Ясное дело, AT&T Natural Voices по-русски разговаривать не умеет. Радует, что в настоящее время предпринимаются попытки портировать движок AT&T на отечественную ниву: этим занимается Сакрамент, хотя и жалуется на нехватку денег, а также Сергей Москалев, автор легендарного переключателя клавиатуры Punto, который собственно и познакомил меня с AT&T Natural Voices. Сергей на нехватку средств не жаловался, зато возмущался инертностью местных умельцев, боящихся неподъемности работы с аллофонной базой такого размера. Хотя, по мнению Сергея, неподъемность эта мнимая — было бы желание.
Источник:
Потихоньку торгуем, утверждаем свободу, трепемся статья написана в 2003 году и предположив что с того времени уже что-то продвинулось, нашел сайт компании Сакрамент
Синтез и распознавание речи - Sakrament Там много чего есть но все проги коммерческие и в основном для коммуникаторов, наладонников.
Будем искать дальше!