Festival Speech Synthesis System — обобщенная многоязычная система синтеза речи, разработанная Аланом В. Блэком в Исследовательском Центре Речевых Технологий (CSTR) в университете Эдинбурга. Существенный вклад также был сделан Университетом Карнеги-Меллона и другими. Распространяется под свободной лицензией, аналогичной лицензии BSD.

Festival предлагает полную систему синтеза речи с различными API, а также среду для разработки и исследования методов синтеза речи. Система написана на C++ со Scheme-подобным командным интерпретатором для общей настройки и расширения.[1]

Festival спроектирован для работы с различными языками и поставляется с поддержкой английского (в английском и американском произношении), валлийского и испанского языков. Голосовые пакеты созданы и для других языков, среди которых кастильский, чешский, финский, хинди, итальянский, маратхи, польский, русский[2] и телугу.

Проект Festvox направлен на создание новых синтетических голосов с применением более систематизированной и точной процедуры. Распространяется под свободной лицензией, аналогичной лицензии MIT.

Festvox представляет собой набор инструментов для создания синтетических голосов для Festival[3].

Флайт — небольшой движок синтеза речи, разработанный в Carnegie Mellon University. Основан на Festival и проекте Festvox из Carnegie Mellon University.

Linux-совместимость

править

Существует Festival-плагин для GStreamer. Festival входит в поставку нескольких дистрибутивов Linux.

См. также

править

Примечания

править
  1. «В целом он предлагает полный синтез речи через несколько API-интерфейсов: от уровня оболочки, через командную оболочку на Scheme, как библиотеку C++, от Java, с интерфейсом Emacs-а.»[1] Архивная копия от 25 сентября 2010 на Wayback Machine
  2. Соломенник А. И. / Автоматизация подготовки голоса для системы синтеза русской речи. - Приборостроение. - Февраль 2013
  3. Alan W. Black and Kevin A. Lenzo Building Synthetic Voices Архивная копия от 23 июля 2010 на Wayback Machine

Ссылки

править