Использование нейросетей для анализа звуковой информации


Модель синтеза речи


Входные данные:

Инструмент Модель синтеза речи со следующими параметрами, соответствующими звуку а:

Частота основного тона = 110

Форманта 0:

Частота  = 100

Четкость = 0.03

Воздействие = 0.9

Форманта 1:

Частота  = 900

Четкость = 0.5

Воздействие = 0.9

Форманта 2:

Частота  = 2900

Четкость = 0.4

Воздействие = 0.05

Форманта 3:

Частота  = 3300

Четкость = 0.4

Воздействие = 0.05

Форманта 4:

Частота  = 4000

Четкость = 0.1

Воздействие = 0.03

Шум не используется, включена автонормировка, размер окна БПФ равен 1024 сэмпла.

(параметры сохранены в файле а-а-а.fs)

Цель эксперимента:

Проверить возможность синтеза разборчивых гласных звуков при помощи формантно-голосовой модели.

Ход эксперимента:

Синтезировался звук и прослушивался в анализаторе спектра

Выводы:

При помощи формантно-голосовой модели возможен синтез гласных звуков речи. Для синтеза шипящих и согласных необходимо введение в модель дополнительных управляющих параметров.




- Начало -  - Назад -  - Вперед -