Kwork.ru - услуги фрилансеров от 500 руб.

Выразительный синтез речи для аудиокниг | Степан Комков, Яндекс Поиск

Это доклад Степана Комкова, старшего разработчика службы синтеза речи в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Степан рассказал об опыте создания виртуального рассказчика в Букмейте. Зачем его создавали и чего хотят пользователи, как выжать максимум из технологий уходящего поколения и внедрить длинный контекст в low-resource real-time модель. И как GPT и диффузионные модели произвели революцию в синтезе речи.

Подписывайтесь на телеграм-канал Яндекса для ML-специалистов: про яндекс поиск.

Оцените статью