Синтетическая речь перестала быть прерогативой научной фантастики: от озвучки аудиокниг до персонажей в играх и виртуальных аватаров, голос, созданный искусственным интеллектом, быстро входит в обиход. Мати Станишевски, генеральный директор и соучредитель ElevenLabs, занимает центральное место в этом процессе, формируя направление развития технологий. На TechCrunch Disrupt 2025 он выступил с разбором того, какие инженерные, лингвистические и этические условия необходимы, чтобы голосовой ИИ приобрёл по-настоящему человеческую глубину.

ElevenLabs в кратчайшие сроки стала важным игроком в генеративном аудио, оттачивая методы синтеза голоса, которые улавливают тонкие интонации, дыхание и эмоциональные окраски. В ходе выступления Мати объясняет, как платформа компании моделирует природную речь с высокой фидельностью, какие алгоритмические подходы и датасеты лежат в основе этих результатов, а также почему такие достижения открывают новые сценарии использования — в индустрии развлечений, образовании и художественном повествовании.
Почему эта сессия имеет значение
Голос — один из наиболее надёжных носителей человеческой выразительности. Задача сконструировать ИИ, способный воспроизводить такую выразительность, одновременно ставит перед инженерами вопросы точности, контекста и ответственности. В обсуждении рассматриваются ключевые технические сложности, социальные последствия и примеры практического внедрения технологий в цивилизованных экосистемах, а также прогнозируется, как синтетические голоса поменяют способы слушания, обучения и взаимодействия.
Не пропустите эту сессию по средствам ИИ и экономии.
Присоединяйтесь к сообществу из 10 000 основателей, инвесторов и профессионалов на Disrupt 2025, чтобы обсудить идеи и прорывные разработки, формирующие будущее голосового ИИ на пяти тематических сценах. «Приобретите билет сейчас» — и пользуйтесь возможностью сэкономить до 668 долларов; «после 26 сентября цены вырастут».








