ElevenLabs выпускает новые продукты для голосового искусственного интеллекта

ElevenLabs привлекла 80 миллионов долларов в раунде серии B под руководством Андреессена Горовица , Нэта Фридмана , Дэниела Гросса , а также присоединилась к Sequoia Capital , Smash Capital , SV Angel , BroadLight Capital и Credo Ventures , чтобы укрепить свои позиции лидера в области голосового искусственного интеллекта.
Сегодня компания также представляет набор новых продуктов, включая Dubbing Studio , Voice Library marketplace, предварительный просмотр мобильного приложения для чтения и новые модели с улучшенной скоростью и языковым охватом.
С момента своего запуска технология ElevenLabs улучшила доступность контента по всему миру в таких секторах, как экономика создателей, издательское дело, разговорный искусственный интеллект, развлечения, образование и доступность, а ее внедрение миллионами привело компанию к статусу единорога .

22 января / Global – ElevenLabs , исследовательская компания в области голосовых технологий, привлекла $ 80 млн в рамках раунда серии B, возглавляемого Андреессеном Горовицем , Нэтом Фридманом , Дэниелом Гроссом , к которому присоединились Sequoia Capital , SV Angel , Smash Capital , BroadLight Capital и Credo Ventures , чтобы укрепить свои позиции мирового лидера в области исследований голосового искусственного интеллекта и внедрения продуктов.

С момента своего публичного запуска ElevenLabs лидирует в отрасли синтеза естественной речи, позволяя пользователям создавать голоса искусственного интеллекта на огромном количестве языков и акцентов, с возможностью передавать широкий спектр эмоций и интонаций. С момента запуска пользователи ElevenLabs создавали аудио более 100 лет , в то время как компания выросла с 5 до 40 сотрудников . Сегодня технология ElevenLabs используется сотрудниками 41% компаний из списка Fortune 500 .

Технология ElevenLabs была внедрена во многих отраслях. Это позволило создателям улучшить впечатления аудитории с помощью озвучки и дубляжа с использованием искусственного интеллекта, расширило доступ к образованию и предоставило инновационные решения в области издания аудиокниг, развлечений и личного использования, включая улучшение доступности. Это финансирование будет использовано для дальнейшего совершенствования продуктового предложения компании, обеспечивая при этом безопасное внедрение технологии искусственного интеллекта.

В дополнение к сегодняшнему анонсу серии B, ElevenLabs также представляет несколько новых разработок, которые появятся в продаже в ближайшие недели:

Новый рабочий процесс Dubbing Studio позволяет пользователям дублировать целые фильмы, а также создавать и редактировать их стенограммы, переводы и таймкоды, обеспечивая дополнительный контроль над созданием контента. Эти возможности дополняют уже существующую функцию дубляжа с помощью искусственного интеллекта, которая обеспечивает автоматическую сквозную локализацию видео на 29 языках.
Торговая площадка голосовой библиотеки , которая предоставит пользователям безопасную платформу для заработка на версиях их собственных голосов с искусственным интеллектом. Пользователи могут создавать свои профессиональные копии голоса с помощью искусственного интеллекта, проверять их и делиться ими через библиотеку голоса. Когда другие используют эти проверенные голоса, создатели оригинала получают компенсацию. Пользователи всегда сохраняют контроль над доступностью своего голоса и условиями компенсации. Торговая площадка уже приносит доход небольшой группе альфа-пользователей.
Предварительный просмотр мобильного приложения Reader, которое позволяет мгновенно преобразовывать текст и URL-адреса в аудио, упрощая пользователям доступ к контенту на другом носителе во время движения. В качестве ознакомительной пробной версии приложение будет доступно бесплатно в течение первых трех месяцев, и пользователи смогут зарегистрироваться для получения раннего доступа через лист ожидания.

В течение 2023 года ElevenLabs также расширяла свое присутствие во многих секторах, включая издательское дело, игры, медиа и разговорную вертикаль, а также налаживала партнерские отношения в формате B2B с крупнейшими медиа-домами, среди которых:

Издательство : Storytel, The Washington Post, Rheinische Post, Curio
Conversational AI : FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana, Infinitus AI
Медиа и развлечения : Wondershare Filmora, Futuri Media, TheSoul Publishing
Игры : Paradox Interactive, NetEase, Искусственный интеллект Inworld

Эти последние запуски продуктов и партнерские отношения последовали за периодом, в течение которого ElevenLabs постоянно расширяла свой набор инструментов, разработанных на основе собственных исследований. Выпущенные версии включали: Синтез речи для реалистичного преобразования текста в речь , а также модель Turbo, оптимизированную с учетом задержек; Дизайн голоса и клонирование голоса для создания индивидуальных голосов; Преобразование речи в речь для преобразования одного голоса в другой. Компания также выпустила свой ведущий в отрасли инструмент для дубляжа с искусственным интеллектом , способный автоматически переводить аудио и видео на 29 языков , сохраняя при этом оригинальный голос и эмоции говорящего. Компания также вскоре распространит модели Turbo и Speech to Speech, которые в настоящее время доступны на английском языке, на более широкий набор языков.

Основываясь на результатах исследований, обеспечивающих эти функции, ElevenLabs также работала над разработкой передовых инструментов для более сложных рабочих процессов, таких как проекты для публикации и студия дубляжа для локализации видео. Projects упрощает редактирование, структурирование, навигацию и генерацию полноформатного контента для издателей, а Dubbing Studio помогает готовить контент для аудитории по всему миру, предоставляя практический контроль над расшифровкой, переводом и хронометражем.

Компания также разработала продукты, ориентированные на сообщество, такие как Voice Library – среда для обмена голосами, созданными искусственным интеллектом. Ранее доступ к обмену искусственными голосами, созданными с помощью инструмента Voice Design, теперь Voice Library позволяет пользователям делиться своими собственными проверенными копиями голоса, созданными с помощью профессионального клонирования голоса, в рамках недавно представленной торговой площадки Voice Library и зарабатывать деньги, когда другие используют их. Чтобы обеспечить безопасность и целостность торговой площадки, ElevenLabs использует свою профессиональную технологию клонирования голоса для создания высокоточных копий голоса. Прежде чем поделиться голосом, пользователи должны пройти проверку голосовой капчи, прочитав текстовую подсказку в течение определенного периода времени, чтобы подтвердить, что их голос соответствует обучающим образцам. Этот процесс, наряду с модерацией и утверждением вручную командой ElevenLabs, обеспечивает распространение и монетизацию аутентичных, проверенных пользователями голосов, создавая более безопасную и заслуживающую доверия среду.

Основным приоритетом ElevenLabs является безопасная и ответственная разработка искусственного интеллекта с упором на обеспечение возможности обнаружения для обеспечения четкой идентификации всего контента, созданного с помощью искусственного интеллекта. В прошлом году компания запустила классификатор речи с искусственным интеллектом ; инструмент, который может проверить, содержит ли аудиосэмпл контент, созданный ElevenLabs. В этом году компания будет работать над расширением возможностей Классификатора, чтобы охватить больше моделей голосового искусственного интеллекта, а также сотрудничать с другими платформами распространения для более широкого внедрения. ElevenLabs активно разрабатывает дополнительные меры предосторожности для повышения безопасности в общественном достоянии.

Благодаря этим инвестициям серии B ElevenLabs намерена укрепить свои позиции мирового лидера в области исследований в области искусственного интеллекта и внедрения продуктов. Капитал будет направлен на продвижение исследований, расширение инфраструктуры, разработку новых продуктов для конкретных отраслей и усиление мер безопасности для обеспечения ответственного и этичного развития технологий искусственного интеллекта.

Петр Домковски, технический директор ElevenLabs, добавляет:

“Самоотверженность нашей команды уже оказала длительное влияние на развитие голосового искусственного интеллекта. Это новое финансирование позволяет нам решать еще более сложные задачи и сосредоточиться на сохранении наших конкурентных преимуществ в области исследований и разработки продуктов ”.

Мати Станишевский заключает:

“Наша цель остается прежней – изменить то, как мы взаимодействуем с контентом, преодолев языковые и коммуникативные барьеры. Мы создаем передовые технологии, позволяющие сделать контент доступным на разных языках – и голосами, – чтобы каждый мог ознакомиться с важной информацией и историями. Наш прогресс на данный момент свидетельствует о нашей преданной команде и инвесторах, и хотя это все еще только начало нашего пути, вместе мы помогаем формировать будущее доступности и коммуникаций ”.

Оставьте комментарий