20 000 профессионалов proAV > 1500 компаний > 570 городов > 6 стран ближнего зарубежья > 1 сообщество

Присоединяйтесь!

Подписка на дайджест
Рубрикатор новостей

Вам подтасовать или исправить? Сервис, говорящий вашим голосом

17 Октября 2019
Вам подтасовать или исправить? Сервис, говорящий вашим голосом

Запущенный в прошлом году сервис Descript, предназначен для специалистов, работающих с речевым контентом: создателей подкастов и редакторов мультимедиа. Недавно производитель добавил в свой набор инструментов любопытную функцию Overdub, представляющую собой ни что иное, как синтезатор речи, который при помощи возможностей искусственного интеллекта способен генерировать фразы, точно имитируя голос конкретного человека.

Первоначально Descript разрабатывался для внутренних нужд проекта Detour, специализирующегося на создании мобильных аудиогидов, но затем был выделен в отдельный продукт, работу над которым продолжила одноименная компания. Descript Podcast Studio представляет собой простое и наглядное приложение для многодорожечной записи голоса и его дальнейшего редактирования, призванное упростить процесс производства подкастов. Основным его отличием от классических аудиоредакторов является функция автоматического анализа и транскрибации речи с последующим сопоставлением на временной шкале аудиофайла и текста. Таким образом, от пользователей не требуются углубленные знания в области аудиомонтажа. Они могут просто прочитать транскрибированный текст, выделить слово, фразу или предложение, которые необходимо удалить или переместить, и дать соответствующую команду приложению, которое, в свою очередь, произведет все необходимые манипуляции со звуком, аккуратно сопоставив части и добавив в нужных местах кроссфейды. Присутствует здесь и классический набор инструментов, характерный для любого аудиоредактора, с помощью которого можно производить ручное редактирование и осуществлять автоматизацию громкости. Кроме этого, доступна многопользовательская работа, экспорт готового таймлайна с привязанными аудиофайлами в Pro Tools, Reaper и Adobe Audition, а также работа с аудиодорожками видеофайлов с последующим экспортом итоговых результатов в Final Cut Pro и Adobe Premiere.

Ключевым этапом в дальнейшем развитии Descript стало недавнее приобретение канадского стартапа Lyrebird, основанного два года назад четырьмя аспирантами из Монреальского института изучения алгоритмов обучения. Он занимался разработкой синтезатора речи, способного с помощью искусственного интеллекта генерировать реалистичные человеческие голоса, и достиг в этом немалых успехов. Проанализировав аудиофрагмент с речью человека длительность в несколько минут, созданный Lyrebird алгоритм способен распознать так называемое ДНК голоса, на основании которого он впоследствии может формировать слова и фразы, очень точно имитирующие тембр и манеру разговора любого человека. Именно этот алгоритм и стал основой функции Overdub, которую Descript добавила в свое приложение Podcast Studio. Теперь пользователи могут не только удалять или менять местами слова и фразы, но и добавлять их, просто вводя необходимый текст в редакторе.

Естественно, помимо технической стороны вопроса существует и этическая, ведь получив в свои руки подобный инструмент, злоумышленники в различных сферах могут легко фальсифицировать аудиозаписи переговоров, выступлений и прочего. Но компания настроена оптимистично, заверяя, что функция Overdub может быть использована исключительно для имитации собственного голоса пользователя, о чем гласит заявление по этике, опубликованное на сайте разработчика:

Descript использует для распознавания речевой модели специальный алгоритм, который основан на речевой обратной связи, осуществляемой в реальном времени. Именно поэтому пользователи смогут создавать модели для преобразования текста в речь только для своего собственного голоса

Добавляет основатель Descript Эндрю Мейсон:

Мы создали функцию Overdub, чтобы сэкономить нашим пользователям время и усилия, которые они затрачивают на перезапись и последующую склейку аудиофайлов, а не как способ для создания подделок


Читайте АВ Клуб в Telegram

Источник: www.avclub.pro
Видео
Вебинар "Jupiter Systems - комплексные решения для визуализации"
Вебинар "Технология Absen – IMD 4 in 1"
Все видео
«Если заказчику нужны функции, которых нет, мы их добавляем» «Если заказчику нужны функции, которых нет, мы их добавляем»
В Росси продукция японского бренда Roland ассоциируется с музыкальным оборудованием, что не вполне корректно.
«Меня часто спрашивают: почему у вас так дорого?» «Меня часто спрашивают: почему у вас так дорого?»
Согласно официальным данным производитель Absen 10 лет занимает 1-е место по объему экспорта среди всех китайских вендоров.
Чем уникальна технология IMD 4 in 1, применяемая в Absen MiniLED Чем уникальна технология IMD 4 in 1, применяемая в Absen MiniLED
Разбираемся чем IMD 4 in 1 отличается от других светодиодных технологий, используемых производителями панелей?
Jupiter Canvas – уникальное решение для интеллектуальной визуализации Jupiter Canvas – уникальное решение для интеллектуальной визуализации
Александр Баринов, директор региона Россия и СНГ компании Jupiter Systems рассказывает о программном обеспечении Canvas.
WOW-видеостена, узкие дисплеи, штендеры без подзарядки - все покажем! WOW-видеостена, узкие дисплеи, штендеры без подзарядки - все покажем!
На AV FOCUS в Москве компания EliteBoard покажет делегатам самые передовые решения в своем портфеле.
Невидимая революция: тенденции и перспективы рынка ВКС Невидимая революция: тенденции и перспективы рынка ВКС
Впечатляющие темпы роста за последние несколько лет говорят об огромном потенциале рынка видеоконференцсвязи (ВКС).
Все статьи
Shure осуществляет техническую поддержку в штаб-квартире ООН Shure осуществляет техническую поддержку в штаб-квартире ООН
С 2009 Shure осуществляет оснащение и поддержку в проведении основных мероприятий штаб-квартиры ООН в Найроби.
450 громкоговорителей d&b audiotechnik меняют сложную акустику зала 450 громкоговорителей d&b audiotechnik меняют сложную акустику зала
Royal Albert Hall — это культовая площадка, играющая огромную роль в культуре и просвещении не только Великобритании.
Для изысканного бара выбрали акустику K-Array. Вот почему Для изысканного бара выбрали акустику K-Array. Вот почему
Новый лаунж-бар NOI Lounge – это фешенебельное пространство в престижном торговом комплексе The Chanakya в Дели.
Сетевая система звукоусиления Harman в школе «Вакатипу» Сетевая система звукоусиления Harman в школе «Вакатипу»
Компания Strawberry Sound развернула в классных комнатах и аудиториях учебного заведения аудиоинфраструктуру на базе Dante.
Современные визуальные решения BenQ в гимназии IGGS Современные визуальные решения BenQ в гимназии IGGS
Компания BenQ переоборудовала техническое оснащение классов гимназии, установив в них проекторы, дисплеи и интерактивные панели.
Интерактивная рабочая среда в конференц-залах Marriott Group Интерактивная рабочая среда в конференц-залах Marriott Group
Clevertouch оснастила девять конференц-залов отелей Hanbury Manor Hotel & Country Club интерактивными панелями Pro Series.
Все кейсы
SHARP: Профессиональные ЖК-мониторы
SHARP: Профессиональные ЖК-мониторы
Стильные ЖК-мониторы для общественных мест, русский язык, 4 полосы, формат A4.
BOSCH: Каталог конференц-систем 2016/ноябрь
BOSCH: Каталог конференц-систем 2016/ноябрь
Каталог конференц-систем и оборудования для синхронного перевода, формат А4, 50 полос.
Все файлы
"Детали на обоих концах световой шкалы не воспроизводит никто"
Ларри Пол
“На днях компания Christie объявила о выпуске первого в мире HDR 4K RGB pure laser проектора для рroAV рынка.”
Ларри Пол
Исполнительный директор подразделения Technology and Custom Solutions, Christie
«BYOD-решения Vivitek доступны в различном исполнении»
Салтрукович Андрей
“В ассортименте производителя присутствуют интерактивные дисплеи, проекторы и самостоятельные системы для беспроводных презентаций.”
Салтрукович Андрей
руководитель группы развития ГК DIGIS
«Мы предлагаем комплексные решения для диспетчерских»
Владимир Иванов
“О новейших решениях для построения систем отображения и передачи информации в диспетчерских пунктах, показанных в новом демозале.”
Владимир Иванов
региональный менеджер компании Leyard на российском рынке
«Наши громкоговорители стали компактнее и мощнее»
Джон Макмен
“Мы обновили популярный громкоговоритель UPA-1P и серию UPQ-D, представили сабвуфер USW-210P, тест-сигнал M-Noise и многое другое.”
Джон Макмен
вице-президент по маркетингу Meyer Sound
Все мнения