20 000 профессионалов proAV > 1500 компаний > 570 городов > 6 стран ближнего зарубежья > 1 сообщество

Присоединяйтесь!

Подписка на дайджест
Рубрикатор новостей

Вам подтасовать или исправить? Сервис, говорящий вашим голосом

17 Октября 2019
Вам подтасовать или исправить? Сервис, говорящий вашим голосом

Запущенный в прошлом году сервис Descript, предназначен для специалистов, работающих с речевым контентом: создателей подкастов и редакторов мультимедиа. Недавно производитель добавил в свой набор инструментов любопытную функцию Overdub, представляющую собой ни что иное, как синтезатор речи, который при помощи возможностей искусственного интеллекта способен генерировать фразы, точно имитируя голос конкретного человека.

Первоначально Descript разрабатывался для внутренних нужд проекта Detour, специализирующегося на создании мобильных аудиогидов, но затем был выделен в отдельный продукт, работу над которым продолжила одноименная компания. Descript Podcast Studio представляет собой простое и наглядное приложение для многодорожечной записи голоса и его дальнейшего редактирования, призванное упростить процесс производства подкастов. Основным его отличием от классических аудиоредакторов является функция автоматического анализа и транскрибации речи с последующим сопоставлением на временной шкале аудиофайла и текста. Таким образом, от пользователей не требуются углубленные знания в области аудиомонтажа. Они могут просто прочитать транскрибированный текст, выделить слово, фразу или предложение, которые необходимо удалить или переместить, и дать соответствующую команду приложению, которое, в свою очередь, произведет все необходимые манипуляции со звуком, аккуратно сопоставив части и добавив в нужных местах кроссфейды. Присутствует здесь и классический набор инструментов, характерный для любого аудиоредактора, с помощью которого можно производить ручное редактирование и осуществлять автоматизацию громкости. Кроме этого, доступна многопользовательская работа, экспорт готового таймлайна с привязанными аудиофайлами в Pro Tools, Reaper и Adobe Audition, а также работа с аудиодорожками видеофайлов с последующим экспортом итоговых результатов в Final Cut Pro и Adobe Premiere.

Ключевым этапом в дальнейшем развитии Descript стало недавнее приобретение канадского стартапа Lyrebird, основанного два года назад четырьмя аспирантами из Монреальского института изучения алгоритмов обучения. Он занимался разработкой синтезатора речи, способного с помощью искусственного интеллекта генерировать реалистичные человеческие голоса, и достиг в этом немалых успехов. Проанализировав аудиофрагмент с речью человека длительность в несколько минут, созданный Lyrebird алгоритм способен распознать так называемое ДНК голоса, на основании которого он впоследствии может формировать слова и фразы, очень точно имитирующие тембр и манеру разговора любого человека. Именно этот алгоритм и стал основой функции Overdub, которую Descript добавила в свое приложение Podcast Studio. Теперь пользователи могут не только удалять или менять местами слова и фразы, но и добавлять их, просто вводя необходимый текст в редакторе.

Естественно, помимо технической стороны вопроса существует и этическая, ведь получив в свои руки подобный инструмент, злоумышленники в различных сферах могут легко фальсифицировать аудиозаписи переговоров, выступлений и прочего. Но компания настроена оптимистично, заверяя, что функция Overdub может быть использована исключительно для имитации собственного голоса пользователя, о чем гласит заявление по этике, опубликованное на сайте разработчика:

Descript использует для распознавания речевой модели специальный алгоритм, который основан на речевой обратной связи, осуществляемой в реальном времени. Именно поэтому пользователи смогут создавать модели для преобразования текста в речь только для своего собственного голоса

Добавляет основатель Descript Эндрю Мейсон:

Мы создали функцию Overdub, чтобы сэкономить нашим пользователям время и усилия, которые они затрачивают на перезапись и последующую склейку аудиофайлов, а не как способ для создания подделок


Читайте АВ Клуб в Telegram

Источник: www.avclub.pro
Видео
Вебинар "Absen AW — LED-дисплей с малым шагом пикселя для DooH"
Вебинар "Решения d&b audiotechnik в посткризисном мире"
Все видео
Правила съемок: метод стрима. За миллионом фолловеров - сюда! Правила съемок: метод стрима. За миллионом фолловеров - сюда!
Число прямых трансляций в сети переживают бум - это факт. Но что именно нужно учитывать, чтобы тренд начал работать на вас?
Как обеспечить безопасность в аэропорту: рассказывает NEC Как обеспечить безопасность в аэропорту: рассказывает NEC
Как организовать систему информирования в аэропорту и какие факторы стоит учесть при их открытии в посткоронавирусной ситуации.
ViewSonic ViewBoard – интерактивные панели для любых задач ViewSonic ViewBoard – интерактивные панели для любых задач
Александр Фролов, менеджер по продукции ViewSonic, рассказывает о предлагаемом компанией ассортименте интерактивных панелей.
Поддерживаем командный дух при удаленной работе: рецепт BenQ Поддерживаем командный дух при удаленной работе: рецепт BenQ
Работа из дома сильно влияет на эффективность реализации проектов, в которых заняты несколько исполнителей.
Адаптируем бизнес под новые условия: рекомендации BenQ Адаптируем бизнес под новые условия: рекомендации BenQ
Сложившаяся эпидемиологическая ситуация препятствует производству и вынуждает бизнес приспосабливаться к новым условиям.
«Следующим этапом будет появление самовосстанавливающихся систем» «Следующим этапом будет появление самовосстанавливающихся систем»
Роб Смит, директор по продажам компании Shure, рассказывает о тенденциях, активное развитие которых ждет нас в ближайшее время.
Все статьи
Масштабная ВКС-сеть Правительства Московской области Масштабная ВКС-сеть Правительства Московской области
Компания Unitsolutions на основе решений TrueConf создала для Правительства Московской области ВКС-сеть для 30 000 абонентов.
Дисплеи Absen преобразили центр разработок и инноваций Intel Дисплеи Absen преобразили центр разработок и инноваций Intel
Центр PKT1, призванный «самым умным зданием в мире», установил на фасаде крупнейший в Израиле наружный светодиодный экран.
Необычное настольное мэппинг-шоу в дубайском ресторане Meshico Необычное настольное мэппинг-шоу в дубайском ресторане Meshico
Компания Pulse при помощи проекторов Digital Projection реализовала мэппинг-шоу, разворачивающееся прямо на столах у посетителей.
Пространственное звучание на базе одного акустического элемента Пространственное звучание на базе одного акустического элемента
Компания Sound Technology развернула в лондонском Музее Науки систему пространственного звучания Holoplot.
Shure осуществляет техническую поддержку в штаб-квартире ООН Shure осуществляет техническую поддержку в штаб-квартире ООН
С 2009 Shure осуществляет оснащение и поддержку в проведении основных мероприятий штаб-квартиры ООН в Найроби.
450 громкоговорителей d&b audiotechnik меняют сложную акустику зала 450 громкоговорителей d&b audiotechnik меняют сложную акустику зала
Royal Albert Hall — это культовая площадка, играющая огромную роль в культуре и просвещении не только Великобритании.
Все кейсы
EVOKO: новое поколение системы бронирования коференц-залов
EVOKO: новое поколение системы бронирования коференц-залов
Evoko Liso – стильное и яркое устройство, которое существенно облегчает процесс бронирования переговорных комнат, русский язык, 4 полосы, А4.
DONVIEW: интерактивное оборудование
DONVIEW: интерактивное оборудование
Интерактивные доски, сенсорные панели, дисплеи с функциями записи и трансляции серии «Все в одном», документ-камеры, русский язык, 36 полос, А4.
Все файлы
Что ждет диспетчерские в посткоронавирусном мире
Стивен Вейр
“После того, как пик пандемии будет пройден, соблюдение социальной дистанции некоторое время сохранится, что может привести к последствиям.”
Стивен Вейр
эксперт NEC по решениям для мониторинга и управления
Хотите получить классную картинку? Часть 2: цвет имеет значение
Сергей Дудников
“Сергей Дудников продолжает свой рассказ о том, как добиться более качественного изображения на сверхбольшом экране.”
Сергей Дудников
глава российского офиса Christie
Хотите получить классную картинку? Часть 1: арифметика разрешения
Сергей Дудников
“Сергей Дудников в публикации для портала АВ Клуба рассказывает, как добиться более качественного изображения на сверхбольшом экране.”
Сергей Дудников
глава российского офиса Christie
«Зачем платить за три чипа, если можно сделать то же на одном»
Эдуард Кимберг
“Самый яркий проектор в мире, обеспечивающий световой поток в 75 тысяч люмен, входит в нашу отдельную линейку.”
Эдуард Кимберг
менеджер по развитию бизнеса компании Barco на территории России и стран СНГ
Все мнения