20 000 профессионалов proAV > 1500 компаний > 570 городов > 6 стран ближнего зарубежья > 1 сообщество

Присоединяйтесь!

Подписка на дайджест
Рубрикатор новостей

Microsoft показала как сделать микрофонный массив из смартфонов

23 Сентября 2019

microsoft-pokazala-kak-sdelat-mikrofonnyy-massiv-iz-smartfonov-1.png

На прошедшей с 15 по 19 сентября в Австрии 20 ежегодной конференций Международной ассоциации речевой коммуникации Interspeech 2019 компания Microsoft продемонстрировала одну из последних разработок своего научно-исследовательского отдела Microsoft Research, выступив с докладом «Транскрибация собраний с использованием асинхронных удаленных микрофонов».

Interspeech является крупнейшей мировой конференцией, освещающей технологии обработки речи, ежегодно собирающей свыше 2000 профильных экспертов из разных стран. В ее рамках проводятся выступления ведущих специалистов отрасли, семинары, обучающие программы и множество других интересных событий. Естественно, конференция Interspeech - отличная площадка для демонстрации новейших технологий и разработок, чем не преминула воспользоваться Microsoft, представив экспертному сообществу результаты работы над своим проектом Project Denmark.

Основная концепция Project Denmark - объединение множества микрофонов потребительского уровня, встроенных в обычные смартфоны, ноутбуки и планшеты, в облачный микрофонный массив с последующей транскрибацией полученных аудиосигналов в текстовую форму. Это позволит участникам собраний и конференций без необходимости использования вспомогательного оборудования или привлечения персонала получить полноценную текстовую запись переговоров, производимую системой в автоматическом режиме. Причем запись может производиться даже на языке, отличном от языка говорящего. Все, что для этого потребуется - это смартфон, ноутбук или планшет и подключение к интернету. Звучит многообещающе, но как это будет работать на практике?

Несмотря на то, что концепция звучит довольно просто, для ее эффективной работы разработчикам пришлось решить множество технических проблем. Например, используемые в такой конфигурации микрофоны могут иметь разное качество и уровень громкости, поэтому полученные с их помощью речевые сигналы будут существенно различаться. Неизвестно и точное расположение самих смартфонов. Все эти причины делают согласованную консолидацию информационных потоков, поступающих с нескольких независимых устройств, намного сложнее, чем может показаться на первый взгляд.

Для решения этих задач Microsoft задействовала свое облако Azure и возможности искусственного интеллекта. С помощью технологии так называемого слепого формирования луча система выравнивает характеристики сигналов, объединяет их в единый поток и отправляет не сервер. Слепое формирование подразумевает, что формирование луча осуществляется не на основе данных о микрофонах и их расположении, которые в данной ситуации отсутствуют, а вычисляется посредством анализа поступающих сигналов специальным алгоритмом, основанным на нейронных сетях. Переданные на сервер аудиоданные транскрибируются с помощью технологий распознавания речи Azure Speech, после чего производится диаризация, раздельная запись текстовой информации для каждого из докладчиков и отправка итоговых файлов участникам собрания, которые, в свою очередь, могут оставить их для личного пользования или поделиться с коллегами.

В случае необходимости получения текстовых данных на другом языке транскрибированная информация дополнительно поступает в сервис Microsoft Translator, а затем сохраняется в файл. Разработчик заявляет, что система способна работать с любым количеством пользователей и ограничение накладывает лишь количество используемых микрофонов. Проведенные тестирования технологии показали высокую точность распознавания: всего 3% ошибок от общего количества слов при транскрибации речи одного говорящего и 22,3% при разговоре семи человек одновременно. Для повышения точности работы Microsoft предлагает организациям создавать собственные пользовательские речевые модели, которые будут формироваться на основе анализа данных их сотрудников, пользующихся Office 365.


Читайте АВ Клуб в Telegram

Источник: www.avclub.pro
Видео
Вебинар "Jupiter Systems - комплексные решения для визуализации"
Вебинар "Технология Absen – IMD 4 in 1"
Все видео
«Если заказчику нужны функции, которых нет, мы их добавляем» «Если заказчику нужны функции, которых нет, мы их добавляем»
В Росси продукция японского бренда Roland ассоциируется с музыкальным оборудованием, что не вполне корректно.
«Меня часто спрашивают: почему у вас так дорого?» «Меня часто спрашивают: почему у вас так дорого?»
Согласно официальным данным производитель Absen 10 лет занимает 1-е место по объему экспорта среди всех китайских вендоров.
Чем уникальна технология IMD 4 in 1, применяемая в Absen MiniLED Чем уникальна технология IMD 4 in 1, применяемая в Absen MiniLED
Разбираемся чем IMD 4 in 1 отличается от других светодиодных технологий, используемых производителями панелей?
Jupiter Canvas – уникальное решение для интеллектуальной визуализации Jupiter Canvas – уникальное решение для интеллектуальной визуализации
Александр Баринов, директор региона Россия и СНГ компании Jupiter Systems рассказывает о программном обеспечении Canvas.
WOW-видеостена, узкие дисплеи, штендеры без подзарядки - все покажем! WOW-видеостена, узкие дисплеи, штендеры без подзарядки - все покажем!
На AV FOCUS в Москве компания EliteBoard покажет делегатам самые передовые решения в своем портфеле.
Невидимая революция: тенденции и перспективы рынка ВКС Невидимая революция: тенденции и перспективы рынка ВКС
Впечатляющие темпы роста за последние несколько лет говорят об огромном потенциале рынка видеоконференцсвязи (ВКС).
Все статьи
Shure осуществляет техническую поддержку в штаб-квартире ООН Shure осуществляет техническую поддержку в штаб-квартире ООН
С 2009 Shure осуществляет оснащение и поддержку в проведении основных мероприятий штаб-квартиры ООН в Найроби.
450 громкоговорителей d&b audiotechnik меняют сложную акустику зала 450 громкоговорителей d&b audiotechnik меняют сложную акустику зала
Royal Albert Hall — это культовая площадка, играющая огромную роль в культуре и просвещении не только Великобритании.
Для изысканного бара выбрали акустику K-Array. Вот почему Для изысканного бара выбрали акустику K-Array. Вот почему
Новый лаунж-бар NOI Lounge – это фешенебельное пространство в престижном торговом комплексе The Chanakya в Дели.
Сетевая система звукоусиления Harman в школе «Вакатипу» Сетевая система звукоусиления Harman в школе «Вакатипу»
Компания Strawberry Sound развернула в классных комнатах и аудиториях учебного заведения аудиоинфраструктуру на базе Dante.
Современные визуальные решения BenQ в гимназии IGGS Современные визуальные решения BenQ в гимназии IGGS
Компания BenQ переоборудовала техническое оснащение классов гимназии, установив в них проекторы, дисплеи и интерактивные панели.
Интерактивная рабочая среда в конференц-залах Marriott Group Интерактивная рабочая среда в конференц-залах Marriott Group
Clevertouch оснастила девять конференц-залов отелей Hanbury Manor Hotel & Country Club интерактивными панелями Pro Series.
Все кейсы
SHARP: Профессиональные ЖК-мониторы
SHARP: Профессиональные ЖК-мониторы
Стильные ЖК-мониторы для общественных мест, русский язык, 4 полосы, формат A4.
BOSCH: Каталог конференц-систем 2016/ноябрь
BOSCH: Каталог конференц-систем 2016/ноябрь
Каталог конференц-систем и оборудования для синхронного перевода, формат А4, 50 полос.
Все файлы
"Детали на обоих концах световой шкалы не воспроизводит никто"
Ларри Пол
“На днях компания Christie объявила о выпуске первого в мире HDR 4K RGB pure laser проектора для рroAV рынка.”
Ларри Пол
Исполнительный директор подразделения Technology and Custom Solutions, Christie
«BYOD-решения Vivitek доступны в различном исполнении»
Салтрукович Андрей
“В ассортименте производителя присутствуют интерактивные дисплеи, проекторы и самостоятельные системы для беспроводных презентаций.”
Салтрукович Андрей
руководитель группы развития ГК DIGIS
«Мы предлагаем комплексные решения для диспетчерских»
Владимир Иванов
“О новейших решениях для построения систем отображения и передачи информации в диспетчерских пунктах, показанных в новом демозале.”
Владимир Иванов
региональный менеджер компании Leyard на российском рынке
«Наши громкоговорители стали компактнее и мощнее»
Джон Макмен
“Мы обновили популярный громкоговоритель UPA-1P и серию UPQ-D, представили сабвуфер USW-210P, тест-сигнал M-Noise и многое другое.”
Джон Макмен
вице-президент по маркетингу Meyer Sound
Все мнения