Facebook представил прототип гарнитуры с искусственным интеллектом, которая усиливает звук и подавляет шумы
Исследователи создали прототип звукового программного обеспечения, которое может интеллектуально усиливать далекие голоса и отфильтровывать навязчивые шумы.
С момента появления мобильных телефонов ни одно общественное место не было застраховано от внезапного шока, когда какой-нибудь невнимательный человек кричал в трубку, как моряк, изо всех сил пытающийся быть услышанным во время шторма.
Однако, новая технология, разрабатываемая Facebook, может дать людям «слуховые сверхспособности».
В четверг компания в своем блоге представила прототип программного обеспечения для наушников, которое использует искусственный интеллект (ИИ) для усиления далеких или приглушенных звуков, одновременно подавляя фоновый шум.
Одна система может интерпретировать различные источники шума и регулировать их громкость «на лету», а другая может виртуально «размещать» звуки в разных местах вокруг тела слушателя.
Гарнитура дополненной реальности (AR), использующая такие методы, позволила бы ее владельцу слышать людей на больших расстояниях, совершать телефонные звонки простым шепотом или легко вести переговоры на оглушающих танцполах.
Однако, в настоящее время технология требует специализированных наборов из десятков микрофонов или подробных измерений, проводимых внутри беззвучной камеры, и ее необходимо резко свести к минимуму, чтобы она была жизнеспособной на публике.
Измерения необходимо проводить в безэховой (вакуумной) камере, что не очень портативно. Facebook заявил: «Представьте, что вы надеваете гарнитуру виртуальной реальности [VR] или пару очков AR и вас переносят за тысячи миль, чтобы посетить уроки, пойти на работу или посетить день рождения родственника — как если бы вы были там в реальной жизни»
«А теперь представьте, что та же пара очков AR выводит ваши слуховые способности на совершенно новый уровень и позволяет лучше слышать в шумных местах, таких как рестораны, кафе и концерты».
Прототипы являются частью планов Facebook доминировать в зарождающейся индустрии AR и VR, которую генеральный директор Марк Цукерберг считает «следующей платформой» социальной жизни в Интернете.
Компания может похвастаться тем, что может использовать передовое оборудование и искусственный интеллект для восстановления ощущения «присутствия» и «связи», которое теряется при традиционных видео- и телефонных звонках.
В то время как сторонники дополненной реальности традиционно фокусировались на улучшении зрения людей, большая часть нынешнего успеха СМИ была достигнута за счет звука, который может изменить чье-то восприятие своего окружения без сложной технической задачи заставить ИИ понимать физическое пространство.
Facebook впервые встроил «пространственный звук» в свои гарнитуры Oculus VR в 2017 году, но его новая система анализирует уникальную форму ушей пользователей, чтобы создать персонализированную модель того, как они воспринимают звук.
Другая программа искусственного интеллекта выделяет все источники шума в пространстве, а затем отслеживает движения головы и глаз пользователя, чтобы угадать, на каких из них они хотят сосредоточиться. Это создает звуковой эффект «прожектора», который увеличивает громкость всего, на что смотрит пользователь, что Facebook охарактеризовал как «волшебство, ставшее реальностью».
Эти две технологии могут работать вместе: один человек может ненавязчиво шептать в микрофон в переполненном зале ожидания больницы, будучи уверенным, что другой человек может прекрасно его слышать, когда громко стрижет газон.
Теоретически такой ИИ также можно обучить по-разному обрабатывать определенные голоса или ослаблять и усиливать определенные шумы. Это может быть благом для людей с проблемами слуха или такими состояниями, как аутизм и синдром посттравматического стресса, которые делают их чувствительными к определенным шумам.
Facebook признал, что такая технология несет в себе серьезные риски конфиденциальности и безопасности как для человека, носящего гарнитуру, так и для окружающих.
В прошлом устройства умного дома Portal компании столкнулись с трудностями из-за истории нарушений конфиденциальности, которые были мало покупаемы потребителями, даже когда устройства стали более безопасными, чем продукты конкурентов.
Существующий ИИ также часто страдает от расовых и гендерных предубеждений, таких как системы распознавания лиц, которые ошибочно идентифицируют людей с черным цветом кожи как преступников, или камеры смартфонов, которые не знают, как обработать более темную кожу.
Сверхслышащий ИИ, обученный на неправильных данных, может столкнуться с аналогичными сбоями: возможно, принимая женские голоса за фоновый шум чаще, чем мужские голоса, или ошибочно подавляя сильный иностранный акцент, потому что большинство друзей и коллег пользователя говорят с акцентом.
По материалам: The Telegraph