Вчені кажуть, що винайшли динамік, який «заглушує» набридливих людей

Itani et al

Динамік, що складається з крихітних роботів, може використовувати кілька мікрофонів для створення мовних зон, які дозволяють йому розділяти та відключати розмови.

Конус тиші

Новий динамік може переставляти свої сім мікрофонів, що «саморозгортаються», розділяючи кімнату на так звані «мовні зони», що дозволяє йому відстежувати й розпізнавати різні голоси навіть під час їх руху.

Більш того, дослідники, які стоять за винаходом, стверджують, що така точна локалізація дозволяє їм не тільки розділяти одночасні розмови, а й відключати галасливі зони (або дратівливих хлопців) за командою для таких програм, як відеоконференції на зборах.

Як докладно описано в недавньому дослідженні цієї роботи, опублікованому в журналі Nature Communications, незвичайний оратор є так званим роєм роботів. Мікрофони, що саморозгортаються, є роботів розміром з наперсток, які спілкуються один з одним, самостійно переміщаючись на своїх крихітних колесах в різні точки, як мініатюрні роботи-пилососи Roombas, і при необхідності повертаючись на зарядну станцію.

"Вперше, використовуючи те, що ми називаємо роботизованим "акустичним роєм", ми можемо відстежувати позиції кількох людей, які розмовляють у кімнаті, і розділяти їхню промову", — сказав співавтор дослідження Малека Ітані у Школі комп'ютерних наук та інженерії Пола Аллена.

Звучить у пошуках

За словами дослідників, для навігації у навколишньому середовищі прототипи ботів використовують техніку, схожу на високочастотну ехолокацію.

Мобільність має вирішальне значення. Розподіливши мікрофони якнайдалі, нейронна мережа, що обробляє дані, може виконувати більш точні обчислення. Однак наразі роботи обмежені переміщенням по стільницях, оскільки вони здатні локалізуватися лише у 2D-просторі.

"Ми розробили нейронні мережі, які використовують ці сигнали із затримкою за часом, щоб розрізняти те, що говорить кожна людина, і відстежувати її становище в просторі", пояснив у своїй заяві співавтор Туочао Чен зі школи Аллена. «Таким чином, ви можете дозволити чотирьом людям вести дві розмови, ізолювати будь-який із чотирьох голосів та визначити місцеперебування кожного голосу в кімнаті».

У зоні

Затвердження Чена підтверджуються результатами реальних експериментів.

Дослідники тестували рій роботів у таких місцях, як офіси та кухні, у той час, як розмовляли від трьох до п'яти осіб, при цьому система не мала попередньої інформації про місця чи голоси.

Попри ці перешкоди, пристрою все одно вдавалося локалізувати голоси в 90% випадків на відстані не більше 1,6 фута один від одного. Тим часом середня помилка була ще нижчою — трохи менш ніж шість дюймів для всіх сценаріїв. Досить тісно.

Але його швидкість трохи підводить. У середньому системі потрібно 1,82 секунди для обробки трисекундного звуку, що може зробити відеоконференції трохи незграбними.

Далі дослідники хочуть застосувати ці методи приглушення та поділу у фізичному просторі в реальному часі, використовуючи локалізувальні мікрофони, щоб робити те ж, що навушники з шумопоглинанням роблять у ваших вухах, але у всій кімнаті.

Джерела: EurekAlert