Технологія побудована на двох ШІ моделей: одна аналізує часові патерни, а інша відсіює непов’язані звуки. Система ідентифікує співрозмовників протягом двох-чотирьох секунд, пише Interesting Engineering.

«Наше розуміння полягає в тому, що коли ми розмовляємо з певною групою людей, наше мовлення природно дотримується ритму чергування реплік. І ми можемо навчити ШІ прогнозувати та відстежувати ці ритми, використовуючи лише аудіо, без необхідності імплантувати електроди», — пояснює старший дослідник команди Шьям Голлакота.

Система вмикається щойно власник навушників починає розмову. Перша модель запускає перевірку «хто говорив і коли», шукаючи мінімальне накладання голосів. Друга модель проводить очищення сигналу та повертає користувачеві ізольований звук у реальному часі.

Моделі були навчені англійською, китайською та японською мовами. Інші мови можуть потребувати додаткових налаштувань.

Наразі прототип підтримує розмови за участю користувача та до чотирьох інших співрозмовників без помітної затримки. Дослідники провели тестування з 11 учасниками.

Команда також показала, що подібні моделі штучного інтелекту вже можуть працювати на чипах розміру слухового апарату.

https://dev.ua/news/amerykantsi-stvoryly-rozumni-shi-navushnyky-dlia-izoliatsii-rozmov-1765364511

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *