Google розробив модель ШІ DolphinGemma для розшифрування мови дельфінів, щоб допомогти вченим дослідити їхню вокалізацію і з'ясувати, чи існує схожість з людською мовою. DolphinGemma використовує технологію SoundStream для обробки звуків дельфінів, а також оптимізована для роботи на смартфонах Pixel, що дозволяє вченим взаємодіяти з дельфінами через аудіосистему CHAT. Google планує зробити модель доступною для дослідників у всьому світі, з можливістю адаптації для інших видів китоподібних, що може прокласти шлях до розуміння мови інших інтелектуальних істот.
Google розробив ШІ для розшифрування мови дельфінів. Модель DolphinGemma вже цього літа буде протестована у реальних умовах. Її мета – допомогти вченим краще зрозуміти складну вокалізацію цих морських ссавців і з’ясувати, чи є в ній щось, що нагадує людську мову.
Зрозуміти дельфінів
Дельфіни вже давно вважаються одними з найрозумніших істот на планеті. Вони демонструють здатність до навчання, взаємодії, розпізнавання себе у дзеркалі та колективної поведінки. Їхня складна система звуків – свистів, клацань і навіть "крякання" – довгий час лишалася загадкою для дослідників. Тепер, із застосуванням інструментів штучного інтелекту та смартфонів Pixel, з'явився шанс зробити реальний прорив, повідомляє 24 Канал з посиланням на Neowin.
Google активно інтегрує генеративний ШІ у свої продукти та сервіси, тож не дивно, що компанія долучилася до Wild Dolphin Project (WDP) – дослідницької ініціативи, яка з 1985 року вивчає атлантичних плямистих дельфінів, використовуючи ненав’язливі методи спостереження. Команда WDP накопичила величезну колекцію аудіо- та відеоматеріалів разом із детальними поведінковими нотатками. Одне з головних завдань дослідників – зрозуміти, як саме дельфіни використовують вокалізацію у соціальній взаємодії.
Деякі звуки за роки спостережень уже вдалося прив’язати до конкретної поведінки. Наприклад, дельфіни видають характерні "іменні" свисти для ідентифікації одне одного, а те, що вчені назвали "кряканням" часто супроводжує конфлікти. Проте щоб з'ясувати, чи ця комунікація сягає рівня мови, потрібне значно глибше занурення в аналіз.
Саме тут і вступає в гру DolphinGemma – модель на основі відкритих AI-моделей Google Gemma, які побудовані на тій же архітектурі, що й комерційні Gemini. Вона використовує технологію SoundStream, яка дозволяє перетворювати звуки дельфінів у формат, придатний для обробки штучним інтелектом. Отримавши звукове повідомлення, модель намагається передбачити наступний "токен" – акустичний елемент, що може нести значення для дельфінів. Принцип її роботи схожий на те, як LLM генерують текст для людей.
Очікується, що DolphinGemma допоможе виявити складні звукові патерни, які потенційно зможуть стати основою для формування спільного "словника" між людьми й дельфінами. У Google наголошують: вручну аналіз таких обсягів даних зайняв би десятиліття.
Ще одна перевага DolphinGemma – її оптимізація для роботи на смартфонах Pixel. У польових умовах команда WDP вже кілька років використовує пристрій під назвою CHAT (Cetacean Hearing Augmentation Telemetry) – аудіосистему, зібрану на базі Pixel 6. Цей гаджет дозволяє як записувати звуки, так і відтворювати синтетичні вокалізації, які можуть імітувати дельфінячі "слова" й таким чином розмовляти з дельфінами.