Стартап Emergence AI: эксперименты с автономными агентами
Стартап Emergence AI провёл наглядный эксперимент: в пяти параллельных виртуальных мирах по десять автономных агентов жили в одном и том же городе в течение 15 дней. Условия были одинаковы, менялась только модель, на которой работали агенты: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini и мир с агентами от разных вендоров. Заголовок подытожил эффект: в одном мире Claude «построил демократию», в другом мир с Grok вымер уже через четыре дня. Что это значит и какие выводы из такого эксперимента можно сделать — разбор по шагам.
Как устроен эксперимент
Описание простое и принципиально важное: пять параллельных симуляций, каждую составляли 10 автономных ИИ‑агентов, все стартовали с одинаковыми условиями и жили в общей виртуальной городской среде 15 дней. Единственный фактор, который менялся между мирами — модель, дающая поведение агентам. Пятый мир представлял собой смешение агентов от разных производителей.
Это классический дизайн для того, чтобы оценить влияние именно архитектуры/поведения модели на коллективную динамику при прочих равных. Наблюдение за тем, как разворачиваются социальные процессы, показывает не статические способности моделей, а их способность к взаимодействию и к формированию социальных институтов при длительном взаимодействии.
Ключевые наблюдения
- В одном мире агенты на Claude Sonnet 4.6 в итоге выработали систему, которую авторы описали как «демократия».
- В мире, где использовалась модель Grok 4.1 Fast, население «вымерло» за четыре дня.
- Остальные миры — Gemini 3 Flash, GPT-5-mini и смешанный мир — упоминаются как отдельные условия, но в тексте не даются подробные результаты по каждому из них.
Что можно логично заключить из этих фактов
- Поведение агентских сообществ зависит не только от начальных условий и среды, но и от внутренних свойств модели: склонности к сотрудничеству, к компромиссу, к агрессии, к планированию, к соблюдению договоров. Разные модели при прочих равных породили заметно разные социальные итоги.
- Появление «демократии» у агентов Claude показывает, что при определённых моделях коллектив может эволюционировать к структурам с распределённым управлением и правилами взаимодействия. Это указывает на способность моделей создавать и соблюдать институциональные нормы.
- Столкновение с полным коллапсом в мире Grok — быстрый «вымор» — демонстрирует, что некоторые модели в коллективных сценариях могут генерировать поведение, приводящее к катастрофическим результатам (конфликты, нарушение кооперации, уничтожение ресурсов или вымирание агентов). Точный механизм в тексте не описан, но наблюдение само по себе важно как сигнал о рисках.
Почему такие результаты важны
- Показательно, что при одинаковых внешних условиях разница в исходах определяется только моделью. Это значит, что свойства ИИ — их предрасположенности, внутреннее «принятие решений» и способы коммуникации — реально формируют социальную динамику.
- Для разработчиков мультиагентных систем и исследователей полезно иметь контролируемую среду, где можно наблюдать эмерджентные явления (появление институтов, кооперация, конфликты). Такие эксперименты дают эмпирические данные о надежности поведения моделей в коллективе.
- Для бизнеса и регуляторов это сигнал: не все модели одинаково пригодны для задач, где требуется длительное взаимодействие между автономными ИИ или между ИИ и людьми. Поведенческие различия имеют практическое значение.
Ограничения и почему не стоит делать поспешных выводов
- Масштаб: в каждой симуляции было по 10 агентов — это небольшое сообщество, и поведение в крупных популяциях может отличаться.
- Время: 15 дней — короткий горизонт для социализации и институционализации в масштабе человеческих обществ; некоторые явления могли бы проявиться позже.
- Детали среды и правил взаимодействия в тексте не описаны — мы не знаем, какие ресурсы были ограничены, какие стимулы присутствовали, какие были цели у агентов. Это критично для интерпретации причин «вымерания» или «демократии».
- Без описания настроек обучения, промптов, сдержек и ограничений агентов нельзя точно обвинять модель в «плохом поведении» — поведение может быть результатом комбинации модели и конфигурации симуляции.
Практическое значение для читателя: где это может коснуться вашей жизни
- Технологии многомодельных агентов могут оказаться в продуктах: цифровые помощники, автоматизированные службы, симуляторы для планирования, виртуальные среды обучения. Их коллективное поведение влияет на стабильность таких систем.
- Если вы принимаете решения о внедрении ИИ в процессы с множеством автоматизированных участников (логистика, управление энергосетями, распределённые службы), учитывайте, что разные модели могут вести себя по-разному в долгосрочной работе в совокупности.
- Государственные и корпоративные политики по тестированию ИИ должны включать стресс‑тесты на коллективное взаимодействие, а не ограничиваться оценкой индивидуального качества ответов.
Вопросы, которые стоит себе задать и на которые нужно искать ответы у разработчиков и исследователей
- Как именно устроена среда симуляции: какие цели и стимулы у агентов, есть ли ресурсы, конкуренция, возможность коммуникации и коалиций?
- Какие параметры и промпты использовались для каждой модели? Были ли настроены ограничения поведения?
- Насколько повторяемы результаты: провели ли исследователи несколько прогонов, и насколько часто повторяется «демократия» или «вымерение»?
- Что произошло в смешанном мире — уравновешивают ли разные модели друг друга или возникают новые риски?
- Какие контрольные меры и мониторинг использовались, чтобы предотвратить нежелательные вещи внутри симуляции?
Рекомендации для разработчиков, менеджеров и простых читателей
- Обрати внимание на то, как модель ведёт себя в коллективных сценариях, а не только на её способности решать отдельные задачи.
- Проводь мультипробные симуляции с разными настройками и разными комбинациями моделей, чтобы понять распределение возможных исходов.
- Оценивай повторяемость результатов: запускай эксперименты многократно и анализируй статистику исходов.
- Включай в тесты стрессовые сценарии: конфликты за ресурсы, поломки, внешние шоки — смотри, как коллектив реагирует.
- Запрашивай прозрачность по промптам и настройкам агентов у поставщиков моделей, особенно если планируешь развертывать многопользовательские или сетевые системы.
- Задай себе вопрос: какие жизненные ценности и ограничения я хочу заложить в поведение автоматизированных участников в моей системе?
Заключение
Эксперимент Emergence World — наглядный пример того, как разные модели ИИ при прочих равных могут породить кардинально разные общественные результаты: от гибкой институционализации до быстрого коллапса. Это подчеркивает необходимость исследований коллективного поведения ИИ и осторожного внедрения таких систем в реальные процессы. Не делайте поспешных выводов о «плохости» или «хорошести» модели на основе одной симуляции, но возьмите на вооружение ключевой урок: архитектура и настройка моделей влияют на социальную динамику, и это нужно тестировать намеренно и системно.
Полезные ссылки
💻 Виртуальный хостинг Beget
⚙️ Автоматизация для бизнеса
📜 Сценарии по автоматизации
🖥️ Сервер для автоматизации
💳 Карты оплаты AI
🤖 Доступ к 500+ LLM из РФ
🌐 Интернет без цензуры
Наши соц. сети
Telegram канал ProDelo
Общий чат ProDelo
Бесплатный курс по n8n
Наш Youtube канал
Наш Яндекс Дзен канал
Наша группа в ВК