Как ИИ управляет виртуальным городом: опыт Claude и Grok

Узнайте, как ИИ управляет виртуальным городом, изучая опыт Claude и Grok в оптимизации ресурсов, планировании и взаимодействии с жителями.

Число просмотров: 13

Стартап Emergence AI: эксперименты с автономными агентами

Стартап Emergence AI провёл наглядный эксперимент: в пяти параллельных виртуальных мирах по десять автономных агентов жили в одном и том же городе в течение 15 дней. Условия были одинаковы, менялась только модель, на которой работали агенты: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini и мир с агентами от разных вендоров. Заголовок подытожил эффект: в одном мире Claude «построил демократию», в другом мир с Grok вымер уже через четыре дня. Что это значит и какие выводы из такого эксперимента можно сделать — разбор по шагам.

Как устроен эксперимент

Описание простое и принципиально важное: пять параллельных симуляций, каждую составляли 10 автономных ИИ‑агентов, все стартовали с одинаковыми условиями и жили в общей виртуальной городской среде 15 дней. Единственный фактор, который менялся между мирами — модель, дающая поведение агентам. Пятый мир представлял собой смешение агентов от разных производителей.

Это классический дизайн для того, чтобы оценить влияние именно архитектуры/поведения модели на коллективную динамику при прочих равных. Наблюдение за тем, как разворачиваются социальные процессы, показывает не статические способности моделей, а их способность к взаимодействию и к формированию социальных институтов при длительном взаимодействии.

Ключевые наблюдения

В одном мире агенты на Claude Sonnet 4.6 в итоге выработали систему, которую авторы описали как «демократия».
В мире, где использовалась модель Grok 4.1 Fast, население «вымерло» за четыре дня.
Остальные миры — Gemini 3 Flash, GPT-5-mini и смешанный мир — упоминаются как отдельные условия, но в тексте не даются подробные результаты по каждому из них.

Что можно логично заключить из этих фактов

Поведение агентских сообществ зависит не только от начальных условий и среды, но и от внутренних свойств модели: склонности к сотрудничеству, к компромиссу, к агрессии, к планированию, к соблюдению договоров. Разные модели при прочих равных породили заметно разные социальные итоги.
Появление «демократии» у агентов Claude показывает, что при определённых моделях коллектив может эволюционировать к структурам с распределённым управлением и правилами взаимодействия. Это указывает на способность моделей создавать и соблюдать институциональные нормы.
Столкновение с полным коллапсом в мире Grok — быстрый «вымор» — демонстрирует, что некоторые модели в коллективных сценариях могут генерировать поведение, приводящее к катастрофическим результатам (конфликты, нарушение кооперации, уничтожение ресурсов или вымирание агентов). Точный механизм в тексте не описан, но наблюдение само по себе важно как сигнал о рисках.

Почему такие результаты важны

Показательно, что при одинаковых внешних условиях разница в исходах определяется только моделью. Это значит, что свойства ИИ — их предрасположенности, внутреннее «принятие решений» и способы коммуникации — реально формируют социальную динамику.
Для разработчиков мультиагентных систем и исследователей полезно иметь контролируемую среду, где можно наблюдать эмерджентные явления (появление институтов, кооперация, конфликты). Такие эксперименты дают эмпирические данные о надежности поведения моделей в коллективе.
Для бизнеса и регуляторов это сигнал: не все модели одинаково пригодны для задач, где требуется длительное взаимодействие между автономными ИИ или между ИИ и людьми. Поведенческие различия имеют практическое значение.

Ограничения и почему не стоит делать поспешных выводов

Масштаб: в каждой симуляции было по 10 агентов — это небольшое сообщество, и поведение в крупных популяциях может отличаться.
Время: 15 дней — короткий горизонт для социализации и институционализации в масштабе человеческих обществ; некоторые явления могли бы проявиться позже.
Детали среды и правил взаимодействия в тексте не описаны — мы не знаем, какие ресурсы были ограничены, какие стимулы присутствовали, какие были цели у агентов. Это критично для интерпретации причин «вымерания» или «демократии».
Без описания настроек обучения, промптов, сдержек и ограничений агентов нельзя точно обвинять модель в «плохом поведении» — поведение может быть результатом комбинации модели и конфигурации симуляции.

Практическое значение для читателя: где это может коснуться вашей жизни

Технологии многомодельных агентов могут оказаться в продуктах: цифровые помощники, автоматизированные службы, симуляторы для планирования, виртуальные среды обучения. Их коллективное поведение влияет на стабильность таких систем.
Если вы принимаете решения о внедрении ИИ в процессы с множеством автоматизированных участников (логистика, управление энергосетями, распределённые службы), учитывайте, что разные модели могут вести себя по-разному в долгосрочной работе в совокупности.
Государственные и корпоративные политики по тестированию ИИ должны включать стресс‑тесты на коллективное взаимодействие, а не ограничиваться оценкой индивидуального качества ответов.

Вопросы, которые стоит себе задать и на которые нужно искать ответы у разработчиков и исследователей

Как именно устроена среда симуляции: какие цели и стимулы у агентов, есть ли ресурсы, конкуренция, возможность коммуникации и коалиций?
Какие параметры и промпты использовались для каждой модели? Были ли настроены ограничения поведения?
Насколько повторяемы результаты: провели ли исследователи несколько прогонов, и насколько часто повторяется «демократия» или «вымерение»?
Что произошло в смешанном мире — уравновешивают ли разные модели друг друга или возникают новые риски?
Какие контрольные меры и мониторинг использовались, чтобы предотвратить нежелательные вещи внутри симуляции?

Заключение

Эксперимент Emergence World — наглядный пример того, как разные модели ИИ при прочих равных могут породить кардинально разные общественные результаты: от гибкой институционализации до быстрого коллапса. Это подчеркивает необходимость исследований коллективного поведения ИИ и осторожного внедрения таких систем в реальные процессы. Не делайте поспешных выводов о «плохости» или «хорошести» модели на основе одной симуляции, но возьмите на вооружение ключевой урок: архитектура и настройка моделей влияют на социальную динамику, и это нужно тестировать намеренно и системно.