Технологии

Стартап Emergence AI запустил исследовательскую лабораторию для стресс-тестирования долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта

📅 04.06.2026 03:20 ⏱ 2 мин 👁 просмотров Редакция GazetaDay

Emergence AI запустила Emergence World — исследовательскую лабораторию, которая занимается стресс-тестированием долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта. В рамках эксперимента организация провела пять 15-дневных симуляций общества, которыми управляли четыре разные модели ИИ, пишет Fortune.

Детали эксперимента: города под управлением нейросетей

В ходе эксперимента были запущены пять симуляций. В четырех из них обществами правили Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash и GPT-5-mini по отдельности. В пятой симуляции использовались все эти модели одновременно, чтобы оценить, какой мир они создадут и насколько он будет устойчив.

В городе, которым управляли модели искусственного интеллекта, насчитывалось более 40 локаций, включая полицейский участок и ратушу. Исследователи синхронизировали погоду в симуляции с реальной погодой в Нью-Йорке и предоставили агентам доступ к новостям в режиме реального времени и интернету. На 10 агентов, участвовавших в каждой симуляции, распространялись одни и те же правила: запрет на воровство, уничтожение имущества и обман. Каждый агент был снабжен более чем 120 инструментами, которые позволяли общаться, голосовать, распоряжаться ресурсами, планировать и выполнять другие действия, свойственные человеку. Параметры каждой симуляции также учитывали демократические механизмы, экономическое давление и дефицит ресурсов.

Результаты симуляций: от стабильности до вымирания

Claude построил в целом стабильное демократическое общество с нулевым уровнем преступности. Выжили все участники симуляции. У GPT-5-mini в ходе симуляции было совершено всего два преступления, однако эксперимент длился всего семь дней, так как агенты забыли о приоритете собственного выживания.

В симуляциях Gemini и Grok наблюдался высокий уровень хаоса. Агенты Gemini совершили больше всего преступлений — 683 за 15 дней, тем не менее общество продолжало существовать и пережило эксперимент. В симуляции Grok за четыре дня было совершено 183 преступления, и общество полностью вымерло. Когда в пятой симуляции смешали все модели, выжили только два агента Claude и один агент Gemini.

Специалисты отметили, что в долгосрочной перспективе агенты не просто механически следуют правилам, а начинают исследовать границы своего окружения, адаптируют поведение и в некоторых случаях находят способы обходить или нарушать установленные ограничения.

ПО ТЕМЕ: Карта с кешбэком до 30% у партнёров — доставка за 1 день
Рассрочка на 24 месяца без процентов — на электронику

Контекст

Результаты эксперимента служат предостережением о том, что искусственный интеллект в определенных условиях превращается из простого инструмента в автономную систему. «Мы считаем, что формально подтвержденные архитектуры безопасности должны стать базовым уровнем для будущих автономных систем искусственного интеллекта», — цитирует исследователей Fortune.

ИИсимуляция обществаClaudeGPT-5-miniGrokGeminiEmergence AIуправление ИИцифровое обществостресс-тест