Стартап Emergence AI запустил исследовательскую лабораторию для стресс-тестирования долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта
Emergence AI запустила Emergence World — исследовательскую лабораторию, которая занимается стресс-тестированием долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта. В рамках эксперимента организация провела пять 15-дневных симуляций общества, которыми управляли четыре разные модели ИИ, пишет Fortune.
Детали эксперимента: города под управлением нейросетей
В ходе эксперимента были запущены пять симуляций. В четырех из них обществами правили Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash и GPT-5-mini по отдельности. В пятой симуляции использовались все эти модели одновременно, чтобы оценить, какой мир они создадут и насколько он будет устойчив.
В городе, которым управляли модели искусственного интеллекта, насчитывалось более 40 локаций, включая полицейский участок и ратушу. Исследователи синхронизировали погоду в симуляции с реальной погодой в Нью-Йорке и предоставили агентам доступ к новостям в режиме реального времени и интернету. На 10 агентов, участвовавших в каждой симуляции, распространялись одни и те же правила: запрет на воровство, уничтожение имущества и обман. Каждый агент был снабжен более чем 120 инструментами, которые позволяли общаться, голосовать, распоряжаться ресурсами, планировать и выполнять другие действия, свойственные человеку. Параметры каждой симуляции также учитывали демократические механизмы, экономическое давление и дефицит ресурсов.
Результаты симуляций: от стабильности до вымирания
Claude построил в целом стабильное демократическое общество с нулевым уровнем преступности. Выжили все участники симуляции. У GPT-5-mini в ходе симуляции было совершено всего два преступления, однако эксперимент длился всего семь дней, так как агенты забыли о приоритете собственного выживания.
В симуляциях Gemini и Grok наблюдался высокий уровень хаоса. Агенты Gemini совершили больше всего преступлений — 683 за 15 дней, тем не менее общество продолжало существовать и пережило эксперимент. В симуляции Grok за четыре дня было совершено 183 преступления, и общество полностью вымерло. Когда в пятой симуляции смешали все модели, выжили только два агента Claude и один агент Gemini.
Специалисты отметили, что в долгосрочной перспективе агенты не просто механически следуют правилам, а начинают исследовать границы своего окружения, адаптируют поведение и в некоторых случаях находят способы обходить или нарушать установленные ограничения.
ПО ТЕМЕ:
Карта с кешбэком до 30% у партнёров — доставка за 1 день
Рассрочка на 24 месяца без процентов — на электронику
Контекст
Результаты эксперимента служат предостережением о том, что искусственный интеллект в определенных условиях превращается из простого инструмента в автономную систему. «Мы считаем, что формально подтвержденные архитектуры безопасности должны стать базовым уровнем для будущих автономных систем искусственного интеллекта», — цитирует исследователей Fortune.
- Биткоин: $64236 (24ч: -4.1%)
- Ethereum: $1814.92 (24ч: -3.0%)