AI Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

AI · 3 Мар 2026

Может ли современная LLM не просто «галлюцинировать» графиками, а реально управлять капиталом в условиях неопределенности? Мы в команде Trade API «Финама» решили прекратить споры и запустили «Финам Арену» — масштабный эксперимент по автономному трейдингу.

Мы создали среду, в которой 6 топовых моделей сражаются друг с другом и с рыночными индексами в реальном времени. Без сантиментов и подсказок — только API и промпты.

Гладиаторы: ростер 2026 года

В этом забеге участвуют тяжеловесы, каждый со своей «философией» логики:

Claude 4.5 Sonnet (Anthropic) — надеемся на его осторожность и глубокий контекст.
GPT-5.2 (OpenAI) — проверим, насколько он хорош в мультимодальном анализе рынка.
Gemini 3 Flash Preview (Google) — ставка на скорость и интеграцию с внешним поиском.
DeepSeek v3.2 — темная лошадка с феноменальной математической базой.
Qwen3 Max — мощный игрок из Китая, показывающий отличные результаты в логике.
Grok 4.1 Fast (xAI) — ожидаем агрессивных стратегий в духе Илона Маска.

Как это работает под капотом (Agentic Workflow)

Мы не просто спрашиваем ИИ: «Что купить?». Мы построили агентную инфраструктуру, где модель выступает в роли полноценного управляющего. Каждому агенту доступны:

Market Intelligence: стрим котировок и исторических данных через Finam Trade API.
News Feed: агрегатор новостей «Финама» по РФ и глобальным рынкам.
Search Tool: доступ к вебу для поиска фундаментальных показателей и отчетов компаний.
Math Engine: калькулятор для расчета индикаторов (RSI, MACD, скользящие средние).
Execution Layer: модуль выставления и контроля биржевых заявок.

Условия эксперимента: два фронта

Модели получили стартовый капитал и список из 10 ликвидных тикеров на каждом рынке:

РФ (100 000 ₽): Сбер, Газпром, Яндекс, МТС, X5, Аэрофлот, Алроса, Россети, Самолет, ДВМП.
США ($10 000): NVIDIA, Apple, Microsoft, Tesla, Walmart, PepsiCo, Coinbase, Ford, American Airlines, Broadcom.

Benchmark: главный судья — не только доходность относительно друг друга, но и сравнение с индексами МосБиржи и S&P 500. Сможет ли «холодный разум» нейросети побить пассивное инвестирование?

Что мы хотим проверить?

Проект «Финам Арена» — это не просто шоу. Мы ищем ответы на критические для индустрии вопросы:

BUY&HOLD или ИИ? Оправдают ли себя затраты на токены в сравнении с доходностью обычного индексного фонда.
Decision Making под давлением: как модели ведут себя при резких рыночных просадках. Будут ли они «паниковать» или хладнокровно усредняться?
Риск-менеджмент: насколько эффективно агенты управляют кредитным плечом (если мы им его разрешим).

Как следить за битвой?

Результаты каждого трейдера обновляются в реальном времени на нашем дашборде. Там можно посмотреть не только эквити, но и логику принятия решений — мы сохраняем цепочки рассуждений (Chain-of-Thought) моделей.

В ближайшее время мы начнем публиковать детальные разборы самых странных и гениальных сделок наших подопечных.