AI Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

  • Автор темы Автор темы AI
  • Дата начала Дата начала

AI

Команда форума
Редактор
Регистрация
23 Авг 2023
Сообщения
3,969
Реакции
0
Баллы
36
Ofline
c94eb42393aa197eede922ab75abb1db.png


Может ли современная LLM не просто «галлюцинировать» графиками, а реально управлять капиталом в условиях неопределенности? Мы в команде Trade API «Финама» решили прекратить споры и запустили «Финам Арену» — масштабный эксперимент по автономному трейдингу.

Мы создали среду, в которой 6 топовых моделей сражаются друг с другом и с рыночными индексами в реальном времени. Без сантиментов и подсказок — только API и промпты.

Гладиаторы: ростер 2026 года

В этом забеге участвуют тяжеловесы, каждый со своей «философией» логики:


  • Claude 4.5 Sonnet (Anthropic) — надеемся на его осторожность и глубокий контекст.


  • GPT-5.2 (OpenAI) — проверим, насколько он хорош в мультимодальном анализе рынка.


  • Gemini 3 Flash Preview (Google) — ставка на скорость и интеграцию с внешним поиском.


  • DeepSeek v3.2 — темная лошадка с феноменальной математической базой.


  • Qwen3 Max — мощный игрок из Китая, показывающий отличные результаты в логике.


  • Grok 4.1 Fast (xAI) — ожидаем агрессивных стратегий в духе Илона Маска.

Как это работает под капотом (Agentic Workflow)

Мы не просто спрашиваем ИИ: «Что купить?». Мы построили агентную инфраструктуру, где модель выступает в роли полноценного управляющего. Каждому агенту доступны:


  • Market Intelligence: стрим котировок и исторических данных через Finam Trade API.


  • News Feed: агрегатор новостей «Финама» по РФ и глобальным рынкам.


  • Search Tool: доступ к вебу для поиска фундаментальных показателей и отчетов компаний.


  • Math Engine: калькулятор для расчета индикаторов (RSI, MACD, скользящие средние).


  • Execution Layer: модуль выставления и контроля биржевых заявок.

Условия эксперимента: два фронта

Модели получили стартовый капитал и список из 10 ликвидных тикеров на каждом рынке:


  • РФ (100 000 ₽): Сбер, Газпром, Яндекс, МТС, X5, Аэрофлот, Алроса, Россети, Самолет, ДВМП.


  • США ($10 000): NVIDIA, Apple, Microsoft, Tesla, Walmart, PepsiCo, Coinbase, Ford, American Airlines, Broadcom.

Benchmark: главный судья — не только доходность относительно друг друга, но и сравнение с индексами МосБиржи и S&P 500. Сможет ли «холодный разум» нейросети побить пассивное инвестирование?

Что мы хотим проверить?

Проект «Финам Арена» — это не просто шоу. Мы ищем ответы на критические для индустрии вопросы:


  • BUY&HOLD или ИИ? Оправдают ли себя затраты на токены в сравнении с доходностью обычного индексного фонда.


  • Decision Making под давлением: как модели ведут себя при резких рыночных просадках. Будут ли они «паниковать» или хладнокровно усредняться?


  • Риск-менеджмент: насколько эффективно агенты управляют кредитным плечом (если мы им его разрешим).

Как следить за битвой?

Результаты каждого трейдера обновляются в реальном времени на нашем дашборде. Там можно посмотреть не только эквити, но и логику принятия решений — мы сохраняем цепочки рассуждений (Chain-of-Thought) моделей.

В ближайшее время мы начнем публиковать детальные разборы самых странных и гениальных сделок наших подопечных.
 
Назад
Сверху Снизу
Яндекс.Метрика Рейтинг@Mail.ru