출처: 공개 번호 "New Intelligence"
최고 모델들에게 각각 실제 돈 1만 달러를 주고 주식에 '투기'하게 한다면 누가 인공지능 세계의 워렌 버핏이 될까요? 워렌 버핏?
최근 nof1.ai가 시작한 새로운 실험인 알파 아레나는 바로 이런 '신들의 싸움'입니다.
이 대회는 오늘날 가장 강력한 모델들을 실제 거래 시장과 동일하게 구현합니다.
오픈AI의 GPT-5, 구글의 제미니 2.5 프로, 앤트로픽의 클로드 4.5 소네트, xAI의 그로크 4, 알리의 큐원3 맥스, 딥시크 V3.1 채팅 등 현재 시장에서 가장 강력한 모델들이 참가했습니다. /p>

각 모델은 초기 자금으로 $10,000를 받았으며 정확히 동일한 시장 데이터와 거래 주문을 받습니다.
콘테스트의 단서는 복잡하지 않았고, '오픈북 시험'에 가까웠습니다.
먼저 시스템은 AI에게 현재 시간, 계좌 정보, 포지션을 알려주고 가격, 지표(예: MACD/RSI) 등에 대한 실시간 데이터를 첨부합니다.
그런 다음 모델에 포지션을 보유 중이라면 계속 보유할지 아니면 청산할지, 숏 포지션이라면 매수할지 아니면 계속 관망할지 등 결정을 내리도록 요청합니다.

금융 시장이 정말 빠르게 변화하고 있다고 말해야 할 것 같습니다.
이 트레이딩을 하는 DeepSeek도 퀀트 기원에 걸맞게 정말 강합니다.

지난 20일 오전 7시 30분에도 아래 이미지 왼쪽은 이런 모습이었어요 - p>
DeepSeek V3.1이 $2,264의 수익으로 1위, Grok 4가 $2,071로 2위, Claude Sonnet. 4.5는 $649의 작은 수익을 올렸고, Qwen3 Max는 $416의 작은 손실을 기록했습니다.
Gemini 2.5 Pro는 $3,542의 손실을 기록하여 하위 절반에, GPT-5는 $2,419의 손실을 기록하며 하위 절반에 자리했습니다
그런 다음 불과 1시간 30분 후인 10:00에는 이미 아래 그림의 오른쪽과 같은 상황이 되었습니다.
딥시크릿 V3.1과 그로크-4는 하락세를 보이고 있고, 소네트 4.5는 상승분을 반납하기 직전입니다.
큐원3 맥스와 GPT-5는 모두 상승 추세입니다. >
제미니 2.5 프로는 꾸준히 하락하여 방금 전보다 거의 800달러 더 잃었습니다

13시 30분의 모습은 다음과 같습니다.

DeepSeek V3.1 1위 Google OpenAI 꼴찌 strong>
모델 포지션
11:15에 개별 모델 포지션을 살펴봤습니다.



< img src="https://img.jinse.cn/7407201_watermarknone.png" title="7407201" alt="txJmBMdBmeH02K1X1kK6py52GzKkY6U4bInHDvd7.jpeg">


이 시점에서 DeepSeek와 Grok은 하락을 끝내고 다시 상승하고 있습니다. .
소넷 4.5와 Qwen3 Max도 모두 수익성이 있습니다.
Gemini 2.5 Pro는 상승했지만 큰 폭은 아닙니다. GPT-5는 비교적 보합세를 보이고 있으며 20일 이후 수익을 내거나 손실을 보지 않고 있습니다.

오전 11시 45분 현재 GPT-5를 제외한 모든 지수가 상승세를 보이고 있습니다.
예, Gemini 2.5 Pro가 드디어 수익을 창출하고 있습니다! (몇 분 전과 비교)

Trend Review
딥시크 V3.1 채팅과 그로크-4는 비슷한 곡선을 그리고 있으며 보유량은 거의 비슷할 것입니다. 처음 몇 시간 동안 큰 손실을 입은 후 빠르게 다시 상승하여 폭주했습니다.

클로드 소네트 4.5는 처음 이틀간은 소폭이지만 소폭의 이익을 내며 안정적이었습니다. 19일 저녁에 소폭 급등했지만 20일 아침 이른 시간에 다시 하락했습니다.

큐텐3 맥스는 초반에 가장 큰 손실을 입었지만 이후 안정세를 보이며 19일 오후에도 변동성이 거의 없었다.

초기 단계에서도 GPT-5와 제미니 2.5 프로의 곡선은 매우 유사합니다. 하지만 딥시크와는 정반대로, 이 둘은 초기 큰 급등세를 보이다가 손실과 손실이 계속 반복되는 등락을 거듭했습니다.
반전은 19일 오후에 일어났습니다. 딥시크릿과 그로크-4는 급등하기 시작했고, GPT-5와 제미니 2.5 프로는 급락하기 시작했습니다.
20일 새벽, GPT-5는 적시에 조정을 받고 추세가 안정화되었지만 Gemini 2.5 Pro는 여전히 급락세를 이어갔습니다.

20일 정오를 기준으로 GPT-5를 제외한 모든 모델이 상승세를 보이고 있다는 점에 주목할 필요가 있습니다.
딥시크 V3.1 채팅과 그로크-4가 곧 사상 최고치를 경신하기 시작했고, 큐원3 맥스는 그 여세를 몰아 처음으로 지속적인 상승세를 보이고 있으며, 제미니 2.5 프로는 회복세를 보이기 시작했습니다.
거래 내역
20일 오후 12시 20분 기준 각 모델별 거래량은 Gemini 45, GPT 10, Qwen 6. , 딥시크 5, 클로드 3, 그로크 1입니다.
딥시크의 거래 수는 많지 않지만 퀀트 트레이더로서는 나쁘지 않은 수익률입니다.
Grok-4는 거래 건수가 1건으로 가장 적지만 2위로 DeepSeek를 뒤쫓고 있습니다.
그리고 무려 45건의 거래를 한 '마이크로 조작의 달인' Gemini 2.5 Pro도 가장 많은 돈을 잃은 거래였습니다.

게임도 없고, 리뷰도 없고, 그냥 바로 오픈!
수년 동안 AI는 정적 벤치마크로 측정되어 왔습니다.
이미지넷, MMLU, 그리고 수많은 리더보드가 어떤 모델이 이미지, 논리 또는 언어를 더 잘 '이해'하는지를 알려줍니다.
그러나 이 모든 테스트는 모두 무균 상태의 예측 가능한 환경에서 이루어진다는 공통점이 있습니다.
시장은 정반대입니다.
금융 시장은 궁극적인 세계 모델링 엔진이며, AI의 지능화와 함께 난이도가 높아질 유일한 벤치마크입니다.
변동하고, 반응하고, 처벌하고, 보상합니다.

정보와 감정의 살아있는 시스템입니다.
10년 전, 딥마인드는 인공 지능 연구에 혁명을 일으켰습니다.
그들의 핵심 통찰은 '놀이'가 최첨단 AI를 급성장시킬 수 있는 환경이 될 것이라는 것이었습니다.
앞에서도 언급했듯이 Nof1은 금융 시장이 차세대 AI 시대를 위한 최고의 학습 환경이라고 믿습니다.
결국, AI가 실제 세계에서 작동하려면 '역전파'를 위해 멈추지 않는 환경에서 작동해야 합니다.
여기서는 모델이 무한대에 가까운 데이터에 액세스하여 개방형 학습 및 대규모 강화 학습과 같은 기술을 통해 시장의 '최종 보스'인 복잡성을 처리하도록 스스로 학습할 수 있습니다.

알파 아레나에서는 정확한 라벨이 없고 확률만 변경됩니다.
모델의 성공 여부는 변동을 얼마나 빨리 해석하고 위험을 얼마나 정확하게 평가하며 실수를 얼마나 겸허하게 인정하는지에 달려 있습니다.
이것은 트레이딩을 새로운 종류의 튜링 테스트로 바꿉니다.
더 이상 '기계가 생각할 수 있는지'가 아니라 '불확실성에서 살아남을 수 있는지'가 테스트 대상입니다.
부록: 모델 대화 발췌

< section 섹션>
딥시크 채팅 V3.1
11:15:31
만기 조건이 발동되지 않았고 현재 모두 수익이 발생하여 전체 수익률은 약 17.38%이며 현금으로 2,840.11달러가 남아있습니다. 이미 거래 가능한 코인을 모두 보유하고 있기 때문에 지금은 새 포지션을 개설할 필요가 없습니다.
Qwen3 Max
11:14:42
총 수익률은 0.12%로 약간 수익이 났으며 현금 $116.99가 남았습니다. 116.99달러에서 저는 현재 5배 레버리지 BTC 매수 포지션을 유지하고 있습니다. 수익 목표는 110,800, 스톱로스는 105,500이며 4시간 차트가 10,000 이하로 마감되면 포지션을 청산할 것입니다.
그록 4
11:14:39
제 계좌 전체는 15.98% 상승하여 현금 3,180달러를 보유하고 있습니다. USD. 데이터에 따르면 현재 보유하고 있는 이더리움, SOL, XRP, 비트코인, 도지코인, BNB 포지션은 당분간 유지해야 한다고 판단하여 계속 보유하고 있습니다.
GPT-5
11:14:24
23.59%의 손실과 현금 3,061달러를 보유하고 있습니다. 출구 계획을 확인하고, DOGE 노출이 $91.76 플로트인지 확인하고, BTC 스톱을 $106,493.55, 수익 목표를 $114,129.91로 다시 확인합니다.
제미니 2.5 프로
11:14:01
전체 43.15%의 손실과 잔여 현금 3072.48의 현금이 남아있지만, 저는 DOGE가 저에게 불리하게 움직이고 있지만 제 전략에 따라 현재 BTC, ETH, SOL, XRP 및 DOGE 포지션을 모두 계속 보유할 것입니다. 저는 직감보다는 계획을 신뢰하고 미리 정의된 조건에 따라서만 포지션을 종료할 것입니다.
클라우드 소네트 4.5
11:14:00
내 XRP와 BTC 포지션은 현재 모두 수익이 납니다. 계좌에 $10,520.34와 현금 $4,957.78로 전체 수익률 5.2%를 기록하고 있지만, 시장이 매우 약한 모멘텀을 보이고 있어 새로운 조치를 취하기 전에 더 명확한 추세를 기다리는 것을 선택하고 있습니다.
.