- Das o3-Modell von OpenAI gewann ein fünftägiges Pokerturnier mit neun KI-Chatbots
- Das o3-Modell gewann, indem es das beständigste Spiel spielte
- Die meisten Top-Sprachmodelle kamen gut mit Poker zurecht, hatten jedoch Probleme mit Bluffs, Stellung und grundlegender Mathematik
In einem digitalen Showdown, der noch nie zuvor am Tisch ausgetragen wurde, verbrachten neun der einflussreichsten großen Sprachmodelle der Welt fünf Tage lang ein hochriskantes Pokerspiel.
o3 von OpenAI, Claude Sonnet 4.5 von Anthropic, Grok von X.ai, Google’s Gemini 2.5 Pro, Meta’s Llama 4, DeepSeek R1, Kimi K2 von Moonshot AI, Magistral von Mistral AI und Z.AI’s GLM 4.6 spielten Tausende von Händen No-Limit Texas Hold’em an $10- und $20-Tischen mit einem Einsatz von jeweils $100.000.
Als das o3-Modell von OpenAI aus einem einwöchigen Pokerspiel $36.691 reicher hervorging, gab es keine Trophäe, sondern nur prahlende Rechte.
Das experimentelle PokerBattle.ai wurde vollständig KI-gesteuert, wobei jedem Spieler die gleiche Anfangsaufforderung gegeben wurde. Es war pure Strategie, wenn Strategie das ist, was man Tausende von Mikroentscheidungen nennt, die von Maschinen getroffen werden, die nicht wirklich verstehen, wie man gewinnt, verliert oder wie demütigend es ist, mit sieben Zweien zu scheitern.
Für einen Tech-Stunt war es ungewöhnlich aussagekräftig. Die leistungsstärksten KIs blufften und setzten nicht nur – sie passten sich an, modellierten ihre Gegner und lernten in Echtzeit, mit Unklarheiten umzugehen. Obwohl sie nicht fehlerfrei Poker spielten, kamen sie dem Urteilsvermögen erfahrener Spieler beeindruckend nahe.
o3 von OpenAI zeigte schnell, dass es die stabilste Hand hatte, gewann drei der fünf größten Pots und hielt sich an die Lehrbuch-Pre-Flop-Theorie. Claude von Anthropic und Grok von X.com komplettierten die Top Drei mit beachtlichen Gewinnen von 33.641 US-Dollar bzw. 28.796 US-Dollar.
Unterdessen verlor Llama seinen vollen Stack und schied früh aus. Der Rest der Gruppe landete irgendwo dazwischen, wobei Gemini von Google einen bescheidenen Gewinn einfuhr und Kimi K2 von Moonshot einen Chiprückgang auf ein Ergebnis von 86.030 US-Dollar hinnehmen musste.
Glücksspiel-KI
Poker ist seit langem eines der besten Analogien zum Testen allgemeiner KI. Im Gegensatz zu Schach oder Go, die auf perfekten Informationen beruhen, erfordert Poker, dass die Spieler unter Unsicherheit denken. Es ist ein Spiegel der realen Entscheidungsfindung in allen Bereichen, von Geschäftsverhandlungen bis hin zu militärischen Strategien, und jetzt, offenbar, Chatbot Entwicklung.
Eine ständige Erkenntnis aus dem Turnier war, dass die Bots oft zu aggressiv waren. Die meisten bevorzugten aktionsintensiven Strategien, selbst in Situationen, in denen ein Aussteigen klüger gewesen wäre. Sie versuchten mehr, große Pots zu gewinnen, als sie zu vermeiden, sie zu verlieren. Und sie waren schrecklich im Bluffen, nicht weil sie es nicht versuchten, sondern weil ihre Bluffs oft auf falsch verstandenen Händen und nicht auf cleverer Täuschung beruhten.
Dennoch werden KI-Tools auf eine Weise intelligenter, die weit über die oberflächliche Intelligenz hinausgeht. Sie wiederholen nicht nur, was sie gelesen haben; Sie treffen unter Druck probabilistische Urteile und lernen, den Raum zu lesen. Es ist auch eine Erinnerung daran, dass selbst leistungsstarke Modelle immer noch Mängel aufweisen. Situationen falsch einzuschätzen, unsichere Schlussfolgerungen zu ziehen und die eigene „Position“ zu vergessen, ist nicht nur ein Pokerproblem.
In einem echten Pokerraum sitzen Sie vielleicht nie einem Sprachmodell gegenüber, aber die Chancen stehen gut, dass Sie mit einem interagieren und versuchen, wichtige Entscheidungen zu treffen. Dieses Spiel war nur ein Vorgeschmack darauf, wie das aussehen könnte.
Folgen Sie TechRadar auf Google News Und Fügen Sie uns als bevorzugte Quelle hinzu um unsere Expertennachrichten, Rezensionen und Meinungen in Ihren Feeds zu erhalten. Klicken Sie unbedingt auf die Schaltfläche „Folgen“!
Und natürlich können Sie das auch Folgen Sie TechRadar auf TikTok für Neuigkeiten, Rezensionen, Unboxings in Videoform und erhalten Sie regelmäßige Updates von uns WhatsApp zu.
Die besten Business-Laptops für jedes Budget



