In den vier Monaten seit der Veröffentlichung von OpenAI hat sich in der KI-Branche viel verändert ChatGPT-Bilder 1.5. Wir haben ein hitziges Rennen gesehen um Agenten-Tools zu erstellenein beispielloser Deal mit dem Pentagon Und endloser KI-Schwachsinn.
Jetzt ist OpenAI zurück im generativen Medienspiel. Das Unternehmen gab am Dienstag bekannt, dass es ChatGPT Images 2, sein Bildmodell der nächsten Generation, veröffentlicht.
ChatGPT Images 2 soll textlastige Designs erstellen, wie in dieser Matcha-Werbung und dem gefälschten Magazin-Cover.
Es mag seltsam erscheinen, dass OpenAI nur einen Monat nach der Ankündigung ein neues Image-Modell veröffentlicht Schließung seiner einst viralen Sora AI-Video-App um sich auf die Entwicklung unternehmenstauglicher „Kernprodukte“ zu konzentrieren. Aber aus der Art und Weise, wie das neue Modell aufgebaut wurde, geht klar hervor, dass OpenAI dieses Ziel nicht aufgibt.
ChatGPT Images 2 wurde für die Erstellung textlastiger Bilder entwickelt, darunter Infografiken, wissenschaftliche Poster, Studienführer und Marketingmaterialien. Die Tage von seltsame Sora-Videos Und Von Studio Ghibli inspirierte Memes sind vorbei.
Jetzt entwickelt das Unternehmen eine KI, die das erledigen kann, was es als „wirtschaftlich wertvolle kreative Aufgaben“ bezeichnet.
„Die Möglichkeiten und Anwendungsfälle für visuelle Intelligenz erweitern sich immer weiter, und wir glauben, dass dies für die Vision von ChatGPT, Ihren eigenen persönlichen Assistenten zu entwickeln, von entscheidender Bedeutung ist, da Ihr kreativer Assistent einen großen Teil Ihrer Persönlichkeit ausmacht“, sagte Adele Li, Produktleiterin für ChatGPT Images, Reportern in einer Pressekonferenz.
(Offenlegung: Ziff Davis, die Muttergesellschaft von CNET, reichte im April 2025 eine Klage gegen OpenAI ein und behauptete, das Unternehmen habe bei der Schulung und dem Betrieb seiner KI-Systeme die Urheberrechte von Ziff Davis verletzt.)
In diesen Beispielen können Sie sehen, wie viel besser ChatGPT Images 2 bei der Darstellung lesbaren Textes ist.
OpenAI hat das verfolgt Ich träume von einer Super-Appein One-Stop-Shop für alles rund um KI, aufgebaut auf der Codex-Plattform. ChatGPT Images 2 bringt das kreative Teil dieses Puzzles.
Das neue Modell verbessert natürlich Typografie, Ikonografie und Komposition, um professionellere KI-Bilder zu erstellen. Es kann Text in mehreren Sprachen generieren. KI-Bildmodelle haben bekanntermaßen Schwierigkeiten, lesbaren, sachlich korrekten Text zu erstellen. ChatGPT Images 2 ist OpenAIs bisher bestes Modell dafür. Google hat zuvor seine Textwiedergabe mit verbessert Nano Banana Proaber selbst dieses „Beste vom Besten“-Modell hatte Probleme mit der Genauigkeit.
ChatGPT Images 2 wird jetzt für alle Benutzer bereitgestellt. Ihr Generierungslimit hängt von Ihrem Plan ab: Je mehr Sie bezahlen, desto mehr KI-Bilder können Sie generieren.
Entwickler, die das Modell in der API verwenden, können Bilder in 2K- und 4K-Auflösung erstellen, obwohl sich diese höheren Auflösungen noch in der Betaphase befinden und möglicherweise unsicher sind. Bezahlende Benutzer können mithilfe von Denk- und Argumentationsmodellen auch Bilder erstellen, die ihnen helfen, im Internet nach Informationen zu suchen, diese in einem lesbaren Design zusammenzustellen und ihre Arbeit noch einmal zu überprüfen.
„Bildmodell“ scheint nicht ganz der richtige Begriff für ChatGPT Images 2 zu sein, obwohl er technisch korrekt ist. ChatGPT erfasst nicht den fantastischen Surrealismus von KI-Bildern wie Midjourney und bietet auch nicht annähernd die Bearbeitungswerkzeuge von Adobe Firefly.
Es richtet sich jedoch an eine Benutzergruppe, die sich in der Mitte des Spektrums der künstlerischen Enthusiasten von Midjourney und der professionellen Entwickler von Adobe befindet: diejenigen, die attraktive Inhalte erstellen müssen.
Wie bei Anthropic neu erschienenes Claude DesignChatGPT Images 2 von OpenAI richtet sich an Berufstätige. Lehrer können damit Studienführer und illustrierte Unterrichtspläne erstellen. Marketingmanager können Social-Media-Beiträge und visuelle Assets erstellen.
Sie können bis zu acht Bilder aus einer einzigen Eingabeaufforderung erstellen, z. B. einen dreiseitigen Bericht, der die visuelle Konsistenz aller Bilder beibehält.
Mit ChatGPT Images 2 können Sie längere Berichte erstellen, alle übereinstimmenden Seiten.
Dies ist die zweite Hälfte des KI-generierten Limettenkuchen-Rezepts. Beachten Sie die visuelle Konsistenz.
Ein Nachteil besteht darin, dass Sie ein KI-Bild immer noch neu generieren müssen, wenn Sie es optimieren möchten. Bei textlastigeren Designs ist die Wahrscheinlichkeit größer, dass dies erforderlich ist, sodass Sie Ihre Credits schneller durchgehen. OpenAI sagte, es konzentriere sich auf die Beibehaltung seines iterativen, auf Eingabeaufforderungen basierenden Bearbeitungsablaufs, um die Benutzerfreundlichkeit zu gewährleisten.
Die Sicherheitsverfahren von OpenAI haben sich seit dem letzten Image-Modell nicht wesentlich geändert. Es enthält weiterhin Metadaten über den C2PA-Standard, sodass die Herkunft von KI-Bildern identifiziert werden kann. Beleidigende und illegale Bilder sind in den OpenAI-Richtlinien immer noch verboten, eine wichtige Leitlinie, die KI-Unternehmen angesichts aktueller Beispiele wirksam durchsetzen müssen KI-generierte Deepfakes Und nicht einvernehmliche intime Bilder.


