Start Nachrichten Ich habe einen frühen Blick auf ChatGPT Images 2.0 geworfen und es...

Ich habe einen frühen Blick auf ChatGPT Images 2.0 geworfen und es ist beeindruckend – mit einer Ausnahme

2
0
Ich habe einen frühen Blick auf ChatGPT Images 2.0 geworfen und es ist beeindruckend – mit einer Ausnahme

Elyse bessert Picaro / ZDNET

Folgen Sie ZDNET: Fügen Sie uns als bevorzugte Quelle hinzu auf Google.


Die wichtigsten Erkenntnisse von ZDNET

  • OpenAI gestaltet Bilder als visuelle Sprache neu.
  • Der Denkmodus erstellt kontextbezogene Infografiken.
  • Die Markentreue ist in frühen Tests immer noch inkonsistent.

OpenAI kündigte heute ChatGPT Images 2.0 an, sein Bildmodell der nächsten Generation, das sich nach Angaben des Unternehmens auf Präzision, Benutzerfreundlichkeit und komplexe visuelle Aufgaben konzentriert.

Die bemerkenswerteste neue Funktion ist die Möglichkeit, Text und Bilder zu kombinieren, um komplexe, schöne Seiten zu erstellen. OpenAI formuliert die gesamte Idee der Bildgenerierung von einem Prozess, der Dekorationen (ihr Wort) erstellt, in eine Sprache (auch ihren Begriff) um.

Außerdem: Die besten KI-Bildgeneratoren des Jahres 2026: Es gibt derzeit nur einen klaren Gewinner

OpenAI beschreibt es als: „Ein gutes Bild tut das, was ein guter Satz tut – es wählt aus, arrangiert und enthüllt. Es kann einen Mechanismus erklären, eine Stimmung inszenieren, eine Idee testen oder ein Argument vorbringen.“

Denkfähigkeiten ermöglichen komplexe Arbeitsabläufe

Zusätzlich zu seiner erheblich verbesserten Fähigkeit, Text und Grafiken zu mischen, verfügt das neue Modell über verbesserte Denkfähigkeiten. Es können mehrere Bilder pro Eingabeaufforderung mit Kontinuität über die Ausgaben hinweg generiert werden. Dieser Ansatz ist möglich, weil das Modell tatsächlich Argumente in die Bildausgabe integriert.

san-francisco.png
Erstellt von ChatGPT/Screenshot von David Gewirtz/ZDNET

Dieser Wandel ist groß. Anstatt nur ein Bild zu erstellen, das weitgehend mit den Eingabeaufforderungsdetails übereinstimmt, kann Images 2.0 eine viel vagere Eingabeaufforderung annehmen, wie zum Beispiel „Erstellen Sie eine Infografik über Aktivitäten, die ich unter Berücksichtigung des morgigen Wetters in San Francisco durchführen sollte.“

Außerdem: So wechseln Sie von ChatGPT zu Gemini

Anhand dieser Eingabeaufforderung sammelt die KI Wetter- und Aktivitätsdaten über San Francisco, ermittelt wettergerechte Aktivitäten und erstellt dann ein Bild oder eine Reihe von Bildern, die zu den Ergebnissen passen.

Laut OpenAI „verhält sich Images 2.0 in diesem Modell eher wie ein visueller Denkpartner, der dabei hilft, ein Projekt vom groben Konzept bis zum fertigen Asset mit deutlich weniger Arbeit Ihrerseits voranzutreiben.“

Präzision und Designkontrolle verbessern die Benutzerfreundlichkeit

Viele von uns haben lange darum gekämpft, ChatGPT davon zu überzeugen, Bilder in einem bestimmten gewünschten Seitenverhältnis zu generieren. Oft produziert die KI hartnäckig, was sie will. Aber jetzt, mit Images 2.0, unterstützt das Modell „Seitenverhältnisse von bis zu 3:1 breit und bis zu 1:3 hoch“.

Das Modell unterstützt auch Ausgaben mit höherer Wiedergabetreue, die (meistens) eine genaue Objektplatzierung, eine detaillierte Textwiedergabe und komplexe Kompositionen ermöglichen. Wir werden sehen, ob wir das Wort „meistens“ aus diesem Satz entfernen können, nachdem das Produkt offiziell veröffentlicht wurde.

Außerdem: Ich habe Personal Intelligence ausprobiert und es war korrekt (aber beunruhigend)

Die KI unterstützt auch kleine Texte, UI-Elemente und stilistische Einschränkungen bei einer Auflösung von bis zu 2K. Cool.

Testen der Vorschau

Ich erhielt Zugang zu einer Vorschau am Tag vor der Veröffentlichung und das Modell ist im Großen und Ganzen beeindruckend. Ich habe ihm einen Screenshot der ZDNET-Homepage und einen Entwurf der Pressemitteilung von Images 2.0 zur Verfügung gestellt.

Dann wies ich an: „Generieren Sie auf der Grundlage des Inhalts der Pressemitteilung eine 16:9-Infografik über das neue Bildupdate und erstellen Sie sie unter Verwendung des ZDNET-Markenstils, wie im ZDNET-Homepage-Dokument gezeigt.“

Außerdem: Ich habe das neue KI-Verbesserungstool von Google Fotos ausprobiert: Wie es Ihre Aufnahmen zuschneidet, neu beleuchtet und korrigiert – manchmal

Das Modell hat bei der Infografik großartige Arbeit geleistet, aber so sehr es auch versuchte, es konnte das ZDNET-Logo nicht reproduzieren. Beim ersten Versuch stellte es das Z in ZDNET mit einer leichten Abweichung dar.

zdnet-logo1.png
Erstellt von ChatGPT/Screenshot von David Gewirtz/ZDNET

Ich habe verschiedene Anfragen ausprobiert, in der Reihenfolge: „Reparieren Sie das ZDNET-Logo. Das Z hängt in Ihrer Version herab, ist aber im eigentlichen Logo nicht herabhängend.“ Aber Images 2.0 hat es nie geschafft, das Problem zu beheben.

Also begann ich eine neue Sitzung. Dieses Mal habe ich die Anweisung eingefügt: „Seien Sie besonders vorsichtig, um das ZDNET-Logo genau wiederzugeben.“

Außerdem: Ich habe ChatGPT Plus vs. Gemini Pro getestet, um herauszufinden, welches besser ist – und ob sich ein Wechsel lohnt

Hier wurde es sehr seltsam. Bei seinem ersten Auftritt hat das Modell irgendwie eine Kopie des ZDNET-Logos aus der Zeit vor unserem Redesign im Jahr 2022 ausgegraben. Dieses Logo ist auf unserer aktuellen Homepage nirgends zu finden. Seltsamerweise wurde das alte Logo mit dem aktuellen Farbschema gerendert. Anschließend schob das Model das Logo und die Infografik-Informationen vom linken Bildrand weg. Außerdem wurde für „Images 2.0“ ein Hellblau gewählt, das keine ZDNET-Markenfarbe ist.

zdnet-logo2.png
Erstellt von ChatGPT/Screenshot von David Gewirtz/ZDNET

Ich habe mit aller Macht versucht, es davon zu überzeugen, das aktuelle Logo zu verwenden. Ich habe es geschafft, das Bild nach rechts zu verschieben, sodass nichts abgeschnitten wurde. Das Hinzufügen der Aufforderung „Verwenden Sie das ZDNET-Logo auf der bereitgestellten Seite. Suchen Sie nicht nach einem alternativen Logo“ hat jedoch nichts zur Lösung des Problems beigetragen.

Ich nahm die Herausforderung noch einmal an, bevor ich beschloss, diesen Artikel wieder zu Ende zu schreiben. Ich habe wieder einmal eine neue Sitzung gestartet, damit die KI kein Muskelgedächtnis von ihren vorherigen Fehleinschätzungen hat.

Außerdem: Diese leistungsstarke Gemini-Einstellung hat meine KI-Ergebnisse viel persönlicher und genauer gemacht

Das Model hat das Logo wieder vermasselt. Diesmal hat die KI beschlossen, dem Stiel des langgestreckten großen D eine Ruderform hinzuzufügen.

zdnet-logo3.png
Erstellt von ChatGPT/Screenshot von David Gewirtz/ZDNET

Fairerweise muss ich sagen, dass ich eine Vorabversion von Images 2.0 verwende. Ich melde mich nach der offiziellen Produktveröffentlichung mit einem viel ausführlicheren Testlauf des Modells zurück.

Ich habe auch einen ähnlichen Test mit einem anderen Dokument mit Googles Nano Banana Pro durchgeführt, aber da die Synthese nicht so durchgeführt wurde wie diese neue Version des OpenAI-Produkts, konnten die hier erzielten Ergebnisse nicht wirklich wiederholt werden. Wir werden mehr wissen, wenn wir fortgeschrittenere Tests durchführen

Preise und Verfügbarkeit

Das neue Modell steht ab sofort allen ChatGPT- und Codex-Benutzern zur Verfügung. Erweiterte Ausgaben und die Denkfähigkeit stehen ChatGPT Plus-, Pro-, Business- und Enterprise-Benutzern zur Verfügung. Wählen Sie unbedingt „Denken“ aus der ChatGPT-Dropdown-Leiste oben auf dem Bildschirm aus.

Zum Zeitpunkt des Verfassens dieses Artikels, vor der Veröffentlichung, ist das neue Images 2.0-Modell nur auf dem Desktop verfügbar. Aber OpenAI verspricht, dass diese Funktionen auch in der mobilen Version verfügbar sein werden, zusammen mit der Möglichkeit, Bilder mit dem Finger über den Touchscreen Ihres Mobilgeräts auszuwählen.

Die Bilder sind auch über die API unter Verwendung des gpt-image-2-Modells verfügbar. Die API-Preise variieren je nach Qualität, Denkvermögen (mein Wort) und gewünschter Bildauflösung.

Wenn eine KI Layout und Inhalt in Kombination verarbeiten kann, wird sich dadurch Ihre Herangehensweise an Designprojekte ändern? Lass es uns unten in den Kommentaren wissen.


Sie können meine täglichen Projektaktualisierungen in den sozialen Medien verfolgen. Abonnieren Sie unbedingt meinen wöchentlichen Update-Newsletter und folgen Sie mir auf Twitter/X unter @DavidGewirtzauf Facebook unter Facebook.com/DavidGewirtz, auf Instagram unter Instagram.com/DavidGewirtz, auf Bluesky unter @DavidGewirtz.com und auf YouTube unter YouTube.com/DavidGewirtzTV.



Quelle

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein