- Einige große Akteure haben diese Woche bedeutende Fortschritte bei KI-generierten Bildern gemacht. Midjourney hat einen neuen Web-Editor veröffentlicht, der mehrere Bildbearbeitungswerkzeuge in einer einzigen Benutzeroberfläche vereint. Elon Musks xAI-Startup hat Grok-2 angekündigt, dessen undefinierte Richtlinien rund um geistiges Eigentum kontrovers diskutiert werden. Google hat das neue Modell Imagen 3 vorgestellt, das als sein hochwertigstes Text-zu-Bild-Modell bezeichnet wird. Interessierte müssen sich für Imagen 3 auf die Warteliste der AI Test Kitchen im Rahmen von ImageFX setzen.
Seit einiger Zeit leben wir mit von KI-generierten Bildern, doch diese Woche haben einige der großen Akteure bedeutende Fortschritte gemacht. Insbesondere sprechen wir von wichtigen Updates bei Midjourney, Googles neuem Modell und Elon Musks Grok-2. Jede Firma zeigt dabei, wie die Technologie sich in unterschiedlichen Geschwindigkeiten und Richtungen entwickelt. Das Spielfeld ist noch weit offen, und jede Demonstration hebt hervor, wie weit die Fortschritte bereits sind.
Fortschritt bei Midjourney
Midjourney hat still und heimlich einen neuen Web-Editor veröffentlicht, der mehrere nützliche Bildbearbeitungswerkzeuge in einer einzigen Benutzeroberfläche vereint. Bisher erforderten Funktionen wie das Neurahmen, Neuanstreichen (Hinzufügen oder Modifizieren von KI-generierten Inhalten in ein bestehendes Bild), Schwenken, Erweiterung der Leinwand und Zoomen jeweils ein eigenes Werkzeug und waren über mehrere Menüs verteilt. Der neue Editor bietet einen kohärenteren und gestraffteren Bearbeitungsprozess, eine deutliche Abweichung von den Anfängen des Programms auf Discord.
Diese neue Benutzeroberfläche soll das Bearbeiten von KI-generierten Bildern einfacher und nahtloser gestalten. Midjourney bewegt sich weiterhin von Discord weg hin zu einer webbasierten Anwendung, aber die Firma kündigte auch an, Nachrichten aus populären Kanälen wie “daily-theme”, “prompt-craft” und “general-1” zwischen ihren Web-Räumen und den Discord-Kanälen zu spiegeln. So können Nutzer die Threads von der bevorzugten Plattform aus verfolgen. Auch wurde ein neues Auswahlwerkzeug eingeführt, das wie ein digitaler Pinsel funktioniert und sowohl das quadratische Auswahlwerkzeug als auch das Lasso-Werkzeug ersetzt.
Der neue Editor steht allen Midjourney-Nutzern zur Verfügung, die bereits mehr als zehn Bilder auf der Plattform generiert haben. Erste Reaktionen aus der Kreativgemeinschaft waren überwiegend positiv.
Grok-2: Ein Ungeheuer wird entfesselt
Nur zwei Tage später folgte eine Ankündigung von Elon Musks xAI-Startup zur Bildgenerierung mit Grok-2. Groks Bildgenerierungsfähigkeiten werden von dem Flux.1-Modell des Black Forrest Lab angetrieben, das dank seiner beeindruckenden Bildqualität schnell an Beliebtheit gewinnt. Besonders kontrovers an Grok-2 ist nicht nur seine Qualität, die gut ist, sondern die weitgehend undefinierten Richtlinien rund um geistiges Eigentum, Gewalt und expliziten Inhalt. Diese scheinbare Nachlässigkeit scheint absichtlich zu sein, was Musk als “die spaßigste KI der Welt” beschreibt.
Menschen haben bereits die Grenzen von Grok-2 getestet und allerlei bizarre und erschreckende Bilder erzeugt, was an die frühen Tage der KI-Bilderstellung erinnert. Wenn man Musks Rhetorik glauben schenkt, könnten die fehlenden Richtlinien von Grok-2 den zukünftigen Verlauf dieser Technologie prägen.
Google wird wettbewerbsfähig mit Imagen 3
Zu guter Letzt verkündete Google ein neues Modell namens Imagen 3. Google bezeichnet es als sein “hochwertigstes Text-zu-Bild-Modell”, das nun “bessere Details, reichere Beleuchtung und weniger störende Artefakte” als seine Vorgängermodelle aufweist. Imagen 3 ist auch besser im Rendern von Texten und wird in verschiedenen Versionen angeboten, die je nach Aufgabe angepasst werden können – von einer schnellen Skizze bis hin zu sehr detaillierten und hochauflösenden Bildern.
Aktuell ist Imagen 3 nur über Googles AI Test Kitchen im Rahmen von ImageFX verfügbar, das sich derzeit in der Closed-Beta-Phase befindet. Interessierte müssen sich auf die Warteliste setzen, wenn sie noch keine Teilnehmer sind.