Aus der Vektorkurve geflogen
Gibt es KI-Bildgeneratoren, die Vektoren statt Pixel liefern? Diese Frage tauchte Anfang Januar bei einer meiner KI-Schulungen auf, und sie ist mehr als berechtigt. Pixel sind die beste Wahl für fotorealistische Motive oder künstlerische Illustrationen.
Doch in vielen anderen Fällen wäre der geometrische Ansatz geeigneter. Denken wir an die Infografiken, an technische Illustrationen, an Diagramme oder Visualisierungen, wie wir sie mit Notebook LM und Gemini erstellen. Wenn die aus einzelnen Elementen aufgebaut wären, liessen sie sich leicht bearbeiten: Wir könnten die Anordnung anpassen, Seitenverhältnisse ändern und die Farbgebung verbessern. Vor allem gäbe es die Möglichkeit, die Texte zu bearbeiten. Gemini und Dall-e von OpenAI haben zwar zugelegt. Doch noch immer generieren sie bei visuellem Output Nonsens-Ausdrücke, seltsame Formulierungen oder Sprachverwirrungen. Und auch typisch ist die Pseudo-Typografie: seltsame Gebilde, die aussehen wie Buchstaben, aber zu keinem bekannten Alphabet gehören.
Nachforschungen ergaben, dass die Auswahl an Vektor-Bildgeneratoren derzeit gering ist. Adobe Firefly warb schon bei der Lancierung mit der Funktion Text to vector. Die würde ich gern testen, aber dafür braucht es Illustrator und ein Abo für 25.95 Franken im Monat. Nebenbei: Was zum Teufel, Adobe!? Eure Abo-Seite ist abschreckender als die Auslage dieses dänischen Restbeständeverwerters.
Eine Umgebung für die kreative Ideenfindung
Dank recraft.ai muss ich nicht unverrichteter Dinge abziehen. Das in London beheimatete Unternehmen richtet sich an Gestaltungsprofis. Das merken wir daran, dass der Prompt für die Bilderzeugung nicht für sich allein steht, sondern in eine simple Grafik-Anwendung eingebettet ist. Wir zeichnen von Hand Rahmen, arbeiten mit Pinsel und geometrischen Elementen wie Linien, Rechtecken, Kreisformen und Pfeilen und platzieren Textfelder oder Pixel. Das soll kein Grafikprogramm ersetzen, sondern einfachen Entwürfen (Mockups) den Weg bereiten.
In dieser Umgebung platzieren auch die KI-generierten Elemente. Beim Prompt-Feld erzeugen wir unsere Inhalte entweder manuell oder mithilfe eines agentischen Assistenten. Letzteres benötigt natürlich mehr Credits.
Unter Model stehen uns eine Reihe von generativen KI-Modellen zur Auswahl. Einige davon kommen uns bekannt vor (Nano Banana und Imagen von Google, GPT von OpenAI, Flux von Black Forest, sowie Ideogram, Hidream und Qwen – also auch einige Vertreter aus der Open-Source-Welt). Recraft selbst hat eigene Modelle im Angebot, und hier werden wir mit Recraft V2 Vector und Recraft V3 Vector fündig. Das alte Modell will einen Credit für eine Bilderzeugung, das neue zwei. Apropos: Als Nutzer ohne Abo erhalten wir 30 Credits pro Tag. Für 10 US-Dollar (Pro) gibt es 1000 Credits pro Monat und das Team-Abo kostet 55 Dollar und beinhaltet 9000 Credits.
Kurzer Einschub: Die erste Variante dieses Blogposts wurde von der Wirklichkeit überholt. Während der Beitrag auf Halde lag, lancierte der Hersteller die Version 4 seines Modells, das auch bei den Vektormöglichkeiten eine deutliche Verbesserung verspricht. Da es auch deutlich mehr Credits verschlingt, konnte ich nicht alle Prompts mit dem neuen Modell ergänzen. Beim vierten Beispiel habe ich das jedoch getan – es zeigt eine deutliche Verbesserung. Einschub Ende.
1) Die Chimäre
Wir können die Modelle selbst auswählen oder die Wahl der Software überlassen. Ich probiere mein Glück mit der Einstellung Auto mode und mit dem Prompt, den ich seit Anbeginn der KI-Bildgeneratoren für meine Tests nutze. Eine junge Frau mit Fuchsschwanz und Hasenohren.
Die KI generiert zwei Varianten. Ohne stilistische Vorgaben erhalte ich zwei Illustrationen im Kinderbuchstil. Ob man sie für ein reales Projekt verwenden würde, ist natürlich Geschmackssache. Auf den ersten Blick wirken die Grafiken charmant. Bei längerer Betrachtung erkennen wir sie nicht unbedingt als KI-generiert. Aber sie wirken generisch genug, um keine Konkurrenz zu einer echten Illustratorin oder einem realen Illustrator zu sein.
Die KI generiert zwei Varianten des Mädchens mit Hasenohren und Fuchsschwanz (Modell Recraft V3 Vector).Doch bei der Vektor-Vorgabe gibt sich Recraft keine Blösse: Die Grafiken lassen sich im SVG-Format exportieren, das sich problemlos in Affinity öffnen und bearbeiten lässt. Das Umfärben, Verschieben, Verändern und Entfernen von Bestandteilen der Grafik ist ein Klacks, und natürlich könnten wir auch Dinge hinzufügen.
Es zeigt sich allerdings auch, dass der Aufbau nicht über alle Zweifel erhaben ist. Ein Beispiel: Das blaue Kreissegment im Hintergrund des Fuchsmädchens ist aus fünf einzelnen Formen aufgebaut, die zwischen die Konturen der Figur im Vordergrund eingepasst wurden. Das ist natürlich Unfug. Wer nur den Hauch einer Ahnung von Vektoren hat, hätte ein einzelnes Kreissegment angelegt und hinter dem Mädchen platziert. Im Fall hier ist das kein wirkliches Problem. Doch generell erschweren solche Anfängerfehler die Bearbeitung, und sie machen die Grafik unnötig komplex.
Das Vektorbild in Affinity: Die Elemente lassen sich nachbearbeiten – aber statt eines Kreissegments finden sich mehrere isolierte Puzzleteile.Erfreulich allerdings: Die KI hat die Grafik genau in den Rahmen eingepasst, den ich vorab auf der Zeichenfläche deponierte. Beim Recraft-Prompt könnten wir alternativ bei Ratio das Seitenverhältnis angeben. Unter Count legen wir fest, wie viele Varianten erstellt werden sollen. Bei Image Colors wählen wir die Farbpalette, die die KI berücksichtigen soll. Und in den Settings geben wir an, ob im Bild Textelemente enthalten sein dürfen oder nicht (Avoid text in image).
2) Eine komplexe Infografik
So weit, so erfreulich. Aber wie gut ist das Resultat bei einer Aufgabe aus dem Bereich der Infografik? Um mit schwerem Geschütz einzusteigen, setze ich bei meinem Versuch von neulich an, mir eine erklärende Infografik zu einem komplexen Buch erzeugen zu lassen. Allerdings scheitert dieses Unterfangen schon vor dem Start: Der Prompt von Recraft nimmt nur 1000 Zeichen entgegen. Das ist zu kurz für alle Informationen, die in die Grafik gehören würden.
3) Eine einfache Infografik
Also, eine einfachere Aufgabe. Gemini lieferte mir für diesen Artikel ein visuelles Guetslirezept¹. Klappt das auch mit Recraft?
Die Antwort ist ein Jein. Das ganze Rezept lässt sich mit der Anweisung zwar auf unter 1000 Zeichen kürzen. Doch die KI ist dennoch überfordert.
Sie erfüllt die Anforderung zwar, sowohl Zutaten als auch Zubereitung zu visualisieren, doch bei den Details hapert es gewaltig: Statt drei Eiweiss sehen wir zwei ganze Eier und die Mandeln sind eindeutig nicht gemahlen. Der Text erscheint wie gefordert in Deutsch, doch die längeren Textblöcke erhalten viele Fehler und seltsame Glyphen-Unfälle:
Auf den ersten Blick wirkt das Rezept gelungen, doch Mängel zeigen sich bei den Details (Recraft-Modell Version 4).Das ist das Resultat der neuen Version des Vektormodells. Zum Vergleich hier die ursprüngliche Variante, die noch mit dem Vorgänger entstand. Sie zeigt einen deutlichen Fortschritt:
Vom Rezept bleibt nur die Liste mit den Zutaten übrig (Recraft-Modell Version 3).Beim ersten Versuch erscheint der Text auf Englisch und nur die Liste mit den Zutaten wurde visualisiert.
Das grössere Problem besteht bei beiden Ausführungen: Die schriftlichen Angaben sind nicht als bearbeitbare Textrahmen in der SVG-Grafik enthalten. Sie bestehen aus Vektorkurven, wobei teilweise sogar einzelne Buchstaben aus mehreren Elementen zusammengebaut wurden. Die wirken in einer hohen Zoomstufe unbeholfen und kantig.
Die Vermutung liegt nahe, dass die Textelemente als Pixel generiert und vektorisiert wurden. Das deutet darauf hin, dass die künstliche Intelligenz diese Vektorgrafiken nicht systematisch aufbaut, wie es ein menschlicher Illustrator tun würde. Stattdessen bildet sie das Erscheinungsbild nach, so gut es halt geht. Das heisst: Optisch können die Grafiken in Ordnung sein – strukturell haben sie Defizite.
Der Text besteht aus schlecht vektorisierten Buchstaben.Im vorliegenden Fall müssten die Textelemente gelöscht und manuell neu aufgebaut werden. Das wäre zwar ein Zusatzaufwand; ein gewisses Rationalisierungspotenzial besteht dennoch.
Zum Vergleich: Diese Rezeptdarstellung stammt von Gemini. Als Pixelbild lässt sie sich mit vernünftigem Aufwand nicht nachbearbeiten.4) Illustration fürs Schulbuch
Letzter Versuch: Eine Illustration fürs Schulbuch. Die Ausgangslage ist eine Tabelle, in der fünf Tiere (Elefant, Giraffe, Hauskatze, Nashorn und Grizzlybär) mit Gewicht und Körperhöhe aufgeführt sind. Eine Spalte mit Emojis zeigt die Gefährlichkeit für den Menschen.
Das neue Modell Version 4 ist ein deutlicher Fortschritt: Diese Illustration ist zwar weit entfernt von Perfektion, aber im Vergleich zum Vorgängermodell (siehe unten) ein grosser Fortschritt.Die KI sollte daraus eine Visualisierung erstellen und Diagramme für die jeweiligen Werte hinzufügen. Formale Vorgabe: «Gestalte es modern, verspielt, aber dennoch seriös genug für den Bildungsbereich, und achte darauf, dass der Text auf Deutsch bleibt.»
Wie man sieht, würden wir dieses Resultat niemals eins zu eins verwenden wollen, dafür stimmen zu viele Details nicht. Wir stellen etwa fest, dass die Höhe durch einen vertikalen Massstab symbolisiert wird. Und die Hauskatze ist mit 400 Kilogramm deutlich übergewichtig. Aber die Sprachvorgabe wurde berücksichtigt und als Rohfassung könnte diese Illustration nützliche Dienste erweisen.
Zum Vergleich: Das Resultat der Version 3 überzeugt deutlich weniger: Die Vorgabe zur Sprache wird ignoriert, die Diagramme fehlen. Die Giraffe wird mit den Werten des Elefanten angeschrieben und der Grizzlybär erscheint als Label, aber nicht als Bild und ohne Daten. Auf der zweiten Grafik taucht ein gelber Kopffüssler auf, der mit keinem der Tiere korrespondiert, die in der Liste erscheinen.
Die Tiere und Masseinheiten auseinanderzuhalten, entpuppt sich als zu hohe Hürde (Recraft V3 Vector).Fazit
Fazit: Als Ersatz für Cliparts ab Stange taugt Recraft auf alle Fälle: Die legendären Corel-CDs mit Sammlungen von Hunderttausenden Stock-Motiven in Vektorform sind hiermit – so sehr mich das auch schmerzt – Geschichte. Die so generierten Motive sind individueller als die vorgestanzten Kreationen. Durch geschicktes Prompten, klare Stilvorgaben und eine gezielte Nachbearbeitung lässt sich auch der Eindruck der Belanglosigkeit, der den KI-Werken anhaftet, verringern oder beseitigen.
Den Ansprüchen von Infografiken und Datenvisualisierungen ist die Technik im Moment nicht gewachsen. In ganz simplen Fällen kann sie den Initialaufwand verringern oder uns als Inspiration dienen. Aber für vorzeigbare Resultate kommen wir nicht darum herum, selbst Hand anzulegen.
Fussnoten
1) Bei Google machte ich es mir maximal einfach und schrieb nicht einmal das Rezept selbst auf. Das war der Prompt:
Hier ein Rezept für Zimtsterne. Kannst du mir daraus eine schöne Infografik machen, in der nicht nur die Zutaten visualisiert sind, sondern auch die einzelnen Arbeitsschritte? Das Resultat soll ansprechend wirken, wie in einem feinsäuberlich gestalteten Rezeptbuch. ↩
Beitragsbild: Um die Vektorkurven richtig zu nehmen, braucht es Erfahrung als Mauslenker in der Grafik-Anwendung (Jesse Bowser, Unsplash-Lizenz).
#Adobe #Datenvisualisierung #KI #Longread #Publisher #VideoBildgenerator
















