Ein Experiment im Rekreieren von Objekten durch Prompts.
Ein kleines Spiel. Welche Katze ist echt, welche nicht? Ist eines dieser Bilder ein echtes Foto? Sind alle Bilder echt? Keines? Der Sinn dieses Experiments liegt in der Frage: Kann ich ein Objekt, in diesem Fall eine Katze, mit einem Prompt möglichst ähnlich neu erschaffen?
Zuerst die Auflösung. Das ist meine Katze.
Und nun die Analyse von ChatGPT. Der Prompt lautete: „Analysiere dieses Bild und beschreibe die Katze darauf möglichst genau. Ich möchte die Beschreibung für einen Prompt zur Bildgenerierung nützen.“
Auf dem Bild ist eine entspannt aussehende, ausgestreckte Katze zu sehen. Die Katze scheint auf dem Rücken zu liegen, mit nach oben gerichteten Pfoten, was eine sehr entspannte und zufriedene Haltung ausdrückt. Ihr Bauch ist aufgebläht und flauschig, hauptsächlich in einem hellen Cremefarben mit einigen braunen Flecken. Die Vorder- und Hinterpfoten sind nach oben gestreckt, und die Hinterpfoten sind so ausgerichtet, dass die Sohlen sichtbar sind. Ihr Kopf ist zur Seite gedreht, sodass man ihr Gesicht sehen kann, das friedlich und zufrieden aussieht. Das Gesicht ist hauptsächlich braun mit weißen Markierungen, die sich über die Nase erstrecken und die Mundregion umgeben. Ihre Augen sind geschlossen, was dazu beiträgt, den Eindruck von Ruhe und Gelassenheit zu verstärken. Die Katze liegt auf einer hellen, möglicherweise weißen Decke mit einer erkennbaren Textur, die floral oder ornamental sein könnte. Der Hintergrund besteht aus einem dunklen Stuhl oder Sofa, das einen Kontrast zum helleren Vordergrund bietet, wo die Katze liegt. Diese Beschreibung könnte für einen Bildgenerierungsprompt verwendet werden, um eine ähnliche Szene zu erschaffen.
Nun wird diese Analyse vom Midjourney Prompt Generator V6 umgewandelt. Das Ergebnis:
A photographic style image capturing a serene cat, comfortably sprawled on its back, showcasing a fluffy, cream-colored belly with brown patches. Paws are playfully stretched upwards, revealing the paw pads. The cat’s face, adorned with brown and white, exhibits a tranquil, satisfied look, with eyes gently closed. It is resting on a black leather couch with a white slightly patterned blanket. A contrasting dark, luxurious sofa forms the background, highlighting the cat’s peaceful demeanor. Created Using: sharp focus, high contrast, detailed texture, calming colors, gentle shadows, photographic realism, soft lighting, tranquil composition –v 6.0
Das Ergebnis: Es ist nicht meine Katze, aber es könnte ihr Bruder sein, wobei die Ähnlichkeiten in der Fellzeichnung erstaunlich sind. Interessant sind aber auch die immer noch auftauchenden Fehler.
Bild 1 und Bild 3 weisen Fehler bei dem Pfoten auf. Bei Bild 2 fehlt der Katze der Schwanz. Hinsichtlich Texturen, Licht und Fell sind die Bilder jedoch täuschend echt.
Auch die Struktur des Prompts ist interessant: Fast ein Drittel davon wird für die Beschreibung des Hintergrunds verwendet.
It is resting on a black leather couch with a white slightly patterned blanket. A contrasting dark, luxurious sofa forms the background, highlighting the cat’s peaceful demeanor.
Das hier ist die eigentliche Beschreibung der Katze, das eigentliche Motiv. Der Generator wendet hierbei etwa 40% des Prompts auf:
A photographic style image capturing a serene cat, comfortably sprawled on its back, showcasing a fluffy, cream-colored belly with brown patches. Paws are playfully stretched upwards, revealing the paw pads. The cat’s face, adorned with brown and white, exhibits a tranquil, satisfied look, with eyes gently closed.
Und hier genaue Anweisungen zur Technik, etwa 20%:
Created Using: sharp focus, high contrast, detailed texture, calming colors, gentle shadows, photographic realism, soft lighting, tranquil composition –v 6.0
Zum Vergleich: die direkte Übersetzung der Bildbeschreibung mit einer technischen Ergänzung am Ende aus dem generierten Prompt.
In the image, there is a relaxed-looking, stretched-out cat. The cat seems to be lying on its back with its paws pointing upwards, which expresses a very relaxed and content posture. Its belly is puffed and fluffy, mainly in a light cream color with some brown spots. The front and back paws are stretched upwards, and the hind paws are aligned so that the soles are visible. Its head is turned to the side, allowing a view of its face, which looks peaceful and satisfied. The face is primarily brown with white markings extending across the nose and surrounding the mouth area. Her eyes are closed, which adds to the impression of tranquility and serenity. The cat is lying on a light, possibly white blanket with a noticeable texture that could be floral or ornamental. The background consists of a dark chair or couch, providing a contrast to the brighter foreground where the cat is lying. Using: sharp focus, high contrast, detailed texture, calming colors, gentle shadows, photographic realism, soft lighting, tranquil composition –v 6.0
Zusammenfassend lässt sich sagen, dass es durchaus möglich ist, hohe Ähnlichkeitswerte zu erzielen. Wichtig ist dabei das mehrstufige Verfahren: zuerst die Analyse, dann die Umformung in einen Prompt. Eine exakte Kopie darf man jedoch nicht erwarten; jedes Bild ist eine Neuschöpfung, wobei gilt: Je präziser der Prompt, desto besser das Ergebnis.