Ich habe mich in letzter Zeit mit der Schnittstelle zwischen lokaler KI-Inferenz und kreativer Generierung beschäftigt und wollte das Ganze über die üblichen Text- und Bildgrenzen hinaus erweitern – und das neueste Qwen 3.6 Modell die Arbeit machen lassen. Also habe ich beschlossen, ein Browserspiel zu bauen, das vollständig KI-generiert ist mit Qwen 3.6, und es dabei nicht zu sehr zu lenken. Das Modell sollte kreativ sein dürfen und ein Spiel für eine Zielgruppe rund um das Alter von 8 Jahren erstellen.

Hardware & Infrastruktur:

  • 2x RTX A6000 GPUs für parallele Inferenz und Token-Generierung
  • Ollama als Inferenz-Server (lokale LLM-Orchestrierung)
  • Qwen qwen3.6:35b-a3b-bf16 als generatives Modell
  • Hermes-Agents als Agent, der die Entwicklung steuert (sehr erfolgreich)

Dieses Setup bietet genug Power, um ein großes 35B-Parameter-Modell effizient laufen zu lassen und gleichzeitig eine vernünftige Latenz für die interaktive Spieleentwicklung beizubehalten.

Das Modell: Qwen 3.6:35b-a3b-bf16

Das Qwen 3.6 Modell in seiner 35B quantisierten Form (bf16) traf für dieses Projekt die richtige Balance:

  • Größe: Groß genug für kohärente, kreative Ausgaben
  • Geschwindigkeit: Quantisiert, um effizient auf zwei A6000s zu laufen
  • Qualität: Hervorragendes Befolgen von Anweisungen und kreative Generierung
Hermes-Agent - Jump and run game

Hermes-Agent – Jump and run game

Die wichtigste Erkenntnis: Lass dem Modell Raum zum Atmen

Folgendes habe ich durch Experimentieren herausgefunden: Lenke das Modell nicht zu sehr. Lass es kreativ sein.

Mein anfänglicher Ansatz war stark eingeschränkt – spezifische Regeln, exakte Spielmechaniken, starre Strukturen. Die Ergebnisse waren… vorhersehbar und flach.

Der Durchbruch kam, als ich zu offenem Prompting wechselte:

Anstelle von:

„Erstelle ein Spiel mit diesen exakten Regeln: 1) Bewegung mit den Pfeiltasten 2) Sammle Gegenstände 3) Weiche Gegnern aus“

Habe ich es dann so versucht:

„Entwirf ein unterhaltsames, fesselndes Browserspiel. Überlege, was es interessant und unterhaltsam für ein 8-jähriges Mädchen machen würde. Welche Mechaniken wären überraschend? Welche Visuals würden ins Auge stechen?“

Der Unterschied war frappierend. Als ich einen Schritt zurückgetreten bin und Qwen den Designraum erkunden ließ, generierte es innovativere Spielmechaniken, unerwartete Wendungen und kreative Lösungen, die ich nicht in Betracht gezogen hatte.

Die Lektion: Große Sprachmodelle sind leistungsstarke Ideenpartner. Sie folgen nicht nur Anweisungen – sie können eine kreative Vision beisteuern. Der Trick besteht darin zu wissen, wann man präskriptiv und wann man permissiv sein sollte.

Download:

Wenn du das kleine Spiel und die AGENT.md-Datei, die der Hermes-Agent generiert hat, herunterladen möchtest, dann klicke einfach auf den Link: Jump_and_run_game

Der Workflow

  1. Prompt Engineering (lokales Ollama + Qwen): Übergeordnetes Spielkonzept → Qwen generiert HTML und CSS / JavaScript, falls man danach fragt.
  2. Iteration: Output prüfen, Folgefragen stellen, verfeinern (gesprächsorientiert bleiben, nicht mechanisch)
  3. Testen: Spiel direkt im Browser ausführen, Probleme identifizieren
  4. Verfeinerungs-Loop: Das Modell Bugs beheben, Features ausbauen und die UX basierend auf Feedback verbessern lassen

Der gesamte Prozess fand lokal statt durch den Einsatz des Hermes-Agent – keine Cloud-API-Aufrufe, keine Rate Limits, volle Privatsphäre, weil ich Ollama als Inferenz-Server nutze.

Dieses Experiment wirft einige interessante Fragen auf, über die ich nachgedacht habe, nachdem ich eine Weile gespielt habe:

  • Zugänglichkeit: Wenn 35B-Modelle lokal auf erschwinglicher Hardware (zwei A6000s) laufen können, was wird dann für Indie-Entwickler möglich?
  • Iterationsgeschwindigkeit: Traditionelle Spieleentwicklungszyklen vs. KI-unterstützte Co-Kreation
  • Kreativität: Liefert geleitete Kreativität bessere Ergebnisse als eingeschränktes Design?
  • Skalierbarkeit: Was, wenn Tablets mit integrierten KI-Beschleunigern zur Entwicklungsplattform werden?

Die nächste Grenze

Die Infrastruktur für KI-unterstützte Spieleentwicklung ist bereits da. Die Modelle sind leistungsfähig. Die Hardware wird erschwinglicher. Was sich abzeichnet, ist ein neuer kreativer Workflow, in dem Menschen und KI als echte Partner zusammenarbeiten.

Es ging nicht darum, Game-Designer zu ersetzen. Es ging darum, die Ideenfindung zu beschleunigen und zu beweisen, dass lokale LLMs komplexe, strukturierte kreative Aufgaben bewältigen können – und nicht nur Text- oder Bildgenerierung.