Asteroids! Grok vs. ChatGPT: Wer liefert brauchbare Ergebnisse?

asteroids

Der Spielhallenklassiker Asteroids

Als Blogger interessiere ich mich für spannende Experimente mit Künstlicher Intelligenz, nicht für technische Details oder Programmierlogik. In diesem Test wollte ich herausfinden, ob moderne KI-Modelle wie Grok von xAI und ChatGPT von OpenAI tatsächlich ein spielbares Asteroids-Spiel erstellen können.

Asteroids ist ein Spiel, bei dem man ein kleines Raumschiff steuert und Asteroiden zerstören muss, bevor sie das Schiff treffen Ich wollte wissen, ob eine KI in der Lage ist, dieses einfache Spiel zu erstellen – ohne dass ich als Nicht-Programmierer eingreifen muss.

Ich habe beiden Sprachmodellen denselben Befehl gegeben:


Erstelle ein Spiel wie Asteroids in HTML, Javascript und CSS. Man bewegt das Raumschiff mit den Pfeiltasten und feuert mit der Leertaste. Mach es ähnlich wie das Original und zähle die Punkte. Wenn man dreimal von einem Asteroiden getroffen wurde, ist das Spiel vorbei. Es gibt Asteroiden in drei Größen. Wenn man einen großen trifft, zählt das 10 Punkte – dieser zerfällt in zwei mittlere. Von einem mittleren Asteroiden erhält man 20 Punkte, von einem kleinen 30. Wenn alle Asteroiden weg sind, startet ein neues Level. In unregelmäßigen Abständen kommt ein Raumschiff, das dich angreift. Wenn du getroffen wirst, verlierst du ein Leben. Wenn du es abschießt, bekommst du 100 Punkte.

Das Ergebnis war eindeutig – Grok scheiterte, ChatGPT lieferte.

Grok: Große Versprechen, schwache Ergebnisse

Elon Musk und seine Fans bewerben Grok als bessere Alternative zu ChatGPT. Als ich Grok mit einer Aufgabe betraute, wurde klar: Die KI kann zwar Code generieren, aber das Ergebnis war unbrauchbar .Das Spiel ließ sich nicht spielen, weil es nicht wie erwartet funktioniert. Als Laie kann ich das Ergebnis nicht verbessern.

Versuche Asteroids in der „Grok-Version“

Wenn einen das Raumschiff (gelb) trifft, dann hängt sich das Spiel auf. Ganz toll Elon!

ChatGPT: Funktionierendes Spiel ohne Probleme

Im direkten Vergleich ist ChatGPT zuverlässiger. Das Spiel ließ sich sofort spielen, ich musste nichts anpassen oder Fehler korrigieren. Das Raumschiff ließ sich steuern, die Asteroiden bewegten sich realistisch und es gab eine Spielmechanik. Das ist genau das, was ich wollte: eine KI, die mir als Nicht-Programmierer ein funktionierendes Produkt liefert, ohne dass ich mich mit Code auseinandersetzen muss.

Spiele Asteroids in der „ChatGPT-Version“

ChatGPT liefert, Grok nicht

Das Experiment hat mir als Blogger gezeigt, dass große Versprechungen nicht immer der Realität entsprechen. Grok wird von seinen Anhängern gefeiert, aber mein Test zeigte, dass ChatGPT die Aufgabe besser erfüllt.

Für mich zählt das Ergebnis – nicht, wie die KI den Code strukturiert oder welche technischen Hintergründe es gibt. Wenn eine KI ein Spiel erstellen soll, möchte ich es einfach starten und spielen können. ChatGPT liefert Ergebnisse, Grok nicht. Wer eine KI sucht, die wirklich etwas schafft, sollte sich nicht von Werbung oder den „Elon-Bots“ blenden lassen. Mein Test zeigt: Bei echten Ergebnissen liegt ChatGPT vorne.

Das Marketinggenie Musk – viel Hype, wenig Nutzen für den Anwender

Elon Musk ist ein Marketinggenie. Er hat Visionen, die oft als revolutionär dargestellt werden. Aber oft funktionieren sie nicht für den normalen Nutzer. Musk erzeugt Hypes und stellt seine Produkte als unersetzlich dar. Das sieht man bei Grok, das als Konkurrenz zu ChatGPT vermarktet wird. In den sozialen Medien, besonders auf X, wird Grok von Musk und seinen Anhängern als überlegene KI dargestellt. Die Realität sieht aber anders aus: Grok mag in der Theorie interessant sein, aber es liefert in diesem Fall keine brauchbaren Ergebnisse.

Für mich zählt, ob ein Produkt hält, was es verspricht. Hier zeigt sich der Unterschied zwischen Marketing und Realität. Musks Brillanz als Geschäftsmann hilft mir wenig, wenn ich eine unzuverlässige KI nutze. Wer sich von Versprechungen blenden lässt, könnte enttäuscht sein.

Ebenso greift Musk in die Ergebnisse von Grok ein. In den letzten Tagen Machte eine Frage auf X die Runde: „Wer ist der größte Verbreiter von Falschnachrichten auf X?“ war die Frage an Grok. Die KI spuckte „Elon Musk“ (manchmal auch „Donald Trump“ – je nach Fragestellung) aus. Musk ließ das korrigieren, wie ein von mir angefertigter Screenshot zeigt. Wenn man die Funktion „Think“ anwählt, zeigt einem Grok nämlich, welche „Gedankengänge“ die „KI“ macht, um zum Ergebnis zu kommen:

Musk | DIGITALHANDWERK

Das ist keine KI, das ist maximal „EI – Elon Intelligence“…

War der Beitrag für dich hilfreich?

Klick bitte auf die Sterne zur Bewertung.

Durchschnittliche Bewertung: 5 / 5. Anzahl der Bewertungen: 1

Bislang keine Bewertungen

Hinterlasse einen Kommentar