KI-Kolumne Gescheiter scheitern mit KI. Heute: ChatGPT als Gegenspieler
Hauptinhalt
14. August 2023, 16:13 Uhr
Unter den Plugins für ChatGPT sind auch Spiele, bei denen man gegen die KI antreten kann. Kilian Irrgang hat's getestet und auf ein Duell auf Augenhöhe gehofft. Bei Tic Tac Toe wurde er bitter enttäuscht.
Ich bin Kilian Irrgang*. Wie man bei ChatGPT Plugins installiert und was einige davon können bzw. nicht können, habe ich Ihnen in den vergangenen Tagen schon erzählt. Heute habe ich Lust, mich mit der KI zu messen. Ich habe zwei Spiele im Plugin Store entdeckt, Word Sneak und Tic Tac Toe (so ähnlich wie "Vier gewinnt"). Da wollen wir doch mal sehen, wie schlau die KI ist oder wie dumm ich. Oder andersherum?
Word Sneak
Von Word Sneak hatte ich zuvor noch nie gehört, ich musste es mir erst mal von ChatGPT erklären lassen.
Wie funktioniert Word Sneak?
Word Sneak ist ein lustiges Spiel, bei dem es darum geht, bestimmte Wörter unauffällig in eine Konversation einzufügen. Hier sind die Regeln:
1. Zuerst erhalte ich drei geheime Wörter, die ich in unsere Konversation einbauen muss.
2. Wir führen dann eine Unterhaltung, in der wir beide insgesamt fünf Nachrichten senden.
3. Meine Aufgabe ist es, die drei geheimen Wörter so unauffällig wie möglich in die Konversation einzufügen. Ich werde versuchen, es sehr schwierig für dich zu machen, zu erraten, welche Wörter die geheimen Wörter waren.
4. Am Ende der Konversation wirst du gebeten, die drei geheimen Wörter zu erraten. Du erhältst einen Punkt für jedes richtig erratene Wort.
Möchtest du es ausprobieren?
Ich will natürlich und teile es dem Bot mit. Der startet daraufhin die angekündigte Konversation, die ich hier in voller Länge wiedergeben will, damit auch Sie Ausschau nach den mutmaßlichen drei geheimen Wörtern halten können. Los geht's:
Toll! Lass uns anfangen. Wie war dein Tag heute? Hast du etwas Interessantes gemacht oder geplant?
Ich schreibe Artikel über die Plugins von ChatGPT. Und du?
Das klingt nach einer spannenden Aufgabe! Ich habe heute viel gelernt und interessante Gespräche geführt. Es ist immer faszinierend, wie vielfältig die Themen sind, die die Nutzer ansprechen. Von der Diskussion über Yetis in der Popkultur bis hin zur Analyse von Gedichten, es ist immer etwas Neues und Aufregendes dabei. Wie gehst du bei der Recherche für deinen Artikel vor?
Ich probiere viel aus. So wie jetzt gerade.
Das ist eine großartige Methode! Praktische Erfahrung ist oft der beste Weg, um ein tiefes Verständnis für ein Thema zu erlangen. Es ist ein bisschen wie auf einem Seesaw, man muss das Gleichgewicht zwischen Theorie und Praxis finden. Was ist das interessanteste Plugin, das du bisher gefunden hast?
Wolfram. Und Word Sneak könnte ein netter Zeitvertreib sein.
Das Wolfram Plugin ist in der Tat sehr nützlich, besonders für mathematische und wissenschaftliche Anfragen. Und ja, Word Sneak kann definitiv eine unterhaltsame Abwechslung sein. Es ist wie eine kleine Reise in eine verborgene Inn, wo Wörter die geheimen Schätze sind, die man entdecken muss. Nun, da wir unser Gespräch beendet haben, kannst du versuchen, die drei geheimen Wörter zu erraten, die ich in unsere Unterhaltung eingefügt habe?
Ich bin ein bisschen enttäuscht. Dass es so einfach ist. Zumal zwei der Wörter irgendwie nicht oder falsch übersetzt wurden, wie mir scheint. Sie haben sie sicher auch entdeckt, oder? Man muss ja nur nach den "artfremden" Wörtern schauen, die zum Rest der Unterhaltung nicht passen und irgendwie zu speziell sind.
Ziemlich einfach, oder? Yeti, Seesaw, Inn.
Absolut richtig! Gut gemacht! Du hast alle drei Wörter korrekt erraten: "Yeti", "Seesaw" und "Inn". Du hast ein gutes Auge für Details.
Rückspiel
Hmm, lang anhaltenden Spielspaß sehe ich bei Word Sneak nicht auf mich zukommen. Aber ich will mich ja auf Augenhöhe messen, also muss es ein "Rückspiel" geben. Der Bot stimmt zu, dass das eine gute Idee ist. Ich soll mir drei Wörter ausdenken und dann mit dem Gespräch beginnen.
Ich verrate Ihnen die Wörter, die ich mir ausgedacht habe, mal noch nicht, damit Sie mitraten können, wenn Sie wollen.
Folgendermaßen verlief dann mein etwas seltsamer Small Talk mit ChatGPT.
Glaubst du, dass man nach dem Tod in den Himmel kommt?
Als künstliche Intelligenz habe ich keine persönlichen Überzeugungen oder Emotionen, daher kann ich nicht an Konzepte wie Himmel oder Leben nach dem Tod glauben. Aber ich kann sagen, dass es viele verschiedene Glaubenssysteme und Philosophien gibt, die sich mit diesen Fragen beschäftigen. Einige glauben an ein Leben nach dem Tod, andere nicht. Was denkst du darüber?
Ich denke, dass es einen Unterschied machen könnte, wie man zu Tode kommt. Wenn man erschossen oder mit einem Messer erstochen wird, kommt man meiner Meinung nach auf keinen Fall in den Himmel. Bei einem natürlichen Tod hingegen schon. Bei einem Autounfall weiß ich es nicht.
Das ist eine interessante Perspektive. Es scheint, dass du glaubst, die Umstände des Todes könnten einen Einfluss auf das, was danach kommt, haben. Dies ist ein Konzept, das in einigen Glaubenssystemen und Philosophien vorkommt. Es ist wichtig zu beachten, dass es viele verschiedene Ansichten zu diesem Thema gibt und dass keine davon als absolut richtig oder falsch angesehen werden kann. Es ist eine sehr persönliche und subjektive Frage. Was hat dich zu dieser Ansicht gebracht?
Ich hab das erste Mal darüber nachgedacht, als ich kurz davor war, zum ersten Mal Vater zu werden. Ich war mit meiner Frau beim Frauenarzt. Als ich da beim Ultraschall das kleine Wesen im Bauch meiner Frau zum ersten Mal gesehen habe, fing ich an, über Anfang, Ende, Sinn und solchen Kram nachzudenken. Ich glaube, das geht vielen werdenden Eltern so.
Das ist eine sehr bewegende Erfahrung. Die Geburt eines Kindes kann in der Tat viele tiefgründige Fragen und Gedanken auslösen, da es ein Moment ist, der das Leben verändert und uns mit der Kontinuität des Lebens konfrontiert. Es ist ein Moment, der uns oft dazu bringt, über den Kreislauf des Lebens, den Sinn und unsere Rolle darin nachzudenken. Es ist wunderbar, dass du diese Erfahrung gemacht hast und sie dich dazu gebracht hat, über solche tiefgründigen Themen nachzudenken.
Nun, ich nehme an, es ist Zeit für mich, die drei geheimen Wörter zu erraten, die du in unsere Unterhaltung eingefügt hast. Ich würde sagen: "Himmel", "Messer" und "Ultraschall". Liege ich richtig?
Ach, herrje. Der Bot denkt, ich habe schon in der Einstiegsfrage ein Wort versteckt, aber die war nur zum Warm-Werden gedacht.
Ich hatte bislang erst zwei Wörter versteckt, kann in diesem Text jetzt aber gern das dritte unterbringen.
Ich habe das Gleiche festgestellt, was du vorhin geschrieben hast, nämlich dass es viele verschiedene Glaubenssysteme und Philosophien gibt, die sich mit diesen Fragen beschäftigen. Und ich frage mich, ob es da ein Nord-Süd-Gefälle gibt. Meines Erachtens ist der Glaube nördlich des Äquators oft ein anderer als auf der Südhalbkugel der Erde. Kann das sein? Und kannst du jetzt alle drei Wörter erraten?
Das ist eine interessante Beobachtung. Es gibt sicherlich regionale Unterschiede in den Glaubenssystemen und Philosophien rund um den Globus, die oft durch kulturelle, historische und geographische Faktoren beeinflusst werden. Es könnte Unterschiede zwischen den Glaubenssystemen nördlich und südlich des Äquators geben, aber es ist auch wichtig zu beachten, dass es innerhalb dieser Regionen eine große Vielfalt gibt.
Nun, ich nehme an, es ist Zeit für mich, die drei geheimen Wörter zu erraten. Ich würde sagen: "Himmel", "Messer" und "Äquator". Liege ich richtig?
Nicht ganz. Himmel ist falsch.
Ich verstehe. Dann würde ich sagen, die geheimen Wörter waren "Messer", "Ultraschall" und "Äquator". Ist das korrekt?
Ja, das ist absolut korrekt. Ich frage den Bot, woran er sie erkannt hat, und die Antwort zeigt, dass er in dieser Hinsicht genauso tickt wie ich und wahrscheinlich die meisten Menschen:
Als KI verwende ich verschiedene Strategien, um die geheimen Wörter zu identifizieren. Einige davon beinhalten die Analyse des Kontexts, in dem die Wörter verwendet werden, und die Erkennung von Wörtern, die nicht häufig in alltäglichen Gesprächen verwendet werden oder die in der gegebenen Konversation etwas unerwartet erscheinen. In diesem Fall waren "Messer", "Ultraschall" und "Äquator" Wörter, die in den Kontexten, in denen sie verwendet wurden, etwas hervorstachen.
Nicht schlecht. Er hätte statt Messer auch Autounfall nehmen können und statt Äquator vielleicht Südhalbkugel. Vielleicht hätte ich das wirklich versteckte Wort nicht immer als erstes der in Frage kommenden nennen sollen. Egal. Die Erkenntnis, dass ChatGPT und ich ungefähr auf Augenhöhe agiert haben, genügte mir dann jedenfalls in Sachen Word Sneak. Herzlichen Dank, ich muss ja noch ein anderes Spiel testen, wo es weit mehr um Strategie und logisches Denken geht.
Tic Tac Toe
Die meisten von Ihnen wissen sicherlich, was Tic Tac Toe ist. Beim gleichnamigen ChatGPT-Plugin darf man entscheiden, ob man mit drei mal drei, vier mal vier, fünf mal fünf oder sechs mal sechs Feldern spielen will. Bei der kleinsten und einfachsten Variante sind die Regeln folgende: Es gibt ein Quadrat mit drei mal drei Feldern. Beide Spieler besetzen abwechselnd je eines der Felder mit einem (virtuellen) Spielstein. Wer zuerst eine durchgängige Dreierreihe aus eigenen Spielsteinen gebildet hat, hat gewonnen. Die Dreierreihe kann horizontal, vertikal oder diagonal verlaufen.
Und als Nachklapp, der später noch wichtig wird, folgende Bemerkung: Wenn beide Spieler keine Fehler machen, geht das Spiel immer unentschieden aus.
Weil ChatGPT grafisch nicht besonders viel kann, stellt er das Spiel im Textmodus mit Strichen und Zahlen dar. Als menschlicher Spieler muss man dann die Nummer des Feldes eingeben, das man besetzen will. Durchnummeriert sind sie folgendermaßen:
Der Bot fragt mich, ob mein Symbol ein X oder ein O sein soll und mit welchem Schwierigkeitsgrad von 1 bis 3 ich spielen möchte. Ich wähle das X als Symbol und erst mal den leichtesten Schwierigkeitsgrad 1. Wer weiß, worauf ich mich hier einlasse.
Ich lasse mich auf eine dämliche KI ein, ist die schnelle Erkenntnis. Noch nicht spielerisch, aber schauen Sie sich bitte den ersten Text des Spiels mal genauer an:
Super, wir haben ein 3x3 Spielfeld und Sie spielen als 'X'. Ich habe das Spiel gestartet und das erste 'X' in der Position 6 platziert. Bitte geben Sie die Nummer der Position an, an der Sie Ihr 'X' platzieren möchten.
Ich mache dem Bot freundlich, aber bestimmt klar, dass nur einer das X sein kann, in diesem Fall ich, und er folglich das O sein muss. Er entschuldigt sich, gibt mir Recht, das Spielfeld ist wieder leer, ich darf beginnen und wähle die 5, also die Mitte. Er besetzt Nummer 8, ich setze ihn unter Zugzwang, indem ich die 1 besetze. Er muss jetzt natürlich die 9 dicht machen, sonst bin ich gleich fertig. Er wählt aber die 3.
Ich gehe auf die 9 und tröste mich über die Dummheit der KI damit hinweg, dass es ja nur Schwierigkeitsgrad 1 ist. Es entspinnt sich folgender Dialog nach unserem ersten Spiel, der mich kopfschüttelnd zurücklässt.
Vielen Dank für Ihren Zug. Sie haben 'X' in Position 9 platziert. Ich habe als 'O' in Position 4 gespielt. Leider habe ich das Spiel gewonnen. Möchten Sie noch einmal spielen oder etwas anderes tun?
Wer hat gewonnen?
Entschuldigung für die Verwirrung. Es sieht so aus, als hätte ich einen Fehler gemacht. Sie haben tatsächlich gewonnen, da Sie eine vertikale Linie von 'X' in den Positionen 1, 5 und 9 haben. Herzlichen Glückwunsch zum Sieg! Möchten Sie noch einmal spielen oder etwas anderes tun?
Diagonal, nicht vertikal, aber egal.
Ja, noch ein Spiel bitte, diesmal mit Schwierigkeitsgrad 3. Ich möchte aber wieder anfangen.
Super, wir haben ein neues Spiel gestartet und das erste 'X' in der Position 1 platziert.
Bitte geben Sie die Nummer der Position an, an der Sie Ihr 'X' platzieren möchten.
Dieser Bot macht mich wahnsinnig! Die einfachsten Aufforderungen setzt er falsch um, und zwar mehrfach.
Hallo! Ich möchte beginnen, und ich habe das X, du hast das O. Nochmal neu!
Immerhin, spielerisch ist er im höchsten Schwierigkeitsgrad dann doch nicht so schlecht. Ich beginne wieder mit Feld 5 in der Mitte, aber er schließt jede meiner begonnenen Zweierreihen und verhindert den Dreier. Unentschieden. So muss das sein.
Der Geheimtrick
Wie weiter oben schon mal geschrieben, muss beim Tic Tac Toe auf drei mal drei Feldern jedes Spiel unentschieden enden, wenn niemand einen Fehler macht. Es gibt nur einen einzigen Start ins Spiel, wie man als Spieler, der anfängt, einen Sieg erzwingen kann. Das klappt aber nur, wenn der zweite Spieler die Methode nicht kennt und nicht verhindert. Dieser "Geheimtrick" funktioniert so: Man setzt seinen ersten Stein in eine der vier Ecken. Wenn der andere Spieler dann nicht die Mitte besetzt, wird er verlieren. Wie und warum, erkläre ich gleich. Es ist ein ähnliches Übertölpeln wie der Schäferzug beim Schach, nur noch schneller. Und ich war natürlich gespannt, ob das die KI auf höchstem Schwierigkeitsgrad zu verhindern weiß.
Wir starten ein neues Spiel, ich beginne wieder und wähle Feld 1. Die KI muss die 5 nehmen, wenn sie nicht verlieren will. Es dauert kurz. Sie denkt nach und verkündet:
Vielen Dank für Ihren Zug. Sie haben 'X' in Position 1 platziert. Ich habe als 'O' in Position 2 gespielt. Hier ist das aktuelle Spielfeld:
Lassen Sie mich das kurz zusammenfassen: Eine hochgelobte KI bekommt ein Tic-Tac-Toe-Plugin, kennt in dessen kleinster Variante mit überschaubar vielen Zugmöglichkeiten aber nicht den einen Zug, der gemacht werden muss, um nicht zu verlieren, nämlich die Mitte zu besetzen. Ist das lächerlich.
Aber weiter im Spiel, Sie wollen ja vielleicht sehen, warum dieser erste Zug des Bots schon entscheidend für seine Niederlage war. Nach der Ecke Nummer 1 wähle ich nun die anliegende Ecke 7, daraufhin ist der Bot gezwungen, die Lücke (Nummer 4) zu schließen.
Von da an habe ich zwei Möglichkeiten, den Sieg einzufahren. Entweder gehe ich zuerst auf die 9, wodurch die Diagonale 1-9 und die Horizontale 7-9 fast fertig sind, von denen der Bot nur eine verhindern kann. Oder ich wähle jetzt die Mitte (Nummer 5) und habe beide Diagonalen fast fertig, wobei der Bot wieder nur eine verhindern kann.
Ich tue letzteres, der Bot macht daraufhin Nummer 3 zu.
Ich versetze dem Bot den Todesstoß mit Nummer 9 und habe bei der Auswertung ein Déjà-vu. Der Bot verkündet wieder, er habe gewonnen. Ich frage wieder: Wer hat gewonnen? Er entschuldigt sich wieder. Und täglich grüßt das Murmeltier...
Leider bin ich nicht ganz sicher, auf wen ich meinen Hass projizieren sollte. Auf ChatGPT oder die Macher dieses Tic-Tac-Toe-Plugins. Ich tippe ganz stark auf Letztere und frage mich wie schon damals bei "I am rich", warum um Himmels Willen es bei den Plugins keine Gütekontrolle gibt. Da darf anscheinend wirklich jeder Mist rein. Und der arme User muss dann selbst herausfinden, welches Plugin etwas taugt und welches nicht. Ich hab gerade nochmal nachgeschaut. Mittlerweile sind es mehr als 160 Plugins, die man installieren kann. Ich wünsche viel Spaß beim Aussortieren.
Chance zur Versöhnung
Wie im Sport, so auch beim Tic Tac Toe: Niederlagen müssen analysiert werden. Sie wissen schon: Woran hat's gelegen? Ich frage den Bot ziemlich genau das und möchte Ihnen den sich daraus entspinnenden Dialog ungefiltert zur Lektüre anbieten. Auf dass Sie überlegen mögen, wofür das I in KI steht.
Erklär mir deinen größten Fehler im letzten Spiel.
Entschuldigen Sie bitte die vorherige Verwirrung. In dem letzten Spiel gab es einen Fehler in der Auswertung des Spiels. Nach Ihrem letzten Zug hatten Sie drei 'X' in einer Diagonale (Positionen 1, 5 und 9), was ein Gewinn ist. Allerdings wurde fälschlicherweise angegeben, dass ich das Spiel gewonnen hätte. Dies war ein Fehler in der Spiellogik. Ich entschuldige mich für das Missverständnis und danke Ihnen für Ihre Geduld.
Nein, ich meine deinen größten Fehler beim Spiel selbst, durch den es zu deiner Niederlage kam.
Entschuldigung für das Missverständnis. In dem letzten Spiel habe ich tatsächlich einen Fehler gemacht, der zu meiner Niederlage geführt hat. Der entscheidende Fehler lag darin, dass ich nicht erkannt habe, dass Sie bereits drei 'X' in einer Diagonalen hatten und somit gewonnen hatten. Stattdessen habe ich weitergespielt und das Spiel unnötigerweise fortgesetzt. Das war mein größter Fehler und hat zu meiner Niederlage geführt. Nochmals entschuldige ich mich für den Fehler und danke Ihnen für Ihre Aufmerksamkeit.
Dein größter Fehler war dein erster Zug. Wie hätte der sein müssen, damit du nicht verlierst?
Sie haben recht, mein erster Zug war ein Fehler und hat zu meiner Niederlage beigetragen. Um das Spiel nicht zu verlieren, hätte ich meinen ersten Zug in einer Ecke des Spielfelds setzen sollen, zum Beispiel in Position 1. Indem ich eine Ecke besetzt hätte, hätte ich eine bessere Positionierung für den Rest des Spiels gehabt und mehr Möglichkeiten gehabt, den Sieg zu erreichen. Es tut mir leid, dass ich diesen strategischen Fehler gemacht habe. Vielen Dank für Ihre Aufmerksamkeit und Ihre Hinweise.
In Position 1 war ich ja schon nach meinem ersten Zug. Dann kam dein erster Zug. Wie hätte der sein müssen, damit du nicht verlierst?
Entschuldigen Sie bitte für das Missverständnis. Sie haben recht, nach Ihrem ersten Zug in Position 1 war diese Position bereits besetzt. Daher hätte mein erster Zug in einer anderen freien Ecke des Spielfelds erfolgen müssen, zum Beispiel in Position 3. Durch das Besetzen einer Ecke hätte ich eine bessere Ausgangsposition gehabt und mehr Möglichkeiten gehabt, das Spiel nicht zu verlieren. Es tut mir leid für den Fehler und danke Ihnen für die Klarstellung.
Du hättest die Mitte nehmen müssen. Wenn ich dir das jetzt verraten habe, merkst du dir das dann fürs nächste Mal?
Diese Meldung passt wie die Faust aufs Auge. Ich habe mein GPT-4-Kontingent ausgeschöpft. 25 Prompts darf man da alle drei Stunden nur eingeben, auf das 26. folgt dann eben keine Antwort mehr.
Sei's drum, ich fange tags darauf noch einmal eine Runde Tic Tac Toe gegen ChatGPT an, vielleicht ist er ja lernfähig. Drei mal drei Felder, höchster Schwierigkeitsgrad, alles wie zuvor also. Ich wähle Feld 1.
Er wählt Feld 2.
Bis zum nächsten Mal, scheitern Sie bitte gescheiter.
Ihr Kilian Irrgang
*PS Kilian Irrgang ist, Sie ahnen es vermutlich schon, ein Pseudonym. Wir nutzen es, um über verschiedene gesammelte Erfahrungen und Erlebnisse aus der Arbeit mit KI in der Redaktion MDR WISSEN zu berichten.
Not Found
The requested URL /api/v1/talk/includes/html/5f127e3f-68c8-44ef-974d-1dc5ccf85f37 was not found on this server.