ChatGPT, wie entwickelt sich die Steuer- und Sozialbeitragsquote in den nächsten 10 Jahren? Der Code Interpreter!

Seit wenigen Stunden stellt ChatGPT allen Plus Usern den sogenannten Code Interpreter zur Verfügung. Der Autor dieser Zeilen musste sich für seine Doktorarbeit noch mit Sprachen/Tools wie R oder Stata auseinandersetzen, um Daten zu analysieren. Jetzt scheint es, dass OpenAI den Nutzern einige der wirkungsvollsten Instrumente überhaupt an die Hand gibt.
Wird Deutschland bald nicht mehr nur ein Land mit über 80 Millionen Bundestrainern, -Kanzlern, sondern auch von über 80 Millionen Statistikern sein?
Man stelle sich das vor: Stammtischdiskussionen, die in Windeseile über das Smartphone mit der eigenen Datenanalyse, Statistik oder Prognosen untermauert werden! Wird das die Rückkehr zur neuen Sachlichkeit?
Bevor wir auf dieser Metaebene verharren, werden wir konkret und schauen uns gemeinsam an: Was kann der ChatGPT Code Interpreter? Natürlich haben wir uns dafür Daten mit einem Bezug zu Steuern herausgesucht.
Steuer- und Sozialbeitragsquote: ChatGPT, was bringt die Zukunft?
Für unsere Zwecke passt es gut, dass das Bundesministerium der Finanzen kürzlich Daten bzw. Zeitreihen zur Entwicklung der Steuer- und Abgabenquoten seit dem Jahr 1960 veröffentlicht hat.
Hier seht ihr einen kurzen Blick in die Rohdaten. Wirkt nicht sonderlich komplex, oder?

Diese Daten nehmen wir – ich habe mich für die XLSX-Datei entschieden – und werfen sie in den Code Interpreter. Das Ganze sieht dabei so aus.

Da mich natürlich das Große und Ganze interessiert, wähle ich die Volkswirtschaftliche Gesamtrechnung und erhalte den folgenden Graphen, inkl. der folgenden Prognosen.

Das Ergebnis ist nicht sonderlich überraschend. Bevor wir an dieser Stelle Emotionen schüren, gehen wir darauf auch nicht weiter ein. Viel spannender ist doch die Frage: Wie kommt ChatGPT bzw. der Code Interpreter zu diesem Resultat und was taugt es?
Wie entsteht diese Prognose? Was sind die Methoden?
Dazu schauen wir uns einmal die Arbeitsweise bzw. den Code dahinter an. Auch wer kein Python beherrscht, aber zumindest die eine oder andere Statistikvorlesung an der Uni besucht hat, erkennt auf den ersten Blick die Methodik: LinearRegression.
Es wurde also eine lineare Regression durchgeführt.

Ist diese Methodik zielführend? Naja! Bei einer linearen Regression wird nach Korrelationen (nicht Kausalitäten!) zwischen verschiedenen Variablen gesucht. Im Rahmen der Prognose werden dann diese historischen Korrelationen in die Zukunft übertragen.
Ist das hier zielführend? Antwort: Es ist offenkundig, dass die Welt, in der wir leben, stetigen Veränderungen unterworfen ist und Zusammenhänge/Korrelationen/Kausalitäten damit ebenso. Für eine halbwegs valide Prognose bräuchten wir daher deutlich mehr unabhängige Variablen in den Daten (=Was könnte die Steuer- und Sozialbeitragsquote treiben?)
Ich habe daher versucht – recht generisch – die wichtigsten politischen Entwicklungen der vergangenen zwei Jahre mit in dieses Modell/diese Prognose zu packen. Da kam das System an seine Grenzen.

Fazit
Der Code Interpreter von OpenAI ist nur wenige Stunden alt und wir wollten wissen, welche Steuer- und Abgabenquote in den kommenden 10 Jahren auf uns zukommen wird.
Wird diese Prognose halten? Sehr wahrscheinlich nicht, denn die Methodik und die Datengrundlage, die dieser Prognose zugrunde liegt, entsprechen nicht dem Standard wissenschaftlichen Arbeitens.
Dessen sollte man sich bewusst sein! Ohne ein fundiertes Grundlagenwissen zu statistischer Methodik wird man mit dem smartesten Tool unkontrollierbare Ergebnisse erhalten.
1 Kommentare
Verfasse einen Kommentar
Weitere Beiträge

Dr. Roger Gothmann
Wer mag, kann ChatGPT-4/den Code Interpreter einmal mit aktuellen politischen Analysen füttern und schauen, wie sich die Abgabenquote-Prognose anschließend ändert. Ich bin auf eure Ergebnisse gespannt.