Taschenrechner, Taschenschreiber

Taschenrechner, Taschenschreiber#

Manchmal werden Large Language Models (LLM), wie beispielsweise ChatGPT, mit dem Taschenrechner (TR) verglichen, nach Art eines “Taschenschreibers”.

Ich halte diesen Vergleich für OK. Wir wollen ausloten, wohin er führt.

Transfer Taschenrechner -> LLM#

Der Vergleich führt u.A. zu folgender Argumentation:

Taschenrechner (TR), auch Excel mit VBA, Python-Programme etc.:

Ohne TR zeigt man, dass man die Rechenoperationen beherrscht und die Berechnung mit Papier und Bleistift durchführen kann.
Mit TR zeigt man, dass man
- die richtige Formel kennt und ein geeignetes Programm schreiben und
- der Formel oder dem Programm die richtigen Daten übergeben kann.

Der Taschenrechner führt dann die Berechnungen durch, die man ohne TR selber durchführen müsste. Wenn man einen Taschenrechner benutzt, wird es uninteressant, nur das Ergebnis der Rechnung zu betrachten. Interessant ist der User-Input, also die Auswahl des Rechenwegs und der passenden Daten, die dem Rechenauftrag zugrunde liegen.

Wir übertragen das auf Large Language Modelle (LLM):

Ohne LLM zeigt man, dass man einen komplexen Sachverhalt in einer angemessenen Sprache darstellen kann.
Mit LLM zeigt man, dass man
- ein LLM geeignet konfigurieren kann, insbesondere geeignete Schreibanweisungen geben
- und dem LLM die richtigen Schreibinhalte übergeben kann.

Das LLM erzeugt dann in korrekter Sprache den Text, den man ohne LLM selbst formulieren müsste. Wenn man ein LLM nutzt, wird es uninteressant, den fertig formulierten Text zu betrachten. Interessant sind der User-Input, also die Konfiguration des LLMs, sowie die Daten, die dem Schreibauftrag zugrunde liegen.

Die individuelle Leistung liegt “upstream”#

Die leitende Idee bei TR und LLM besteht darin, die eigene individuelle Leistung durch Technik zu fokussieren und zu erhöhen. Die Einführung von Rechen- oder Schreibtechnik führt zu einem Wandel: Anstatt das Rechen- oder Schreib-Ergebnis als individuelle Leistung zu betrachten, betrachten wir die Auswahl und Konfiguration der Technik sowie die Passung und Qualität der Daten.

Ein Text, der als Ergebnis eines Schreibauftrags an ein LLM geliefert wird, ist weitgehend uninteressant, wenn er ohne Auswahl, Konfiguration und Eingabedaten des LLM erstellt wurde.
Bei einer LLM-Nutzung sind Auswahl, Konfiguration und Eingabedaten eines Schreibauftrags maßgeblich interessant.

Falls Auswahl, Konfiguration oder Eingabedaten selbst wieder Ergebnis eines Schreibauftrags an ein LLM sind, müssen auch für diesen Meta-Schreibauftrag Auswahl, Konfiguration und Eingabedaten vorgelegt werden. Letztlich alleine Maßgeblich interessant sind vor allem Texte, die ohne LLM-Hilfe, „selber” formuliert wurden.

Mir gefällt in diesem Zusammenhang die englische Metapher “upstream”: Interessant für die Gewässerqualität eines Flusses sind die Ereignisse stromaufwärts.

An einer Hochschule kommt ein weiterer Aspekt hinzu: Präsentationen, Studien-, Seminararbeiten sind in den allermeisten Fällen Ergebnis eines Lernprozesses. Statt den Lernprozess retrospektiv ex post anhand eines Textes zu bewerten, der genau so gut (oder manchmal besser) durch eine KI erzeugt werden kann ist es didaktisch deutlich geschickter, den Lernprozess selbst sichtbar zu machen. Frei nach Heinrich von Kleist kann Text auch der allmählichen Verfertigung der Gedanken beim Schreiben dienen (Kleist 1805). Die Idee zur Dokumentation des Lernprozesses (statt einer Fixierung auf die Kontrolle von Lernergebnissen) stammt aus dem Büchlein Schreibdenken von Ulrike Scheuermann. Ein Teil der Lernaufgabe dient dann dazu, Lernen für die Lernenden selbst sichtbar zu machen. Im Rahmen der Hochschullehre will ein Dozent dann nicht zu einem Text oder einem Programm als Lernergebnis, sondern zu einem dokumentierten Lernprozess Feedbck geben. Das Adjektiv “upstream” steht in diesem Kontext für eine Abkehr vom Ergebnis und einer Hinwendung zum Prozess.

Unplugged#

LLM-generierte Texte sind inzwischen allgegenwärtig. In einem meiner seminaristisch angelegten Kurse wurden im SS2025 etwa 4 von 5 Texten maßgeblich durch ChatGPT erstellt. Ich schätze die Situation als dramatisch ein. Wichtigste Folge für mich:

Ich lege mehr wert auf individuelle mündliche Kommunikation – und zwar in Settings, in denen kein elektronisches Gerät auf dem Tisch liegt.
Wenn ich zu Texten Feedback gebe will ich sicher sein, dass sie selbst (und nicht von LLM) verfasst wurde.

In der Praxis von Lehren und Lernen ergibt sich eine Verschiebung der Beweispflicht. Denn auch unsere Prüfungsordnung verlangt die Bewertung einer individuellen Leistung. Wie könnte man nachweisen, dass man einen Text selber verfasst hat?

Idee: Statt wohlformulierten stilistisch unpersönlichen Texten darf man auch Skizzen und Rohtexte einreichen, die ein “gerüttelt Maß” an persönlichem Stil aufweisen – je persönlicher, desto besser.

Auf gehobenem sprachlichen Niveau sind eine typische Wortwahl und typische grammatikalische Konstruktionen ganz persönliche Kennzeichen, anhand man sogar in der Kriminalforensik statistisch hoch signifikant Texte ihren Autoren zuordnen kann. Ähnlich hat jedes LLM seinen eigenen Stil, den der geübte Leser sofort erkennt.
Auf weniger elaboriertem sprachlichen Niveau lassen typische Fehler in Bezug auf Grammatik und Rechtschreibung eine persönliche Autorschaft erkennen.
In wissenschaftlichem Kontext halte ich auch Text für sinnvoll, der keinen Anspruch auf “korrektes” Schriftdeutsch erhebt, sondern von Skizzen, vorläufigen Formulierungen, Auslassungen etc. lebt – mehr dazu siehe unten.

Selbst (d.h. ohne KI) verfasste Texte haben eines gemeinsam: Sie sind nicht durch ein LLM in Bezug auf Grammatik, Wortwahl etc. glattgebügelt wurden. (Wenn sie durch eine Rechtschreib-Korrektur gelaufen sind, wie sie traditionell durch Textverarbeitungs-Software wie MS Word oder Libreoffice angeboten wird, ist ok, solange keine wesentlichen Grammatik- oder Stilkorrekturen erfolgen.)

Texte, die nicht durch ein mehr oder weniger intelligentes System (Rechtschreibkorrektur, Grammatik, Stil) korrigiert wurden: Solche Texte wollen wir unplugged Texte nennen, in Anlehnung an “unplugged” Musik, die mit herausgezogenem Stecker und ausschließlich mit akustischen Instrumenten erzeugt wurde.

Rohtexte#

In Rohtexten, die unplugged entstanden sind, sehe ich eine große Chance für Forschungs und Lehre. Um diese Chancen zu sehen müssen wir am Fundament des herkömmlichen Bildungsbegriffes rütteln. Die Fragen lauten:

Wozu benötigen wir perfektes Deutsch – und wo stört es eher?
Was wäre schlimm daran, wenn selbst formulierte Texte in “schlechtem Deutsch” geschrieben sind?
Was empfehlen wir Studierenden, die zwar intelligent und fachlich gut sind, aber dank Migrationshintergrund leider kein gutes, gehobenes, akademisches Deutsch sprechen?

These: Die breite Verfügbarkeit von Taschenschreibern verändern die Rolle von “gutem” Deutsch ganz maßgeblich. Ein traditioneller Bildungsbürger wird diesen Shift anders bewerten als ein Studierender aus einem bildungsfernen Milieu oder einer anderen Muttersprache.

In der Zeit von LLM war eine gehobene, korrekte Sprache ein wichtiges Ziel akademischer Bildung. Sprache ist einer der wichtigsten Indikatoren für Milieuzugehörigkeit. Dies führt bis heute zu einer Bildungsschere: Bevorteilt sind Studierende aus gut bildungsbürgerlichem Haushalt; benachteiligt sind Studierende aus “bildungsfernen” Milieus, mit Migrationshintergrund, mit Deutsch als Zweit- oder Fremdsprache.
Heute kann ein LLM einen in “schlechtem” Deutsch geschriebenen Text in wohlformuliertes “gutes” Deutsch übersetzen. Seit der breiten Verfügbarkeit von LLM ist “gutes” Deutsch kein geeigneter Indikator mehr für Bildung.

Eine verstärkte Wertschätzung von Rohtexten bietet für Lehren und Lernen an der Hochschule auch Vorteile. Auch beim Schreiben gilt das Pareto-Prinzip: Mit 20 Prozent Aufwand erreicht man 80 Prozent Kommunikations-Ergebnis; um das Ergebnis auf 100 Prozent zu heben, muss man weitere 80 Prozent Aufwand investieren.

Wenn klar ist, dass ein LLM auch fast beliebig “schlecht” formulierten Text ganz leicht in “gutes” Deutsch oder Englisch übersetzen kann:

Dann können wir uns die Mühe sparen, gutes Deutsch manuell zu formulieren.
Wir können unsere immer begrenzten kognitiven etc. Ressourcen auf interessantere Arbeitsschritte als das Ausformulieren von Text fukussieren.
Insbesondere können wir unsere Denk-Ergebnisse in skizzenhaften Notationen zu Papier bringen.

Exkurs: Strukturwissenschaften wie die Informatik arbeiten neben ausführbarem Code sehr viel mit Diagrammen sowie semiformalen und formalen Modellen. Die formale Semantik von Modellen der Informatik wird durch formale Logik festgelegt. LLM sind dagegen Sprachmodelle; von LLM generierte Texte basieren technisch gesehen auf Wahrscheinlichkeiten von Wortketten. LLM sind erstaunlich erfolgreich bei der Erzeugung von normalsprachlichem Text. Dennoch sollte man nicht übersehen, dass LLM nicht für Inferencing-Aufgaben gebaut sind, und auch die herkömmlichen Wissensrepräsentationen der Informatik und der “good old fashioned Artificial Intelligence” (GOFAI) nicht ersetzen können. These: Die breite Verfügbarkeit von LLM sollte in der Informatik-Ausbildung zu einer Professionalisierung in zwar konventionellen, jedoch gut verstandenen Wissensrepräsentationen führen. Informatiker*innen zeichnen sich u.A. dadurch aus, dass sie ihr Wissen semiformal oder formal aufschreiben, visualisieren, interpretieren können. Ende des Exkurses.

These: Es könnte rational sein, wissenschaftliche normalsprachliche Texte erst möglichst spät in “gutes”, und das heißt hier: publikationsfähiges Deutsch zu übersetzen. Allen anderen Texte, die dem wissenschaftlichen Austausch dienen, wie z.B. Diskussionsvorlagen; Darstellung vorläufiger Ergebnisse; offene Fragen; ungelöste Probleme u.v.m.: Solchen Texten dient es nicht immer, wenn sie in perfektem Deutsch geschrieben sind. Und selbstverständlich sollten sie durch informatiknahe Wissensrepräsentationen ergänzt werden – nur Text genügt in der Informatik of nicht.

Solange Texte nicht ein finales, festes Ergebnise kommunizieren sollen, sondern nur ein von mehreren Bausteinen in einem auf Austausch und Erkenntnis ausgerichteten Diskurs sind; solange in einen Text neue Einsichten eingepflegt, Fehler korrigiert, Argumentationen umgestellt, Schwerpunkte geändert werden sollen: So lange geht das in nicht voll ausformulierten vorläufigen Texten sehr viel ressourcenschonender, flexibler, agiler als in perfekt ausformulierten Texten.

Und am Ende kann man das alles an den Taschenschreiber übergeben.

KI-Deklaration: Der Anteil der Nutzung von KI für das Schreiben und Formulieren dieses Textes beträgt 0 (null) Prozent.