Nutzung von KI/LLMs Ende 2024

In diesem Post versuche ich, meine Erfahrung mit (Nicht-) Nutzern und Nutzerinnen von Large Language Models (LLM), wie ChatGPT, Anthropics usw. aus meinem sozialen Umfeld zu reflektieren.

Steve Jobs erzählte in einem Interview, dass der Personal Computer (=Mac) wie ein „Bicycle for the mind“ sei. Er bezog sich auf eine Studie über die Energieeffizienz verschiedener Spezies bei der Fortbewegung. Der Mensch schnitt schlechter ab als Tiere wie der Kondor, doch auf einem Fahrrad übertraf er alle. Jobs sah Computer ähnlich: Sie steigern das geistige Potenzial, wie ein Fahrrad die körperliche Effizienz. Mit Computern könnten Menschen schneller denken, kreativer arbeiten und komplexe Probleme lösen.

Large Language Models (LLMs) sind KI-Systeme, die mithilfe riesiger Datenmengen trainiert wurden, um menschliche Sprache zu verstehen, zu generieren und darauf zu reagieren. Sie sind schon seit über zehn Jahren in Entwicklung, bekamen aber seit 2022 vermehrt Aufmerksamkeit und wurden in Form von ChatGPT für viele Menschen nutzbar. Firmen wie Open AI oder Anthropics haben sie auch kostenlos verfügbar gemacht, um Aufmerksamkeit und Investorenkapital zu mobilisieren.

In meinem Freundeskreis gehört die überwiegende Mehrheit der Menschen bisher zu den Late- oder Non-Adaptern. Aus meinen Lehrveranstaltungen (2024) schätze ich, dass nur gut die Hälfte der Studierenden bisher Erfahrungen mit LLMs gesammelt hat. Beide Beobachtungen haben eine kleine Stichprobe, die erste ist auch durch mein Alter (Ende 60) beeinflusst.

Es ist interessant, das Akzeptanzverhalten bei LLMs mit der Akzeptanz von Textverarbeitung, des Internets (besonders Google) zu vergleichen. Seit Ende der 1980er Jahre verbreitete sich Textverarbeitung. Es gab am Anfang viele Vorbehalte über ihren Nutzen und auch Versuche, ihre Einführung in Institutionen und Unternehmen zu verhindern. Ein humorvoller Clip aus einer norwegischen TV-Show zeigt die Vorbehalte gegenüber Textverarbeitung – transportiert auf den Übergang vom Schreiben auf Papierrollen zum Schreiben in Buchkladden zwischen 1. und 4. Jahrhundert. Ich kann mich an ähnliche Probleme und Argumente noch in den 1990er Jahren erinnern. 10 Jahre später hatte ich noch Kollegen, die E-Mails von ihren Sekretärinnen ausdrucken ließen und sie mit dem Bleistift am Rand beantworteten. Die Sekretärinnen tippten das dann ab und versandten die Antwortmails. Inzwischen nutzen diese Kollegen allerdings auch Textverarbeitung, E-Mails und das Internet.

Auch die Nutzung des Internets und insbesondere von Google-Recherchen brauchte lange, um sich weit in der Gesellschaft zu verbreiten. Das Lebensalter spielt dabei eine wichtige Rolle. In einem höheren Alter „lohnt es sich halt nicht mehr, das noch zu lernen“. Auch kognitiv fällt es älteren Menschen schwerer, sich auf neue Werkzeuge und Denkkonzepte einzulassen oder umzustellen. Die Gründe sind vermutlich weniger physiologisch als im zweischneidigen Wert von Erfahrung zu suchen. Erfahrung hilft in vielen Tätigkeiten, Aufgaben schnell zu erledigen. Aber Erfahrungen blockieren oft auch den Zugang zu Neuem. Das Bildungssystem und die Arbeitserfahrung in vielen Berufen unterstützen oder erfordern auch eine gewisse Abstumpfung. Lange nachdem die Tätigkeit des Feilens keine Rolle mehr im metallverarbeitenden Gewerbe spielte, war diese Tätigkeit noch stark in der Ausbildung von Metallarbeitern vertreten. Ihre Funktion bestand darin, die Auszubildenden darin zu trainieren, Monotonie zu ertragen. Ähnlich implizite Ausbildungsprozesse gibt es in vielen Berufen und Karrieren auch heute noch, auch wenn es eher darum geht, institutionalisierten Bullshit ertragen zu können. In vielen Berufen und abhängig von individuellen Dispositionen blockiert dies auch das viel gelobte lebenslange Lernen. Diese Blockaden verhindern bei älteren Menschen, dass sie Dinge mit Google oder auf YouTube suchen, die ihre Kinder oder Enkelkinder ganz selbstverständlich suchen – und auch beantwortet bekommen.

Für viele Menschen ist heute auch noch wenig praktischer, insbes. beruflicher Nutzen aus der Anwendung von LLMs zu erkennen. Das wird sich 2025 etwas ändern, wenn LLMs niedrigschwelliger auf Smartphones verfügbar werden. Das war bei Textverarbeitung und Internet anfangs ähnlich.

Die Nutzung von ChatGPT unterscheidet sich etwas von den genannten früheren Innovationen. Einerseits haben die Programme sehr schnell Fortschritte in der leichten Nutzbarkeit gemacht, man kann sich z.B. mit ChatGPT inzwischen sehr gut akustisch und natürlich unterhalten. Andererseits ist aber die Spezifik der Nutzbarkeit heute schwieriger zu durchschauen als bei Textverarbeitung oder Google-Recherche.

Das führt dazu, dass ich die Early Adopters in zwei Untergruppen unterteilen will. Nennen wir die erste Gruppe die „Mis-Users“.

Im Beispiel des „Bicycle for the mind“ erhöht das Fahrrad die Effizienz der Fortbewegung, aber es ist völlig klar, dass der Mensch das Fahrrad lenkt, und seine Muskelkraft bleibt der Antrieb. So ähnlich ist es auch bei Textverarbeitung und Internet.

Bei ChatGPT kann das Missverständnis entstehen, dass die KI die Richtung bestimmt und der Beitrag des Nutzers nur noch im Cut und Paste besteht. Eine Nutzung von LLMs, die so vorgeht, ist fatal. Alle LLMs „halluzinieren“ immer wieder, insbesondere wenn sie mit für sie nicht beantwortbaren Fragen konfrontiert werden. Es besteht wenig Hoffnung, dass sich dies bald ändern könnte. Viel hängt von den Prompts ab, mit denen LLMs befragt werden. Dies ist ähnlich wie die „Kunst des Googelns“. Qualifikationen wie ein großer Wortschatz des Nutzers und eine differenzierte Denkweise, aber v.a. auch Erfahrung mit dem Werkzeug sind wichtig.

Aus meiner (immer noch) Tätigkeit als Hochschullehrer (aber nicht nur) sehe ich gelegentlich Missbrauch von ChatGPT. Im Kontext von Hochschulen taucht die Frage auf, welche Nutzung von LLMs legitim ist und wie man es erkennen kann, ob Arbeiten mit/von LLMs geschrieben wurden. Die Regulierung der legitimen Nutzung ist einfach und in vielen Fakultäten bereits umgesetzt. Die Feststellung, ob eingereichte Texte illegitim sind, ist schwierig. Eine maschinelle Lösung gibt es dafür meines Wissens nicht, anders als bei Plagiatsdetektoren. Wenn man viel mit ChatGPT arbeitet, erkennt man den „Sound“. Aber das wäre auch zu vermeiden, weil es inzwischen KI-basierte Programme zur „Humanisierung“ von Texten durch Paraphrasierung gibt. Ein mündliches Gespräch kann hier schnell Aufschluss über die geistigen Eigentumsverhältnisse geben.

Menschen, die ChatGPT das Lenken und das Ausformulieren überlassen, werden damit auf die Dauer nicht sehr erfolgreich sein. Oft geben kleine Fehler Aufschluss für andere und zerstören die Reputation. In vielen Fällen wäre es besser gewesen, wenn diese Menschen keine LLMs verwendet hätten. Das gilt aber auch für Textverarbeitung oder Autos. Noch besser ist es, den Gebrauch von LLMs zu lernen. Dazu gibt es viele Anleitungen in YouTube, aber auch Bücher und Videokurse.

ChatGPT und Co. werden zum Turbo-Fahrrad, wenn der Nutzer die Kontrolle behält und nicht versucht, seine Kompetenz künstlich aufzublähen. LLMs sind heute schon sehr wertvoll, als Hilfswerkzeug für Wissensarbeiter, um Ideen zu entwickeln, schnell Fakten zusammenzutragen und ggf. auch Formulierungsvorschläge zu machen. Mit intensiver Nutzung entstehen Erfahrungen, was wirksame Fragen/Prompts sind, was man erwarten kann und was nicht. Inzwischen bietet ChatGPT auch die Suche im Internet an, verbunden mit Quellenangaben, ähnlich wie Perplexity. ChatGPT Canvas und das Modell o-1 erleichtern es, die Vorgehensweise nachzuvollziehen. Für mich hat es sich bewährt, bestimmte Chats in das Notizbuch Notion zu übernehmen und später zu verdichten und zu verfolgen. Ich bemerke auch, wie sich meine Fragetechnik durch den häufigen Gebrauch von LLMs verbessert hat, und das nicht nur gegenüber LLMs.

Mein 1. Custom GPT: „Opa kocht“

Im November 2023 hat Open AI Custom GPTs vorgestellt. „Custom GPTs sind spezialisierte Versionen von allgemeinen GPT-Modellen. Diese Modelle, bekannt für ihre Fähigkeit, menschenähnliche Texte zu generieren, können für spezifische Anwendungsfälle angepasst werden. Sie werden mit einem maßgeschneiderten Datensatz trainiert, um in einem bestimmten Bereich wie Kochen, Medizin oder Literatur spezialisiert zu sein.“ Die letzten drei Sätze wurden von Chat GPT selbst gespendet.

Zum Zeitpunkt ihrer Einführung sind Custom GPTs noch nicht viel mehr als Eingabemasken, mit denen man per Mausklick eine Startabfrage abruft, um damit einen Dialog mit ChatGPT zu starten. Voraussetzung für die Erstellung, aber auch die Nutzung von Custom GPTs ist ein ChatGTP Plus Account (aktuell $20 / Monat).

Ein Custom GPT ist in wenigen Minuten erstellt, in der üblichen Dialogform. Es steht dann im eigenen Konto zur Verfügung und man kann es anderen Personen per Link zugänglich machen oder es in das öffentliche Verzeichnis der Custom GPTs aufnehmen lassen. Stand November 2023 ist zunächst kein großer Mehrwert für die Nutzer gegenüber dem allgemeinen Abfragedialog von ChatGPT erkennbar. In Zukunft wäre denkbar, dass Erfahrungen mit ChatGPT-Abfragen (Prompt Craft) in die Formulierung von Custom GPTs einfliessen. Ein direkter Markt für Custom GPTs ist offenbar noch nicht geplant, aber evtl. eine Beteiligung der Autoren an Zusatzeinkünften, wenn Nutzer z.B. den ChatGPT Plus Tarif buchen, um ein Custom GPT zu nutzen.

Mein erster Versuch war ein Kochratgeber „Opa kocht“, der anhand noch vorhandener Lebensmittel Ratschläge gibt, was man daraus kochen könnte.

Mein Custom GPT ist unter diesem Link verfügbar: https://chat.openai.com/g/g-7XYk9QX4W-opa-kocht

Es bleibt abzuwarten, ob Open AI den Nutzern zukünftig wirklich die Möglichkeit gibt, eigene Modelle zu trainieren. Dann wären die Custom GPTs mehr als glorifizierte Startseiten.

Zum Abschluss ein Link zu einem humorvollen Video mit elaborierteren Custom GPTs, die etwas an Weizenbaums Eliza erinnern:

Neue Fotogalerie: Norwegen

Klassentreffen – fernere Lebenserwartung

Auf einem Klassentreffen meines Abiturjahrgangs 1973 wurde abschließend die Frage diskutiert, in welchen Zeitraum man sicher wieder treffen sollte. Diese Frage kann man aus verschiedenen Perspektiven betrachten, z.B. nach wieviel Jahren genug Neues passiert ist, worüber man sich austauschen könnte, neue Enkelkinder, Reisen usw.

Für einen Demografen ist die unmittelbare Assoziation die fernere Lebenserwartung, also die Zahl von Lebensjahren die Menschen eines Alters im statistischen Mittelwert noch zu erwarten haben. Sie ergibt sich allgemein aus der Sterbetafel und spezifisch aus der Kohortensterbetafel.

@leonardo.ai

Im Sommer 2023 wurde für Deutschland die aktuelle Periodensterbetafel für die Jahre 2020/22 veröffentlicht und damit auch ein Rückgang der Lebenserwartung dokumentiert, der mit der COVID-Pandemie einsetzte. Periodensterbetafeln basieren auf Beobachtungen der Sterblichkeit in einem Zeitraum und sie beziehen sich auf Menschen unterschiedlicher Geburtsjahre. Die Sterbewahrscheinlicheit 80-jähriger Frauen in der Periodensterbetafel des Jahres 2020 bezieht sich auf den Geburtsjahrgang 1940. Frauen die heute 68 Jahre alt sind, werden im Alter 80 eine etwas andere Sterbewahrscheinlichkeit haben (hoffentlich eine geringere). Periodensterbetafeln eignen sich also nicht für die Bewertung der zukünftigen Lebenserwartung von Menschen eines Geburtsjahrganges.

Die fernere Lebenserwartung unseres Jahrgangs lässt sich nur aus Kohortensterbetafeln ablesen, welche die Mortalität von Geburtsjahrgängen verfolgen. In unserem Fall wäre das der Geburtsjahrgang 1954. Die aktuelle Kohortensterbetafel des Statistischen Bundesamtes ist vom Jahr 2020, enthält also noch nicht die Entwicklung der letzten Jahre seit der Pandemie.

@leonardo.ai

Frauen im Alter von 68 Jahren haben zum Zeitpunkt unseres Treffens eine fernere Lebenserwartung von 19,90 Jahren, Männer von 16,98 Jahren.

Wie könnte die zukünftige Besetzung unserer Klassentreffen aussehen? Sterbetafeln gehen immer von einem sog. Radix von 100.000 Personen im Alter 0 aus und wenden dann die altersspezifischen Sterbewahrscheinlichkeiten an. Daraus ergibt sich in weiteren Rechenschritten die Lebenserwartung für jedes Alter. Für mich ist der Ausgangspunkt ein Foto der Klasse im Alter von 17 Jahren, auf dem 17 Schülerinnen und 13 Schüler zu sehen sind. Im statistischen Durchschnitt wären drei Männer und zwei Frauen aus unserer Klasse bisher schon gestorben. Wir haben über einige Sterbefälle auf dem Treffen gesprochen, aber konnten die Zahl so genau nicht bestimmen.

In der Sterbetafel gibt es eine sog. Absterbeordnung, die sich aus der Anwendung der Sterbewahrscheinlichkeiten auf die Überlebenden ergibt und den Prozess der Mortalität modelliert. Das ergibt ein genaueres Bild als z.B. die heute noch zu erwartende fernere Lebenserwartung. Für unseren Jahrgang würde das so aussehen:

eigene Berechnung auf Basis der Kohortensterbetafel für Deutschland, 1920-2020

Eine klare Dringlichkeit, sich zukünftig häufiger zu treffen ist zumindest demografisch nicht ableitbar. Die meisten haben noch viele, hoffentlich gesunde Lebensjahre vor sich. Ein weiteres Treffen im Jahr 2026 würde uns, wie hier betrachtet, nochmal vollständig zusammenführen.

@leonardo.ai

Neben der Lebenserwartung gibt es auch eine sog. gesunde Lebenserwartung. Hier wird nicht die Gesamtzahl zukünftiger Lebensjahre betrachtet, sondern jene frei von Behinderungen und Pflegebedürftigkeit. Die gesunde Lebenserwartung ist einige Jahre geringer als die demografische Lebenserwartung. Möglicherweise werden also zukünftig nicht mehr alle Mitschülerinnen unmittelbar an den Treffen teilnehmen können.

Sterbetafeln bilden den Durchschnitt der Bevölkerung ab. Unsere Klasse war von einer Erweiterten Oberschule. Menschen mit einem höheren Bildungsgrad haben eine etwas höhere Lebenserwartung. Das könnte das Bild etwas verbessern und vielleicht die negative Entwicklung der letzten drei Jahre etwas ausgleichen. Zum großen Teil ist der Bildungsvorteil aber verhaltensabhängig, in seinen Genuß kommt nur, wer sich clever verhält und Risiken verringert.

Und schließlich ist noch die Frage der Kohäsion: werden zukünftig alle Mitschüler noch genauso interessiert an einer Teilnahme sein wie heute?