Entspannt mathematische Grundlagen der KI betrachten. KI-Aspekte mal etwas anders dargestellt.
Zusätzlich zum Download: detaillierte Checkliste zur „Umsetzung interne KI-L/LLM-Lösung“ – s.u.
Vieles vom aktuellen Hype um KI erinnert an die Hochzeit des Internet-Booms Ende des letzten Jahrtausends. Da wurden Webseiten gehandelt, als wäre jede Aktie auf Gold gedruckt. Mit der Erfindung und dem Einsatz der Hyper Text Markup Language, kurz HTML, erschuf Tim Berners-Lee aus dem drögen Verbindungsnetz zwischen Universitäten oder einiger weniger staatlichen Stellen mit einem Schlag ein vollkommen neues Medium.
Das Gleiche erleben wir heute. OpenAI hat mit ChatGPT das Tor zur KI aufgestoßen. Mit Chatbots ist es nun einem breiten Publikum aus dem Stand heraus möglich, komplett anders mit dem Medium Internet umzugehen. Quasi persönlich mit dem Internet direkt zu kommunizieren und auf alle Informationen darin zugreifen zu können. Aber ist das alles nicht nur eine nächste Stufe von Alexa, Siri und Co.?
Sind Sie KI-fit oder fühlen Sie sich unsicher bei all den ständig neuen Informationen und Meldungen zu der Wunderwelt der künstlichen Intelligenz? Mathematik lässt Sie das viel lockerer sehen. Am Beispiel von Chatbots schauen wir uns mal ganz entspannt einige mathematischen Grundlagen an. Bei der Verwendung spezifischer eigener KI-Tools, z.B. per API-Schnittstelle angeschlossene Auswertungstools in der Produktion gelten diese mathematischen Grundlagen aber ebenfalls.
Mathematik = Grundlage der künstlichen Intelligenz
Es ist jedem zu empfehlen sich einmal mit dem so ungeliebten Thema Mathematik in diesem Zusammenhang auseinanderzusetzen. Ohne Statistik, Stochastik, Kombinatorik, Mengenlehre oder Logik keine KI. Ohne Mathematik funktionieren diese „ALGORITHMEN“ nicht, die die Basis der KI-Systeme bilden. Man stellt sich jetzt am besten ein leichtes Echo im Nachhall dieses Wortes vor. Manche verwenden dieses Wort, als wäre es der Heilige Gral.
Ein neuer Pragmatismus ist angebracht
Seit kurzem gibt es die ersten mahnenden Worte. Oftmals sind neuste Studien die Basis für einen neuen Pragmatismus und die wissenden Gemüter kühlen langsam ab. Eine aktuelle Studie der Cornell-Universität* ist hier absolut lesenswert. Man kann sich diese Studie übrigens bei Bedarf durch eine KI in jede gewünschte Sprache übersetzen lassen, die der jeweilige Chatbot anbietet (Es gibt einfach tolle KI-Tools).
Zusammengefasst stellt die Studie fest, dass Chatbots eigentlich nur das Internet „auswendig lernen“ und ein Match zwischen der interpretierten Frage des Nutzers mit den auffindbaren Daten auf Basis mathematischer Berechnungen stattfindet. Bei all dem handelt es sich aber nicht um eine „Künstliche Intelligenz“. Noch einmal langsam zum Mitlesen: Es handelt sich nicht um eine „Künstliche Intelligenz“!
Aber man „erlebt“ die Kommunikation mit dem Chatbot so, als ob da jemand lebendiges antwortet. In der ersten Zeit der Nutzung sind viele so ehrfürchtig, dass sie sich im Chat bedanken oder eine Frage an den Chatbot mit „Bitte“ anfangen. Wow, würden wir mal die gleiche Höflichkeit im Alltag anwenden. Spaß beiseite, das Thema „Prompten“, sprich die Art, Umfang und Vorgabe einer Anfrage in ein Chatbot, ist ein ganz eigenes und wichtiges Thema und benötigt Übung (Auch hier gibt es übrigens eigene Tools zum besten Prompten, um den richtigen „Ton“ zu treffen). Auch hier gilt: Sind Sie KI-fit?
Statistik ist die Basis und Teil vieler Algorithmen
Bei der Kommunikation in einem Chat kommt augenblicklich die Mathematik ins Spiel. Sehr stark vereinfacht wird die Anfrage in einzelne Text-Bausteine (Token) zerlegt, diese dann interpretiert und anschließend mit Treffern im Internet abgeglichen. Referenzen, Verweise und Aufrufe der gefundenen Informationen werden gegeneinander abgewogen und durch statistische Abgleiche vorsortiert. Die KI erstellt dann in „Windeseile“ eine Antwort unter Berücksichtigung von Sprache, Grammatik und Vokabular die gewünschte Zusammenfassung (Ebenfalls eine absolut erstaunliche KI-Fähigkeit, die übrigens selbst durch KI-Forscher noch nicht im Detail erklärbar ist).
Statistik ist Basis dieser Vorgänge der Extraktion der Token einer Frage im Chat, diese mit den Informationen im Internet abzugleichen und der anschließenden Insertion, dem Zusammenfügen der Informationen. Dieses Abwägen wird durch statistische Verfahren in den mathematischen Formeln der Algorithmen unterstützt bzw. vorgegeben.
Ein Sportwagen, der unter den Tisch fällt
In der Statistik arbeitet man dabei u.a. mit Mittelwerten. Es werden oft unter Zuhilfenahme mathematischer Anwendungen die Daten auswertbar herausgearbeitet. So kann allerdings ein Mittelwert ein Ergebnis vollkommen falsch darstellen. Der Median der Daten hingegen gleicht die Ausreißer in der Messung aus und ermöglicht es statistisch relevante Inhalte zu extrahieren. So ist bei fünf Fahrzeugen ein italienischer Sportwagen viel schneller als die übrigen Alltagsfahrzeuge. Er würde also die durchschnittliche Geschwindigkeit aller Fahrzeuge, den Mittelwert, erheblich erhöhen. Deshalb sortiert man solche Ausreißer aus und arbeitet mit dem Median und nicht dem Mittelwert. Der Sportwagen würde also schlicht unter den Tisch fallen.
Der Algorithmus berücksichtigt diese Unterscheidung beispielsweise, wenn wir bei den Eingaben im Chat Einschränkungen machen. Beispielsweise können wir Sportwagen im oberen Beispiel in der Fragestellung ausschießen. Bei falscher Fragestellung kann es also zu „falschen“ Antworten kommen, obwohl die KI dazu gar nichts kann. Es war ein Fehler beim Prompten. Aber auch der Verlauf eines Chats kann Einfluss auf das Ergebnis haben. Ein Chatbot berücksichtigt nämlich den vorhergehenden Chat-Verlauf an Fragen und Antworten, wenn wir dies nicht explizit ausschließen oder einen neuen Chat starten.
Stochastik, was war das nochmal?
Mit dem Wissen, dass diese Kommunikation auf statistischen Verfahren beruht, erklären sich auch Phänomene wie das „Halluzinieren“. Je tiefer nachgefragt wird, umso mehr treiben wir den Chatbot in die Enge. Der „Zwang“ der KI zu antworten steht hier im Gegensatz zu den vorliegenden, statistisch messbaren und verwertbaren Informationen. Hier kommen neben Statistik auch die Stochastik ins Spiel. Je mehr nachgebohrt wird, umso mehr, und damit, umso weniger wahrscheinliche Antworten kommen zur Anwendung.
Nun besagt die simple Pfadmultiplikationsregel in der Stochastik, dass die Multiplikation von Ereignissen (in unserem Fall die Informationsebenen) dazu führt, dass das Ergebnis immer unwahrscheinlicher wird. Vereinfacht als Beispiel: die erste Information lag noch bei einer Genauigkeit von 95%. Beim Nachfassen bei der KI in der nächsten Ebene sind die Details vielleicht nur noch zu 90% akkurat. Z.B. die Nachfrage nach Beispielen führt hierzu. Dann liegt die Akkuratesse in der nächsten Detailebene vielleicht nur bei 85% usw. mit jedem weiteren Nachfragen sinkt das Niveau weiter ab.
Reichen 50 % als Basis einer Entscheidung?
Im Ergebnis entspricht die Richtigkeit der gesamten Antwort in der entsprechenden Detailtiefe dann aber nicht den 95% der ersten Ebene, sondern nur der Richtigkeit in der entsprechenden Ausmultiplikation aller Pfande. Im oberen Beispiel in der dritten Ebene (dritte Nachfrage) wäre die Gesamtantwort also nur noch zu knapp 73% richtig (95% mal 90% mal 85%). Gehen wir noch eine Ebene hinunter, liegen wir schon fast beim Zufall. Der liegt bei 50%. Reichen dann diese Informationen noch als Basis einer Entscheidung?
Durch geschicktes „Prompten“ lässt sich die Genauigkeit verbessern. Allerdings, ist hier viel Übung und auch Verständnis zu den Ergebnissen notwendig. Übrigens gibt es starke Auswirkungen in der Zukunft zur Aufgabenverteilung in Unternehmen. Viele Rechercheure prompten und unterstützen wenige Redakteure, sprich Wissende, die eine Bewertung der Ergebnisse vornehmen können. Aber das ist ein eigenes Thema für das Personalwesen.
Schweigsame Anbieter
Interessant sind Veröffentlichungen bzw. keine Veröffentlichung vieler KI-Anbieter genau zu diesem Thema. Wer gesteht schon gerne ein, dass die Ergebnisse viel schlechter sind als allgemein angenommen. Hier muss man die Anbieter dann etwas in Schutz nehmen. Es ist schlicht unmöglich zu sagen, wie genau die Antworten sein werden aufgrund unzähliger Multiplikationsmöglichkeiten der Fragestellungen und der Nachfragen. Wenn überhaupt, werden für die erste Frage prozentuale Korridore für die Verlässlichkeit der Antworten genannt – und diese liegen meist nicht zwischen 90% bis 100%.
Noch etwas Mathematik gefällig? Gerne, wie wäre es mit der Mengenlehre?
Teilmenge, Schnittmenge, Vereinigungsmenge bekommen die meisten noch sofort hin. Bei Differenzmenge und symmetrischer Differenz wird es schon schwieriger und erst recht bei Grundmenge und Komplement, die sich auch noch aufeinander beziehen.
Kleiner Test dazu. Einfach mal einen längeren gut bekannten oder eigenen Text als PDF durch eine KI zusammenfassen lassen, also eine Teilmenge bilden (Ein weiteres tolles Feature der KI-Welt).
Wenn aus hundert Seiten erst noch 60 werden, der KI ruhig zwei dreimal per korrigiertem Prompt in den Hintern treten und weiter zusammenfassen lassen. Spätestens bei einer Zusammenfassung auf eine Seite oder darunter sind dann viele Informationen nicht mehr so ganz richtig. Bei eigenen Texten fällt einem das schnell auf.
Diese „manuelle Extraktion“ der Informationen erstellt auch ein Chatbot. Setzt man den eigenen Text allerdings ins Verhältnis von hunderten oder tausenden Texten im Internet zu diesem Thema, die durch eine KI auf drei vier Absätze eingedampft werden, kann man sich vielleicht vorstellen, wie akkurat das Ergebnis nur noch ist. Gerade neue Themen oder stark umstrittene Themen führen hier in die Irre. Es hilft der Einsatz mehrerer Chatbots deren Ergebnisse man dann kombiniert und selbst noch einmal die Quellen prüft (Hier gibt es übrigens auch Chatbots, die gleich die Quellen der Informationen mitliefern). Prompten Sie mal nach Sinnhaftigkeit von Impfungen aus Sicht eines Schweizer Bürgers und vergleichen sie dies mit anderen Ländern; die Schweizer mögen mir das Beispiel verzeihen, aber es ist ein tolles Beispiel.
Übertragen auf die Mengenlehre zeigt dies, dass eine KI basierend auf den gestellten Fragen irgendwann entscheiden muss, was ist noch Teilmenge eines relevanten Ergebnisses – und was kann und muss sie wegfallen lassen. Ein endloser Text aller Informationen als Grundmenge ist ja nicht das, was wir erwarten.
Komplexe aktuelle Informationslage
Und die Welt ist keine Scheibe und ganz einfach aufgebaut mit Sphären und Schalen, auch wenn dies in den letzten Jahren vermehrt zu hören war. Die uns bekannte Welt ist eine komplizierte und komplexe Welt. Viele Dinge hängen miteinander zusammen, sind also kompliziert, und verändern sich mit- und zueinander permanent, sind also komplex. Somit verändert sich permanent die aktuelle Informationslage.
Das heißt, es gibt keine einfachen, simplen Erklärungen für vieles in der Welt. Dies gilt für alle Menschen und erst recht für Entscheider in Unternehmen. Bei Letzteren gibt ein ständiges Abwägen von Parametern, die sich auch noch verändern. Und alle haben Auswirkungen auf die Existenz des Unternehmens. Hier lohnt ein zusätzlicher Blick in die Kombinatorik.
Wie geht es weiter – KI im Unternehmen umsetzen
Ihnen raucht der Kopf? Unterstützung gesucht? Wenden Sie sich für den Auf- und Ausbau Ihrer KI-Fitness an Experten für den effektiven Einsatz von Künstlicher Intelligenz (KI) in Ihrem Unternehmen. KI-Schulungen und produktunabhängige KI-Beratung helfen Ihnen, das volle Potenzial der KI für Ihr Unternehmen zu erschließen.
Unsere 10-seitige Checkliste KI/LLM-Umsetzung zu : (1) Planung & Vorbereitung, (2) Umsetzung & Einführung und (3) Nutzung & Betrieb und in Maßnahmen, Notwendigkeit und Priorität bietet Ihnen viel Input. Und Sie können die Frage „Sind Sie KI-fit“ schon etwas leichter beantworten.
*Quelle: Cornell University
Bild: KI-generated