Eine Einführung
Lesezeit: ca. 15 Minuten
In unserer Welt taucht immer häufiger der Begriff künstliche Intelligenz, kurz KI oder Englisch AI auf. Spätestens mit der Einführung von Meta AI in WhatsApp ist KI in unserer Gesellschaft sehr deutlich präsent. Schaut man sich heute im Internet etwas um, dauert es nicht lange, bis man auf KI-Systeme stößt: Unter Produkten bei Amazon fasst eine KI die Bewertungen zusammen, Suchmaschinen wie Brave liefern zusätzlich KI-Antworten und Microsoft Copilot soll uns nun am PC helfen.
Der Anfang
Wir schreiben das Jahr 2022 als wie aus dem Nichts etwas Neues die Bühne betritt: ChatGPT. Ein Chatbot, das heißt ein Computerprogramm, mit dem man sich wie mit per Texteingabe unterhalten kann, erobert in wenigen Tagen die Welt. Das US-Unternehmen dahinter, OpenAI, registriert in nur fünf Tagen nach der Veröffentlichung der Software rund eine Million Nutzende weltweit.
Die Gespräche sind schon in 2022 von vergleichsweise guter Qualität, ChatGPT antwortet oft richtig, versteht Zusammenhänge und scheint mühelos einen sinnvollen Dialog mit Menschen führen zu können. Das unterscheidet diese KI auch von bekannten Systemen wie etwa Amazon Alexa oder Google Assistant. Statt auf einfache Befehle zu reagierten, unterhält sich die Anwendung menschlich, erinnert sich an Gesagtes und kann dabei quasi jede Frage beantworten und sogar kreativ handeln.
Von 0 auf 100
Nur einige Monate vergingen, bis OpenAI eine neue Version von ChatGPT veröffentlichte und ein kostenpflichtes Abonnement für bessere Funktionen einführte. Das Geschäft mit KI und die öffentliche Aufmerksamkeit lockten natürlich auch bekannte Konzerne auf den neu entstehenden Markt. Anfang 2023 zeigt Microsoft Interesse an OpenAI und kauft sich schließlich in das Unternehmen ein. Etwa zum selben Zeitpunkt veröffentlicht der Facebook-Entwickler Meta sein eigenes KI-Modell: Llama. Wenige Monate danach, Mitte 2023, bringt dann auch der Suchmaschinenriese Google seinen Chatbot Bart (heute Gemini) auf den Markt. Auch viele kleine, junge Unternehmen gründeten sich, mit dem Ziel eine noch bessere KI zu entwickeln, darunter auch etwa das europäische Unternehmen Mistral AI.

Nur Chats? Da geht doch mehr!
Heute können KI-Modelle weit mehr als nur einfache Gespräche führen. Eine der wohl interessantesten Entwicklungen ist, dass ChatGPT bei einer Spracheingabe die Emotionen des Menschens aus der Stimmlage lesen kann. So reagiert die KI etwa auf ein leichtes, genervtes Stöhnen. Auch Bilder und ganze Videos lassen sich heute mühelos in sekundenschnelle durch KI erzeugen. Dies geht aber auch in die andere Richtung: Bilder, die mit der Anwendung geteilt werden können von der KI haargenau beschrieben werden. Selbst Musik kann von der Software komponiert werden. Auch absurdeste Dinge, wie etwa ein Gedicht über Äpfel im Weltall im Stil von Goethe, lassen sich erzeugen. Heute können viele KIs auch das Internet nach aktuellen Informationen durchsuchen, so wird es möglich sich Dinge wie das Wetter oder das Ergebnis eines Fußballspiels nennen zu lassen. Gemini setzt noch andere Funktionen ein und integriert sich für Zusammenfassungen auf Wunsch in die eigenen E-Mails oder errechnet Routen mit Google Maps. Viele Anwendungen erlauben Spracheingabe, manche Modelle wie Gemini lassen sogar „Telefonate“ zu. Man kann sich dann mit dem Computer unterhalten, wie als würde man mit einem Menschen telefonieren. Auch das „Ins-Wort-Fallen“ klappt.

Wie funktioniert das?
Viele Fachleute meinen, dass der Begriff „Intelligenz“ in diesem Kontext eigentlich das falsche Wort ist. KI ist nämlich nicht wirklich intelligent. Wenn sie auf Fragen antwortet, versteht sie die eigene Antwort nicht und entsprechend eigentlich auch die Frage nicht. Zumindest, wenn man hier nach menschlichen Verhalten misst. Aber wie kann ein Computerprogramm eine Antwort erzeugen, wenn es weder Antwort noch Frage versteht? In einem mehrphasigen Training werden die Sprachmodelle mit zahllosen Daten gefüttert. Mehrere Milliarden Internetseiten, Bücher und Wikipedia-Artikel standen ChatGPT im Training bereit. Aus dieser riesigen Datenmenge lernt das Modell dann mit der Hilfe von menschlichen Trainingspersonal, wie Sprache funktioniert. Hierfür erlernt das Modell aber nicht etwa die Grammatik, es nutzt pure Mathematik. Die moderne Technologie im Hintergrund errechnet einfach immer die Wahrscheinlichkeit, für das, was als Nächstes ideal passt. Fängt ein Satz etwa mit „Das Auto fährt“ an, passt der Wahrscheinlichkeit nach weder „im Himmel.“, noch „im Meer“, sondern nur „auf der Straße“. Natürlich stecken im Hintergrund noch mehr komplexe Technologien, die etwa wichtige Inhalte in Sätzen erkennen können. Aber grundlegend ließe sich eine solche Technik stark vereinfacht und mit scharfer Zunge als „stochastischen Papageien“ bezeichnen. Die Software spricht das aus dem Training nach, was es gelernt hat, das der Wahrscheinlichkeit nach am meisten Sinn ergibt.

Grenzen, Risiken und Nebenwirkungen
Überlegt man sich die Funktionsweise genauer, so erkennt man schon die erste große Grenze: KI versteht nicht, was sie „sagt“. Das sorgt natürlich dafür, dass die Modelle teilweise Fehlinformationen generieren – sogenannte Halluzinationen -oder das Ihre Ausgaben sprachlich keinen Sinn ergeben. Beim Generieren von Bildern treten ebenfalls teilweise Fehler auf. Es kommt zu Fragmenten. Ein Fragment wäre beispielsweise ein fünftes Bein an einem Pferd oder wie im Bild oben eine Ampel mit drei roten Lichtern. Viele KI-Hersteller versuchen derweil den Halluzinationen mit viel Training und der Angabe von Quellen in den Ausgaben entgegenzuwirken. Dennoch darf man den Aussagen eines Sprachmodells nie vollständig vertrauen. Wie jede neue Technologie, kann auch KI von bösen Menschen für böse Dinge genutzt werden. Das beste Beispiel ist hier wohl Phishing. Die betrügerischen Mails lassen sich jetzt per künstlicher Intelligenz erzeugen und damit entfallen Rechtschreib- und Grammatikfehler, die früher ein eindeutiges Indiz für Phishing-Mails waren. Auch generierte Bilder aus Kriegsgebieten oder mit prominenten Persönlichkeiten können in entsprechenden Kreisen gefährlich werden. In der Vergangenheit tauchte ein Bild vom US-Präsidenten Donald Trump auf, wie er von der Polizei auf der Straße weggetragen wird. Diese Szene ist nie passiert, eine Software hat das echtwirkende Foto auf Anweisung generiert. Zuletzt gibt es dann noch Bedenken hinsichtlich Datenschutz und Urheberrecht. Die Daten mit denen die Modelle trainiert wurden, waren oft urheberrechtlich geschützt, viele sind nicht damit einverstanden, dass eine KI mit den eigenen Inhalten trainiert wurde. Chats werden oft mitgelesen, von Trainingspersonal, das versucht, die Anwendungen zu verbessern – ein riesiges Datenschutzproblem. Am Ende verursacht der Betrieb solcher Programme einen extremen CO2-Ausstoß, aufgrund sehr hohen Energiebedarfs.
Eine kleine Übersicht
Alle hier aufgelisteten Modelle sind auf Deutsch verfügbar.
Name | Hersteller | Preis je Monat | Anmerkung |
ChatGPT | OpenAI | kostenlos, Premium ca. 20€ | am Bekanntesten |
Gemini | kostenlos, Premium ca. 20€ | kann auf Wunsch auf andere Google-Dienste zugreifen | |
Copilot | Microsoft | kostenlos, Premium ca. 22€ | im Office-Abo erhältlich |
Leo | Brave | kostenlos, Premium ca. 15€ | im Brave-Browser oder als Website |
Perplexity | Perplexity | kostenlos, Premium ca. 20€, | durchsucht bei jeder Anfrage das Internet und gibt Quellen an |
Le Chat | Mistral AI | einige Nachrichten kostenlos, Premium ca. 15€ | Made in Europe |
Apple Intelligence | Apple | kostenlos | nur auf ausgewählten Apple-Geräten |
Fazit und Empfehlung
Ich selbst habe schon einige KI-Anwendungen durchprobiert und auch schon eine kleine KI auf meinem eigenen Server betrieben. Für mich war Le Chat am Ende die beste Option. Die Antworten sind wirklich gut, der europäische Standort erlaubt sehr guten Datenschutz, die generierten Bilder schauen fast immer ordentlich aus. Für Menschen mit Telekom-Vertrag könnte sich Perplexity lohnen, da die Telekom das Premium-Abo ein Jahr kostenlos bereitstellt. Von Meta AI würde ich abraten, die Ausgaben sind teils wirklich schlecht, von der nicht vermutlich vorhandenen Privatsphäre der Chats mal abgesehen. Gemini ist wahnsinnig umfangreich, greift aber auch extrem ins eigene Leben.