Forschen an ChatGPT „made in Germany“

Das Thema Künstliche Intelligenz ist dank ChatGPT in aller Munde. Wie die dahinterliegenden Sprachmodelle funktionieren und wie intelligent sie wirklich sind, erklärt Prof. Dr. Alexander Löser, Fachbereich VI, in unserer Reihe „Drei Fragen, drei Antworten“. Außerdem fordert er Sprachmodelle „made in Germany“ für die deutsche Wirtschaft.

Prof. Dr. Alexander Löser, Fachbereich VI
Prof. Dr. Alexander Löser, Fachbereich VIBild: Felix Noak

Die Faszination für Künstliche Intelligenz (KI) ist groß, zurzeit besonders für ChatGPT, dem Sprachmodell von OpenAI. Allgemein gefragt: Wie intelligent ist KI?

Wenn die KI selbstständig Artikel schreibt, Menschen beim Schach besiegt, anhand eines Textes ein Bild im Stil von van Gogh malt, die gesprochene Sprache versteht oder bei ärztlichen Diagnosen unterstützt – dann sind die Menschen überrascht und denken, die KI wäre intelligent. In der Tat haben im Hintergrund große vortrainierte maschinelle Modelle gearbeitet. Sie tragen Namen wie ChatGPT, DALL-E, Midjourney oder WHISPER.

Das Sprachmodell hinter ChatGPT hat quasi Millionen Menschen beim Sprechen zugeschaut und zwar über die alltäglichen Text-Daten, die wir im Internet hinterlassen. In ihrer Sprache unterscheiden sich die Menschen sehr aufgrund ihres kulturellen Hintergrunds, Berufs, Alters und so weiter. Aus dieser Vielfalt hat das Modell viele Arten von Prozessen gelernt, wie wir Sprache erzeugen, Wort für Wort. Das Modell versteht allerdings nicht, was es für uns bedeutet, wenn der gesamte Frühling verregnet ist.

Es kann dafür sehr gut ähnliche, vorher beobachtete Sprachprozesse identifizieren, die von Dauerregen handeln und das über viele Tausende Wörter. Je länger die Sequenz ist, desto unsicherer ist das Modell allerdings, was das nächste Wort sein könnte. Unternehmen versuchen mit immer mehr Investments in Hardware, Daten und Talenten, noch längere Sequenzen zu erzeugen.

Welche Bedeutung besitzen große Sprachmodelle für Deutschland?     

Sprache spielt eine zentrale Rolle,wie wir kommunizieren, wie wir lernen, wie wir politische und hoheitliche Maßnahmen organisieren, in der Medizin, im beruflichen Alltag oder wie wir die Emotionen und Komplexität unseres Lebens vermitteln. Unsere Sprache, mit der wir im Internet kommunizieren, wird derzeit jedoch oft umgeleitet – über Microsoft Office, Google, Facebook und andere Anwendungen. Unternehmen außerhalb Deutschlands erstellen auf diese Weise Sprachmodelle und Tools wie ChatGPT oder BARD und steuern damit wichtige Wertschöpfungsketten. Wir benötigen daher kontinuierliche Investitionen für ein Ökosystem für öffentlich verfügbare Sprachmodelle „made in Germany“.  

Zu welchen KI-Themen wird an der BHT geforscht?

Wenn wir vor dem Hintergrund demographischer Herausforderungen zukünftig mehr Routinetätigkeiten an Maschinen abgeben wollen, besteht die Herausforderung darin, Verfahren zu entwickeln, die mit begrenzter und lokaler Hardware, wenigen Daten und wenigen Expert*innen trotzdem eine verlässliche Aussage treffen können. Das liegt daran, dass bestimmte Branchen keine Daten an US-Unternehmen senden wollen. Sie benötigen lokale Modelle, die auf Augenhöhe mit den Modellen wie von OpenAI sind, deutlich weniger kosten und auf bestimmte Aufgaben spezialisiert sind.

An der BHT arbeiten wir daran im Forschungsverbund Data Science +X. Es geht um Verfahren, die auf Bild, Text oder zeitbasierten Daten basieren. Wir arbeiten auch an Daten, die aus Haptik und Kommunikation zwischen Benutzer*innen und Anwendung gewonnen werden. Ein Großteil dieser methodenzentrischen Verfahren hat das Ziel, Objekte zu erkennen oder Zustände zu klassifizieren. Wir forschen genauso an datenzentrischen Verfahren, zum Beispiel, wie sich lückenhafte Datensätze mit synthetischen Daten aufwerten lassen. Anwendungsgebiete liegen in der Medizin und der Biologie, in der Simulation virtueller Umgebungen oder der Unterstützung der Industrie im Supply Chain Management.

Damit adressieren wir wichtige Themen am Standort Deutschland und leisten aber auch international anerkannte Grundlagenforschung. Kürzlich haben wir beispielsweise das erste deutsche Sprachmodell für die Gesundheitsbranche veröffentlicht.


Weitere Informationen und Kontakt


Zurück