Die großen Sprachmodelle, die im Zentrum vieler KI-Anwendungen stehen, brauchen zum Lernen riesige Datenbestände. Nun will ein deutsches Konsortium dafür eine europäische Plattform aufbauen.
Auf der neuen Plattform "DataHub Europe" sollen im großen Stil Daten aus Industrie und Medien zusammengeführt, aufbereitet und kuratiert werden, teilten die Gründer auf dem Digital-Gipfel in Frankfurt mit. Hinter dem Projekt stehen Schwarz Digits, die IT- und Digitalsparte der Schwarz Gruppe sowie die Deutsche Bahn AG. Die Schwarz Gruppe ist ein großer Handelskonzern (Lidl, Kaufland), aber auch ein bedeutender IT-Dienstleister.
Laut den Angaben können die Industriepartner die Daten nutzen, um "KI-Modelle in einer sicheren Infrastruktur zu trainieren". Ziel sei, unternehmensspezifische KI-Lösungen schnell und sicher als "echte Werkzeuge" in vielfältigen Geschäftsanwendungen einzubringen.
Aleph Alpha, Stackit und DFKI sind auch beteiligt
"Mit dem DataHub Europe wird eine entscheidende Lücke in der EU geschlossen, indem qualitativ hochwertige Daten für das Training von KI bereitgestellt werden", sagte Digitalminister Volker Wissing (FDP). "Hier entstehen ein spannendes Ökosystem und eine dringend benötigte Datenplattform, die das Training von KI-Modellen für unsere Industrie auf die nächste Stufe hebt."
Bei dem Projekt arbeiten zahlreiche Partner aus Industrie, Technologie, Wissenschaft und Medien zusammen. Die Daten werden unter anderem von der "Frankfurter Allgemeine Zeitung" (FAZ) und DvH Medien ("Wirtschaftswoche" und "Handelsblatt") bereitgestellt. Auf der technischen Seite sind der KI-Experte Aleph Alpha, der Cloud-Anbieter Stackit, das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) und die Technische Universität Darmstadt dabei, um das Training zu ermöglichen.