Top-Fragen
Zeitleiste
Chat
Kontext

Apertus

Mehrsprachiger Open-Source-Chatbot, entwickelt von Swiss AI Aus Wikipedia, der freien Enzyklopädie

Remove ads

Apertus ist ein großes Sprachmodell (engl. Large Language Model, kurz LLM), das von Forschern in der Schweiz entwickelt wurde.[1] Apertus wurde im September 2025 vorgestellt und gilt damit als das erste große Sprachmodell aus der Schweiz. Es ist vollständig als Open Source verfügbar; auch der Quellcode des Trainingsprozesses sowie die Trainingsdaten sind offengelegt.[2][3]

Schnelle Fakten Basisdaten ...

Es wird als erstes großes Sprachmodell bezeichnet, welches die Transparenzpflichten der KI-Verordnung der Europäischen Union (engl. EU AI Act) vollständig erfüllt.[1] Für das Training wurden über 1000 Sprachen inkludiert, die in vergleichbaren Modellen unterrepräsentiert sind.[4]

Remove ads

Projektorganisation

Das Sprachmodell entstand durch Zusammenarbeit der ETH Lausanne (französisch EPFL), der ETH Zürich und des Centro svizzero di calcolo scientifico (CSCS), welches den Supercomputer Alps betreibt.

Eigenschaften

Zusammenfassung
Kontext

Apertus ist ein Basismodell vom Typ Generativer vortrainierter Transformer (GPT). Es ist vergleichbar mit den Modellen, die ChatGPT zugrunde liegen, und besteht aus gestapelten Transformer-Decodern. Das Modell wurde in zwei Größen (8 Milliarden und 70 Milliarden Parameter) veröffentlicht, von beiden existiert zudem eine auf Instruktionen finegetunte Version.[4] Trainiert wurde mit 15 Billionen Worteinheiten (Tokens) aus über tausend Sprachen,[2] darunter bewusst viele Quellen auf Sprachen, welche in vergleichbaren Modellen untervertreten sind, wie Schweizerdeutsch und Rätoromanisch.[2][5][6] Hierzu wurde eine eigene Methode zur Worteinbettung zur Qualitätsfilterung entwickelt,[7] und der Tokenizer in vielen Sprachen analysiert.[8] Im Zuge der Entwicklung des Modells wurden zudem weitere Komponenten optimiert und teils neu entwickelt, wie z. B. ein Optimierer sowie eine neue Aktivierungsfunktion.[9]

Die Entwicklung von Apertus erfolgte unter Berücksichtigung der Schweizer Datenschutzgesetze, des Schweizer Urheberrechts und der Transparenzanforderungen der EU KI-Verordnung. Allerdings wurde nicht bei allen zum Training verwendeten, menschlich erzeugten Textquellen die Erlaubnis für deren Verwendung formal eingeholt. Für das KI-Training gesperrte öffentliche Texte wie z. B. diejenigen der New York Times wurden dagegen nicht verwendet[10][11] – im Gegensatz zu bekannteren Sprachmodellen kommerzieller Anbieter, welche urheberrechtlich geschützte Inhalte ohne Bewilligung verwendeten.[12] Die Entwickler versprechen, Wünsche von Urheberrechtsbesitzern zur Entfernung ihrer allenfalls im Modell verwendeten Quellen nachzukommen (engl.: Opting-out requests).[1]

Zum Stand der Veröffentlichung umfasst Apertus noch keine multimodale Benutzerschnittstelle und ist deshalb noch kein vollständiger Chatbot. Auch ist die Komplexität des Sprachmodells (Anzahl Schichten und Parameter) kleiner als bei den leistungsfähigsten Chatbots kommerzieller Hersteller. Die Modelle sollen laufend weiterentwickelt werden.

Als umfassend offengelegte KI-Basistechnologie will Apertus Kleinunternehmen und Anwendern in unterschiedlichen Bereichen die Entwicklung eigener KI-Lösungen bei relativ geringem Aufwand ermöglichen.[13][14]

Remove ads

Partnerschaften

  • Swisscom stellt eine speziell entwickelte Schnittstelle zur Verfügung, die das Arbeiten mit dem Modell erleichtert. Geschäftskunden von Swisscom haben Zugriff auf das Apertus-Sprachmodell über die Swiss AI Platform von Swisscom.[15]

Einzelnachweise

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads