Top-Fragen
Zeitleiste
Chat
Kontext
Apertus
Mehrsprachiger Open-Source-Chatbot, entwickelt von Swiss AI Aus Wikipedia, der freien Enzyklopädie
Remove ads
Apertus ist ein großes Sprachmodell (engl. Large Language Model, kurz LLM), das von Forschern in der Schweiz entwickelt wurde.[1] Apertus wurde im September 2025 vorgestellt und gilt damit als das erste große Sprachmodell aus der Schweiz. Es ist vollständig als Open Source verfügbar; auch der Quellcode des Trainingsprozesses sowie die Trainingsdaten sind offengelegt.[2][3]
Es wird als erstes großes Sprachmodell bezeichnet, welches die Transparenzpflichten der KI-Verordnung der Europäischen Union (engl. EU AI Act) vollständig erfüllt.[1] Für das Training wurden über 1000 Sprachen inkludiert, die in vergleichbaren Modellen unterrepräsentiert sind.[4]
Remove ads
Projektorganisation
Das Sprachmodell entstand durch Zusammenarbeit der ETH Lausanne (französisch EPFL), der ETH Zürich und des Centro svizzero di calcolo scientifico (CSCS), welches den Supercomputer Alps betreibt.
Eigenschaften
Zusammenfassung
Kontext
Apertus ist ein Basismodell vom Typ Generativer vortrainierter Transformer (GPT). Es ist vergleichbar mit den Modellen, die ChatGPT zugrunde liegen, und besteht aus gestapelten Transformer-Decodern. Das Modell wurde in zwei Größen (8 Milliarden und 70 Milliarden Parameter) veröffentlicht, von beiden existiert zudem eine auf Instruktionen finegetunte Version.[4] Trainiert wurde mit 15 Billionen Worteinheiten (Tokens) aus über tausend Sprachen,[2] darunter bewusst viele Quellen auf Sprachen, welche in vergleichbaren Modellen untervertreten sind, wie Schweizerdeutsch und Rätoromanisch.[2][5][6] Hierzu wurde eine eigene Methode zur Worteinbettung zur Qualitätsfilterung entwickelt,[7] und der Tokenizer in vielen Sprachen analysiert.[8] Im Zuge der Entwicklung des Modells wurden zudem weitere Komponenten optimiert und teils neu entwickelt, wie z. B. ein Optimierer sowie eine neue Aktivierungsfunktion.[9]
Die Entwicklung von Apertus erfolgte unter Berücksichtigung der Schweizer Datenschutzgesetze, des Schweizer Urheberrechts und der Transparenzanforderungen der EU KI-Verordnung. Allerdings wurde nicht bei allen zum Training verwendeten, menschlich erzeugten Textquellen die Erlaubnis für deren Verwendung formal eingeholt. Für das KI-Training gesperrte öffentliche Texte wie z. B. diejenigen der New York Times wurden dagegen nicht verwendet[10][11] – im Gegensatz zu bekannteren Sprachmodellen kommerzieller Anbieter, welche urheberrechtlich geschützte Inhalte ohne Bewilligung verwendeten.[12] Die Entwickler versprechen, Wünsche von Urheberrechtsbesitzern zur Entfernung ihrer allenfalls im Modell verwendeten Quellen nachzukommen (engl.: Opting-out requests).[1]
Zum Stand der Veröffentlichung umfasst Apertus noch keine multimodale Benutzerschnittstelle und ist deshalb noch kein vollständiger Chatbot. Auch ist die Komplexität des Sprachmodells (Anzahl Schichten und Parameter) kleiner als bei den leistungsfähigsten Chatbots kommerzieller Hersteller. Die Modelle sollen laufend weiterentwickelt werden.
Als umfassend offengelegte KI-Basistechnologie will Apertus Kleinunternehmen und Anwendern in unterschiedlichen Bereichen die Entwicklung eigener KI-Lösungen bei relativ geringem Aufwand ermöglichen.[13][14]
Remove ads
Partnerschaften
Weblinks
- publicai.co Eine Anwenderschnittstelle von Apertus
- Download und Steckbriefe der Modelle inklusive Codebeispielen und Kurzanleitung im Hugging Face Hub
- Apertus: Präsentation des offenen Schweizer Sprachmodells – Einblicke für Politik und Verwaltung.
Einzelnachweise
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads