heise+ | Verschiedene Formate von Sprachmodellen im Überblick

Inhaltsverzeichnis Verschiedene Formate von Sprachmodellen im Überblick Unsichere Serialisierung mit pickle Das Safetensors-Format Das GGUF-Format für quantisierte LLMs Fazit Artikel in iX 4/2025 lesen Wer generative KI lokal betreiben möchte, kann sich unzählige Sprachmodelle in verschiedenen Größen bei Hugging Face herunterladen. Allerdings liegen sie dort in vielen unterschiedlichen Formaten vor – und nicht jedes ist für jede Software geeignet. Außerdem gibt es spezifische Vor- und Nachteile der verschiedenen Formate. Egal, ob GPT- oder BERT-Modelle – ein Large Language Model (LLM) enthält große Mengen an Daten unterschiedlicher Art. Zum einen sind das die Gewichte des zugrunde liegenden tiefen neuronalen Netzwerks, zum andern viele Metainformationen. Da es sich um Sprache handelt, ist auch eine Vorschrift enthalten, wie das Modell Texte in kleinere Bestandteile, die Token, zerlegt. iX-tract Sprachmodelle liegen bei Hugging Face immer als Git-Repositorys vor und enthalten neben den Gewichten auch Metadaten. Das Safetensors-Format ist eine sicherere und flexiblere Alternative zum Serialisieren mit Pythons pickle. GGUF aus dem llama.cpp-Projekt ist für lokal eingesetzte quantisierte Modelle das übliche Format. Prof. Christian Winkler is a data scientist and machine learning architect. He holds a PhD in theoretical physics and has been working in the field of big data and artificial intelligence for 20 years, with a particular focus on scalable systems and intelligent algorithms for mass text processing. As a professor at Nuremberg Institute of Technology, his research focuses on the optimization of user experience using modern methods. He is the founder of datanizing GmbH, a speaker at conferences and author of articles on machine learning and text analytics. Auf der Website von Hugging Face kann man das gut sehen, exemplarisch zeigt es die erste Abbildung für eines der ersten BERT-Modelle. Auch modernere Modelle sind nach einem ähnlichen Schema aufgebaut. Zunächst wird deutlich, dass es sich bei allen Modellen um Git-Repositorys handelt. Und wie auch von GitHub bekannt gibt es hier ein README.md und eine LICENSE-Datei. Das Git-Format ist praktisch, weil man mit den üblichen Tools darauf zugreifen kann. Klonen sollte man diese Repositorys aber nicht, denn durch das Speichern der Git-Metainformationen nehmen die Modelle noch mehr lokalen Speicherplatz in Anspruch. Um die Modelle dennoch lokal auszuführen, kann man entweder direkt die Transformers-Bibliothek von Hugging Face in einem Python-Programm verwenden oder die entsprechenden CLI-Tools wie huggingface_hub. Das war die Leseprobe unseres heise-Plus-Artikels "Verschiedene Formate von Sprachmodellen im Überblick". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.

heise online

2025-04-01

James Whitmore

Related News

Business

Kriminalität: Mann wegen Anschlagsplänen auf Synagoge in Halle in Haft

Wegen Anschlagsplänen auf die Synagoge in Halle ist ein 19-Jähriger in Haft. Der Mann soll sein rechtsextremistisch motiviertes Vorhaben wiederholt in einer Telegram-Chatgruppe angekündigt und sich i… [+1639 chars]

Die Zeit

few moment ago

Business

Fußball-Bundesliga: FC Augsburg verlängert Vertrag mit Ersatztorwart Klein

Der FC Augsburg vertraut auch künftig Ersatztorwart Daniel Klein. Wie der Fußball-Bundesligist mitteilte, wurde der im Sommer auslaufende Vertrag um ein Jahr bis zum 30. Juni 2026 verlängert. Der ge… [+621 chars]

Die Zeit

few moment ago

Business

Haushalt: Haushaltsjahr: Frankfurt mit 212 Millionen Euro im Plus

Die Stadt Frankfurt hat zum vierten Mal in Folge ihr Haushaltsjahr mit einem Überschuss abgeschlossen. Das Plus im Jahr 2024 betrug rund 212 Millionen Euro. «Das Jahr ist deutlich besser gelaufen als… [+2087 chars]

Die Zeit

few moment ago

Business

Ermittlungserfolg: Verdächtiger nach Millionen-Coup in Strausberg gefasst

Zwei Jahre nach einem spektakulären Millionen-Coup von Tresorknackern in Strausberg bei Berlin hat die Polizei einen Tatverdächtigen gefasst. Der 23-Jährige wurde am Morgen in Berlin festgenommen, wi… [+2483 chars]

Die Zeit

few moment ago

Business

ING: Das sind die Neuerungen bei den Überweisungslimits

Die ING passt ihr Online-Banking an. Ab Mitte Mai führt das Geldinstitut ein überarbeitetes System für Überweisungslimits ein, das sowohl in der Banking-App als auch im Browser-Banking einheitlich fu… [+1465 chars]

Caschys Blog

few moment ago

Business

Spanische Justiz prüft „Sabotage“ als Ursache für Stromausfall

Nach dem massiven Stromausfall auf der iberischen Halbinsel geht die spanische Justiz dem Verdacht einer Computer-Sabotage als Ursache nach. Ein Richter der Audiencia Nacional, Spaniens für die Verfo… [+3765 chars]

Faz.net

few moment ago

Business

Jasmin Wagner: "Nabelpiercing? Hätte ich gern gehabt"

Unter dem Künstlernamen Blümchen war Jasmin Wagner in den Neunzigern Deutschlands erfolgreichste Sängerin, mit Technopophits wie "Herz an Herz" und "Boomerang" verkaufte sie viele Millionen CDs. Aufg… [+369 chars]

Die Zeit

few moment ago

Business

Antonio Rüdiger: Rüdiger und die Apostel

Natürlich hat sich auch Stefan Effenberg zu dem Fall geäußert. In seiner neuesten Kolumne auf t-online schrieb er, die Debatte um Antonio Rüdiger "mit besonders großem Interesse" zu verfolgen. Schlie… [+698 chars]

Die Zeit

few moment ago

Business

Duolingo setzt auf KI – gegen Fachkräftemangel

Aufgaben, die bisher Menschen gemacht haben, werden künftig von KI erledigt. Das ist der Plan von Duolingo-CEO Luis von Ahn. Doch was zunächst nach Stellenabbau klingt, soll nur zum Wohle der Mitarbe… [+2303 chars]

heise online

few moment ago

Business

Android 16 und mehr: Google veranstaltet eigene Show vor der I/O rund um Android

Mit der "Android-Show" koppelt Google die wichtigsten Ankündigungen rund um das eigene mobile Betriebssystem von der großen Entwicklerkonferenz I/O ab. Die Android-Veranstaltung findet am 13. Mai sta… [+2108 chars]

heise online

few moment ago

Business

Stromausfall: Ein Blackout, den sich keiner erklären kann

Schließen Artikelzusammenfassung Ein plötzlicher Stromausfall in Spanien und Portugal legte weite Teile beider Länder lahm, mit Auswirkungen auf Züge, U-Bahnen, Ampeln, Flugzeuge und mehr. Ursache … [+678 chars]

Die Zeit

few moment ago

Business

heise+ | Duell in der Mittelklasse-CPUs: Intel Core Ultra 200S gegen Ryzen 9000 im Test

Inhaltsverzeichnis Vierzehn Generationen lang setzte Intel auf die Prozessorserie Core i. Diese wird nun von den Core Ultra 200S "Arrow Lake" abgelöst. Nach den übertaktbaren K-Varianten mit hohem t… [+1304 chars]

heise online

few moment ago

Business

KI-Update: KI-Forscher gegen Militärkooperationen, Meta AI Sexting, Cloud Next

Inhaltsverzeichnis Etwa 300 Mitarbeiter von Google DeepMind in London wollen einer Gewerkschaft beitreten nicht wegen Gehaltsfragen, sondern aus ethischen Bedenken. Der Auslöser: Google hat im Febru… [+6798 chars]

heise online

few moment ago

Business

"Arbeitspferde" für die Forschung: Die meistzitierten Paper des Jahrhunderts

Inhaltsverzeichnis Wovon handeln wohl die bisher meistzitierten wissenschaftlichen Paper in diesem Jahrhundert? Von CRISPR-Gentools, mRNA-Impfungen, vom Higgs-Boson oder von Gravitationswellen? Fal… [+3162 chars]

heise online

few moment ago

Business

Polizei: Auto fährt unter Sattelauflieger - ein Schwerverletzter

Ein 26 Jahre alter Autofahrer ist auf der Autobahn 31 nahe Geeste im Emsland mit seinem Wagen unter einen Sattelauflieger geraten und schwer verletzt worden. Der Mann sei am frühen Morgen auf der Aut… [+486 chars]

Die Zeit

few moment ago

Business

Unfälle: 58-Jähriger bei Tauchunfall in Hemmoor schwer verletzt

Bei einem Tauchunfall in einem See in Hemmoor im Landkreis Cuxhaven ist ein Mann schwer verletzt worden. Andere Taucher hätten den 58-Jährigen am Samstagmittag an der Wasseroberfläche bemerkt und ihn… [+696 chars]

Die Zeit

few moment ago

Business

Google beendet Support für alte Nest Learning Thermostate, Rückzug vom EU-Markt

Der Support für die ersten beiden Generationen von Googles Nest Learning Thermostaten endet im Oktober 2025, außerdem zieht sich das Unternehmen mit seinen eigenen Thermostaten aus dem EU-Markt zurüc… [+3247 chars]

heise online

few moment ago

Business

Kurioses: Armband bis Kettensäge - Flughafen versteigert Fundsachen

Wer vergisst eine Kettensäge am Flughafen? Eine Frage, die Rätsel aufgibt. Doch am Münchner Airport fanden sich gleich mehrere dieser Elektrogeräte. Und weil sich niemand für die Fundstücke interessi… [+789 chars]

Die Zeit

few moment ago

Theme

Select Language

heise+ | Verschiedene Formate von Sprachmodellen im Überblick