{"id":12269,"date":"2024-06-17T09:15:06","date_gmt":"2024-06-17T07:15:06","guid":{"rendered":"https:\/\/www.iese.fraunhofer.de\/blog\/?p=12269"},"modified":"2026-01-22T14:12:33","modified_gmt":"2026-01-22T13:12:33","slug":"wie-funktionieren-llms","status":"publish","type":"post","link":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/","title":{"rendered":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle"},"content":{"rendered":"<p class=\"lead\">In diesem Blogbeitrag erkl\u00e4ren KI-Expertinnen und Experten, welche Komponenten zu LLMs (Large Language Models, deutsch: gro\u00dfe Sprachmodelle) geh\u00f6ren.<\/p>\n<h2>Die Funktionsweise eines LLMs: 4 Schritte bis zum Ergebnis<\/h2>\n<p><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/large-language-models-ki-sprachmodelle\/\">Gro\u00dfe Sprachmodelle<\/a>, wie wir sie heute kennen, sind nur die Spitze des Eisbergs. In der Geschichte der <a href=\"https:\/\/www.iese.fraunhofer.de\/de\/trend\/kuenstliche-intelligenz.html\">K\u00fcnstlichen Intelligenz<\/a> wurden Sprachmodelle \u2013 Modelle zur L\u00f6sung sprachbezogener Probleme (\u00dcbersetzung, Klassifikation, Textgenerierung) \u2013 mit Techniken entwickelt, die nicht immer auf neuronalen Netzen basierten (z.B. Hidden-Markov-Modelle). Heute erleben wir die \u00c4ra der Transformator-Modelle (das T in GPT): Neuronale-Netze-Modelle, die auf dem \u00bbAttention\u00ab-Mechanismus aufbauen.<br \/>\nGrunds\u00e4tzlich kann ein Large Language Model (LLM) in vier Hauptteile oder Funktionen unterteilt werden:<\/p>\n<ol>\n<li><strong>Tokenisierung<\/strong> (Tokenizer)<\/li>\n<li>Einbettung (<strong>Embedding)<\/strong><\/li>\n<li>Berechnung der Wahrscheinlichkeit des n\u00e4chsten Tokens (<strong>Vorhersage<\/strong>)<\/li>\n<li>Strategien zur Auswahl der Ausgabe (manchmal auch <strong>Dekodierung<\/strong> genannt).<\/li>\n<\/ol>\n<h3><strong>Tokenisierung:<\/strong> Vom Text zum Token<\/h3>\n<p>Der erste Teil, die Tokenisierung, besteht darin, einen Text in kleinere Teile zu zerlegen. F\u00fcr uns Menschen ist es am nat\u00fcrlichsten, W\u00f6rter als Token zu verwenden. Es gibt verschiedene Tokenisierungstechniken, von der Verwendung einzelner Zeichen \u00fcber mehrere Zeichen (\u00bbn-grams\u00ab, Teilw\u00f6rter) bis hin zu W\u00f6rtern. Die Wahl einer Tokenisierungstechnik ist eine Abw\u00e4gung zwischen zwei ma\u00dfgebenden Parametern. Zum einen wird die Gesamtzahl der m\u00f6glichen Token ber\u00fccksichtigt. Bei der Verwendung von Einzelzeichen in ASCII w\u00fcrden wir potenziell 128 Token erhalten. Bei der Verwendung von W\u00f6rtern im Englischen w\u00e4ren es etwa 200.000 Token. Im Deutschen w\u00e4ren es potenziell mehr. Zum anderen wird der semantische Informationsgehalt betrachtet. Einzelzeichen enthalten im Vergleich zu W\u00f6rtern nicht viele Informationen. Aktuelle LLMs haben auf Tokenisierungsverfahren umgestellt, die Teilworte benutzen. Beispiele hierf\u00fcr sind Byte-Pair Encoding, Wordpiece, Unigram und Sentencepiece.<\/p>\n<figure id=\"attachment_12274\" aria-describedby=\"caption-attachment-12274\" style=\"width: 543px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-12274 size-full\" src=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/tokenizer.png\" alt=\"Funktionsweise LLM: Ein Transformator Modell funktioniert, indem es die Eingabe in Token umwandelt und dann gleichzeitig mathematische Gleichungen ausf\u00fchrt, um Beziehungen zwischen den Token zu ermitteln. - Ein Beispiel f\u00fcr die Tokenisierung des Satzes: &quot;Die Kraftfahrzeug-Haftpflichtversicherung ist eine Pflichtversicherung, die jedes Auto braucht, um auf der Stra\u00dfe fahren zu d\u00fcrfen.&quot;\" width=\"543\" height=\"93\" srcset=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/tokenizer.png 543w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/tokenizer-400x69.png 400w\" sizes=\"auto, (max-width: 543px) 100vw, 543px\" \/><figcaption id=\"caption-attachment-12274\" class=\"wp-caption-text\">Ein Beispiel f\u00fcr Tokenisierung (Made with <a href=\"https:\/\/tiktokenizer.vercel.app\/\" target=\"_blank\" rel=\"noopener\">https:\/\/tiktokenizer.vercel.app\/<\/a>).<\/figcaption><\/figure>\n<h3><strong>Embedding:<\/strong> Vom Token zum Vektor<\/h3>\n<p>Der zweite Teil, die Einbettung (Embedding), besteht darin, Token auf Vektoren abzubilden. Obwohl die Forschung zu Worteinbettungen schon fr\u00fcher begann, ist eine der ersten bekannten Einbettungstechniken word2vec (2013). Dies ist ein Schl\u00fcsselelement, das es Analysetechniken (wie neuronalen Netzen) erm\u00f6glicht, mit Text zu arbeiten. Einbettungen werden in der Regel so berechnet, dass zwei semantisch \u00e4hnliche Token zu einem \u00e4hnlichen Vektor f\u00fchren. Die Einbettungstechnik <a href=\"https:\/\/bpemb.h-its.org\/#\">BPEmb<\/a> wendet beispielsweise die Byte Pair Encoding Tokenization auf Wikipedia-Artikel in verschiedenen Sprachen an und verwendet <a href=\"https:\/\/nlp.stanford.edu\/projects\/glove\/\">GloVe<\/a>, um Vektoren zu erzeugen, die semantische Informationen enthalten. In der Transformers-Architektur werden Token nicht nur aufgrund ihrer Semantik, sondern auch aufgrund ihrer Position im Satz in Vektoren eingebettet (so genanntes Positional Encoding).<\/p>\n<figure id=\"attachment_12311\" aria-describedby=\"caption-attachment-12311\" style=\"width: 400px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-12311 size-medium\" src=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Picture1-400x322.png\" alt=\"Wie funktionieren LLMs? 2D-Projektion von mit GloVe erzeugten Wortvektoren\" width=\"400\" height=\"322\" srcset=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Picture1-400x322.png 400w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Picture1-698x562.png 698w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Picture1.png 737w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><figcaption id=\"caption-attachment-12311\" class=\"wp-caption-text\">2D-Projektion von mit GloVe erzeugten Wortvektoren (selbst erzeugt nach: <a href=\"https:\/\/nlp.stanford.edu\/projects\/glove\/\">https:\/\/nlp.stanford.edu\/projects\/glove\/<\/a>).<\/figcaption><\/figure>\n<h3>Der Kern des LLM: <strong>Vorhersage<\/strong> des n\u00e4chsten Tokens<\/h3>\n<p>Der dritte Teil ist die Berechnung der Wahrscheinlichkeit des n\u00e4chsten Tokens. Dies ist der Kern der LLMs und der Grund, warum sie so gro\u00df sind. Obwohl im Prinzip jede Vorhersagetechnik funktionieren w\u00fcrde (man k\u00f6nnte hier sogar Random Forest verwenden), verwenden alle aktuellen LLMs neuronale Netze und die meisten (bis heute) die Transformer-Architektur. Die Wahl der Architektur h\u00e4ngt in erster Linie von der F\u00e4higkeit ab, lange Eingaben (den so genannten Kontext) zu erfassen, auf vielen Daten mit m\u00f6glichst wenig Rechenaufwand zu trainieren und so gut wie m\u00f6glich zu sein.<\/p>\n<h3><strong>Dekodierung:<\/strong> von der Token-Wahrscheinlichkeit zum (hoffentlich lesbaren) Text<\/h3>\n<p>Sobald das Modell eine Wahrscheinlichkeit f\u00fcr alle m\u00f6glichen Token berechnet hat, muss entschieden werden, welche Token als n\u00e4chstes ausgegeben werden sollen. Die Dekodierungsstrategie kann einfach sein (z. B. Greedy Search: immer das wahrscheinlichste Token ausw\u00e4hlen oder Top-K Sampling: aus den k wahrscheinlichsten Token ausw\u00e4hlen) oder komplexer (z.B. Beam Search: aus den wahrscheinlichsten Token-Sequenzen ausw\u00e4hlen oder Contrastive Search: die Wahrscheinlichkeit des Tokens gegen seine \u00c4hnlichkeit mit dem Kontext abw\u00e4gen).<\/p>\n<figure id=\"attachment_12280\" aria-describedby=\"caption-attachment-12280\" style=\"width: 400px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-12280 size-medium\" src=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/beam-search-400x267.png\" alt=\"So funktionieren LLMs: Beam-Search-Dekodierungsstrategie - Die Ausgabe des LLMs ist eine Token-Sequenz, die die wahrscheinlichste ist\" width=\"400\" height=\"267\" srcset=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/beam-search-400x267.png 400w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/beam-search-698x466.png 698w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/beam-search-768x513.png 768w, https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/beam-search.png 971w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><figcaption id=\"caption-attachment-12280\" class=\"wp-caption-text\">Beam-Search-Dekodierungsstrategie: Die Ausgabe des LLM ist eine Token-Sequenz, die die wahrscheinlichste ist (<a href=\"https:\/\/d2l.ai\/chapter_recurrent-modern\/beam-search.html\">Bildquelle<\/a>).<\/figcaption><\/figure>\n<h3><strong>Training<\/strong> mit ausreichend Daten und Feinabstimmung<\/h3>\n<p>Heutige LLMs werden zun\u00e4chst an einem gro\u00dfen und vielf\u00e4ltigen Datensatz vortrainiert. Ziel ist es, ein umfassendes Sprachverst\u00e4ndnis und -wissen zu erlernen. Dies ist sehr rechenintensiv. Anschlie\u00dfend werden die Modelle weiter trainiert, um Anweisungen genauer zu befolgen. Dies wird als Instruction Tuning bezeichnet. Schlie\u00dflich k\u00f6nnen diese Modelle f\u00fcr bestimmte Aufgaben fein abgestimmt werden (Fine-Tuning), wenn dies erforderlich ist.<\/p>\n<h2>Unser Fazit: Es ist hilfreich zu wissen, wie ein LLM funktioniert!<\/h2>\n<p>LLMs entwickeln sich schnell weiter. Neue Architekturen und Embeddings werden st\u00e4ndig entwickelt und evaluiert. Das Verst\u00e4ndnis ihrer inneren Funktionsweise ist n\u00fctzlich, denn es hilft bei der Entwicklung von Anwendungen und der Auswahl von LLMs.<\/p>\n<div class=\"info-box\">\n<p>Weitere Blog-Beitr\u00e4ge rund um generative KI und gro\u00dfe Sprachmodelle:<\/p>\n<ul>\n<li><strong><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/large-language-models-ki-sprachmodelle\/\" target=\"_blank\" rel=\"noopener\">Was sind Large Language Models?<\/a> <\/strong>Und was ist bei der Nutzung von KI-Sprachmodellen zu beachten?<\/li>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/open-source-large-language-models-selbst-betreiben\/\" target=\"_blank\" rel=\"noopener\"><strong>Open Source Large Language Models und deren Betrieb:<\/strong><\/a> Tipps f\u00fcr den Einstieg<\/li>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/retrieval-augmented-generation-rag\/\" target=\"_blank\" rel=\"noopener\"><strong>Retrieval Augmented Generation<\/strong><\/a>: Chatten mit den eigenen Daten<\/li>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/was-ist-prompt-engineering\/\" target=\"_blank\" rel=\"noopener\"><strong>Prompt Engineering<\/strong><\/a>: wie kommuniziert man am besten mit gro\u00dfen Sprachmodellen?<\/li>\n<li><strong><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/halluzinationen-generative-ki-llm\/\" target=\"_blank\" rel=\"noopener\">Halluzinationen<\/a> <\/strong>von generativer KI und gro\u00dfen Sprachmodellen (LLMs)<\/li>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/large-action-models-nutzen-neurosymbolische-ki\/\" target=\"_blank\" rel=\"noopener\"><strong>Large Action Models<\/strong><\/a> (LAMs) nutzen neurosymbolische KI \u2013 Die n\u00e4chste Stufe im Hype rund um Generative AI<\/li>\n<li><strong><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/ki-in-der-softwareentwicklung-neue-erkenntnisse-aus-forschung-und-praxis\/\" target=\"_blank\" rel=\"noopener\">KI in der Softwareentwicklung<\/a>:<\/strong> Zwischen Produktivit\u00e4tsschub und Vertrauenskrise \u2013 neue Erkenntnisse aus Forschung und Praxis<\/li>\n<li><strong><a href=\"https:\/\/www.iese.fraunhofer.de\/blog\/ki-in-der-softwarearchitektur-llms-fuer-qualitaetssicherung-nutzen\/\" target=\"_blank\" rel=\"noopener\">KI in der Softwarearchitektur<\/a>:<\/strong> Wie LLMs die Qualit\u00e4tssicherung automatisieren<\/li>\n<\/ul>\n<\/div>\n<h2>Wir unterst\u00fctzen Sie dabei, Open-Source LLMs auch in Ihrem Unternehmen erfolgreich zu nutzen!<\/h2>\n<p><a href=\"https:\/\/www.iese.fraunhofer.de\/de\/leistungen\/data-analytics.html\">Unser Team Data Science<\/a> bietet Ihnen Hilfe bei folgenden Themen:<\/p>\n<ul>\n<li>Modellauswahl<\/li>\n<li>Modellbetrieb<\/li>\n<li>Wie integriere ich Open-Source Large Language Models in meine Applikationen?<\/li>\n<li>Wie kann ich Open-Source Large Language Models nutzen, um Unternehmensdaten besser zug\u00e4nglich zu machen (z. B. mithilfe von Retrieval Augmented Generation (RAG))?<\/li>\n<li>Wie kann ich Open-Source LLMs f\u00fcr meine speziellen Use Cases bzw. Daten feinabstimmen (Finetuning, z. B. mit LoRA)?<\/li>\n<li>Wie kann ich Open-Source Large Language Models f\u00fcr deutschsprachige Anwendungen oder Code und Software Engineering einsetzen?<\/li>\n<li>Wie kann ich Large Language Models f\u00fcr meinen Use Case evaluieren?<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p><strong>Unser <a href=\"https:\/\/www.iese.fraunhofer.de\/de\/loesung\/open-source-llm.html\">L\u00f6sungsangebot<\/a> als PDF zum Mitnehmen:<\/strong><\/p>\n<ul>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/content\/dam\/iese\/leistung\/Open-Source-LLM-einsetzen_FraunhoferIESE.pdf\">Open-Source Large Language Models erfolgreich einsetzen (PDF)<\/a><\/li>\n<li><a href=\"https:\/\/www.iese.fraunhofer.de\/content\/dam\/iese\/leistung\/LLM-Innovation-Lab_FraunhoferIESE.pdf\">LLM Innovation Labs (PDF)<\/a><\/li>\n<\/ul>\n<div class=\"info-box\">\n<p>Large Language Models Webinare<\/p>\n<h2>Wie kann ich mehr \u00fcber LLMs lernen?<\/h2>\n<p>Das <a href=\"https:\/\/www.iese.fraunhofer.de\/de\/leistungen\/data-analytics.html\">Team Data Science<\/a> bietet zum Thema LLM Webinare an, darunter sowohl kostenfreie als auch kostenpflichtige Optionen.<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Mehr\u00a0 zur Webinarreihe <span style=\"font-size: 1.2rem;\">\u00a0\u00bbZuverl\u00e4ssiger Einsatz von Large Language Models (LLMs)\u00ab<\/span><\/strong><\/p>\n<h3 class=\"fragment\"><a href=\"https:\/\/www.iese.fraunhofer.de\/de\/seminare_training\/webinar-llm.html\" target=\"_blank\" rel=\"noopener\">1: Open Source LLMs selbst betreiben<\/a><\/h3>\n<h3 id=\"Teil-2-Retrieval-Augmented-Generation-RAG\" class=\"fragment\"><a href=\"https:\/\/www.iese.fraunhofer.de\/de\/seminare_training\/weiterbildung-llm.html\" target=\"_blank\" rel=\"noopener\">2: Retrieval Augmented Generation (RAG)<\/a><\/h3>\n<h3 id=\"Teil-2-Retrieval-Augmented-Generation-RAG\" class=\"fragment\"><a href=\"https:\/\/www.iese.fraunhofer.de\/de\/seminare_training\/weiterbildung-prompting.html\" target=\"_blank\" rel=\"noopener\">3: Prompting Essentials \u2013 LLMs effektiv nutzen<\/a><\/h3>\n<p>&nbsp;<\/p>\n<p>Sie haben Interesse an einem Seminar f\u00fcr Ihr Unternehmen?<br \/>\nAuf Wunsch bieten wir individuell gestaltete Seminare (auf Deutsch und Englisch) f\u00fcr Ihr Unternehmen an, in denen die Schulungsinhalte gezielt auf Ihre Bed\u00fcrfnisse abgestimmt werden k\u00f6nnen.<\/p>\n<p>&nbsp;<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>In diesem Blogbeitrag erkl\u00e4ren KI-Expertinnen und Experten, welche Komponenten zu LLMs (Large Language Models, deutsch: gro\u00dfe Sprachmodelle) geh\u00f6ren. Die Funktionsweise eines LLMs: 4 Schritte bis zum Ergebnis Gro\u00dfe Sprachmodelle, wie wir sie heute kennen, sind nur die Spitze des Eisbergs&#8230;.<\/p>\n","protected":false},"author":66,"featured_media":12272,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[177],"tags":[104,170,587],"coauthors":[214,229],"class_list":["post-12269","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-kuenstliche-intelligenz","tag-data-analytics","tag-data-science","tag-large-language-models-llm"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.9 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE<\/title>\n<meta name=\"description\" content=\"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE\" \/>\n<meta property=\"og:description\" content=\"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/\" \/>\n<meta property=\"og:site_name\" content=\"Fraunhofer IESE\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/FraunhoferIESE\/\" \/>\n<meta property=\"article:published_time\" content=\"2024-06-17T07:15:06+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-01-22T13:12:33+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1920\" \/>\n\t<meta property=\"og:image:height\" content=\"1280\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Dr. Julien Siebert, Patricia Kelbert\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@FraunhoferIESE\" \/>\n<meta name=\"twitter:site\" content=\"@FraunhoferIESE\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Julien Siebert\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"5\u00a0Minuten\" \/>\n\t<meta name=\"twitter:label3\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data3\" content=\"Dr. Julien Siebert, Patricia Kelbert\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/\"},\"author\":{\"name\":\"Dr. Julien Siebert\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/person\\\/96d3d2ce62a13a8ee470ea948601ff28\"},\"headline\":\"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle\",\"datePublished\":\"2024-06-17T07:15:06+00:00\",\"dateModified\":\"2026-01-22T13:12:33+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/\"},\"wordCount\":1102,\"publisher\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/Machine-Learning-Gehirn-Konzept.jpg\",\"keywords\":[\"Data Analytics\",\"Data Science\",\"Large Language Models (LLM)\"],\"articleSection\":[\"K\u00fcnstliche Intelligenz\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/\",\"name\":\"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/Machine-Learning-Gehirn-Konzept.jpg\",\"datePublished\":\"2024-06-17T07:15:06+00:00\",\"dateModified\":\"2026-01-22T13:12:33+00:00\",\"description\":\"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/Machine-Learning-Gehirn-Konzept.jpg\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/Machine-Learning-Gehirn-Konzept.jpg\",\"width\":1920,\"height\":1280,\"caption\":\"AI technology brain background digital transformation concept\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wie-funktionieren-llms\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Startseite\",\"item\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#website\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\",\"name\":\"Fraunhofer IESE\",\"description\":\"Blog des Fraunhofer-Institut f\u00fcr Experimentelles Software Engineering\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#organization\",\"name\":\"Fraunhofer IESE\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/08\\\/fhg_iese_logo.png\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2016\\\/08\\\/fhg_iese_logo.png\",\"width\":183,\"height\":50,\"caption\":\"Fraunhofer IESE\"},\"image\":{\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/FraunhoferIESE\\\/\",\"https:\\\/\\\/x.com\\\/FraunhoferIESE\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/fraunhoferiese\\\/\",\"https:\\\/\\\/www.youtube.com\\\/c\\\/FraunhoferIESE\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/#\\\/schema\\\/person\\\/96d3d2ce62a13a8ee470ea948601ff28\",\"name\":\"Dr. Julien Siebert\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/siebert_julien_8513_blog-96x96.jpg299e210bdf5631c16552ac66c10e3e56\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/siebert_julien_8513_blog-96x96.jpg\",\"contentUrl\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/siebert_julien_8513_blog-96x96.jpg\",\"caption\":\"Dr. Julien Siebert\"},\"description\":\"Julien Siebert is working as senior AI Expert in the Data Science department of Fraunhofer IESE. He studied Artificial Intelligence and Engineering Science and got his PhD in Computer Science. His professional interests include data science processes, artificial intelligence and complex systems.\",\"url\":\"https:\\\/\\\/www.iese.fraunhofer.de\\\/blog\\\/author\\\/julien-siebert\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE","description":"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/","og_locale":"de_DE","og_type":"article","og_title":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE","og_description":"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.","og_url":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/","og_site_name":"Fraunhofer IESE","article_publisher":"https:\/\/www.facebook.com\/FraunhoferIESE\/","article_published_time":"2024-06-17T07:15:06+00:00","article_modified_time":"2026-01-22T13:12:33+00:00","og_image":[{"width":1920,"height":1280,"url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","type":"image\/jpeg"}],"author":"Dr. Julien Siebert, Patricia Kelbert","twitter_card":"summary_large_image","twitter_creator":"@FraunhoferIESE","twitter_site":"@FraunhoferIESE","twitter_misc":{"Verfasst von":"Dr. Julien Siebert","Gesch\u00e4tzte Lesezeit":"5\u00a0Minuten","Written by":"Dr. Julien Siebert, Patricia Kelbert"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#article","isPartOf":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/"},"author":{"name":"Dr. Julien Siebert","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/person\/96d3d2ce62a13a8ee470ea948601ff28"},"headline":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle","datePublished":"2024-06-17T07:15:06+00:00","dateModified":"2026-01-22T13:12:33+00:00","mainEntityOfPage":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/"},"wordCount":1102,"publisher":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#primaryimage"},"thumbnailUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","keywords":["Data Analytics","Data Science","Large Language Models (LLM)"],"articleSection":["K\u00fcnstliche Intelligenz"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/","name":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle - Blog des Fraunhofer IESE","isPartOf":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#primaryimage"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#primaryimage"},"thumbnailUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","datePublished":"2024-06-17T07:15:06+00:00","dateModified":"2026-01-22T13:12:33+00:00","description":"Woraus bestehen gro\u00dfe Sprachmodelle (Large Language Models)? KI-Experten und Expertinnen erkl\u00e4ren die Funktionsweise von LLMs.","breadcrumb":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#primaryimage","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","width":1920,"height":1280,"caption":"AI technology brain background digital transformation concept"},{"@type":"BreadcrumbList","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wie-funktionieren-llms\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Startseite","item":"https:\/\/www.iese.fraunhofer.de\/blog\/"},{"@type":"ListItem","position":2,"name":"Wie funktionieren LLMs? Ein Blick ins Innere gro\u00dfer Sprachmodelle"}]},{"@type":"WebSite","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#website","url":"https:\/\/www.iese.fraunhofer.de\/blog\/","name":"Fraunhofer IESE","description":"Blog des Fraunhofer-Institut f\u00fcr Experimentelles Software Engineering","publisher":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.iese.fraunhofer.de\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#organization","name":"Fraunhofer IESE","url":"https:\/\/www.iese.fraunhofer.de\/blog\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/08\/fhg_iese_logo.png","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2016\/08\/fhg_iese_logo.png","width":183,"height":50,"caption":"Fraunhofer IESE"},"image":{"@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/FraunhoferIESE\/","https:\/\/x.com\/FraunhoferIESE","https:\/\/www.linkedin.com\/company\/fraunhoferiese\/","https:\/\/www.youtube.com\/c\/FraunhoferIESE"]},{"@type":"Person","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/#\/schema\/person\/96d3d2ce62a13a8ee470ea948601ff28","name":"Dr. Julien Siebert","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2020\/10\/siebert_julien_8513_blog-96x96.jpg299e210bdf5631c16552ac66c10e3e56","url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2020\/10\/siebert_julien_8513_blog-96x96.jpg","contentUrl":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2020\/10\/siebert_julien_8513_blog-96x96.jpg","caption":"Dr. Julien Siebert"},"description":"Julien Siebert is working as senior AI Expert in the Data Science department of Fraunhofer IESE. He studied Artificial Intelligence and Engineering Science and got his PhD in Computer Science. His professional interests include data science processes, artificial intelligence and complex systems.","url":"https:\/\/www.iese.fraunhofer.de\/blog\/author\/julien-siebert\/"}]}},"jetpack_featured_media_url":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-content\/uploads\/2024\/04\/Machine-Learning-Gehirn-Konzept.jpg","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/12269","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/users\/66"}],"replies":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/comments?post=12269"}],"version-history":[{"count":22,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/12269\/revisions"}],"predecessor-version":[{"id":15003,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/posts\/12269\/revisions\/15003"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/media\/12272"}],"wp:attachment":[{"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/media?parent=12269"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/categories?post=12269"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/tags?post=12269"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.iese.fraunhofer.de\/blog\/wp-json\/wp\/v2\/coauthors?post=12269"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}