{"id":9699,"date":"2025-03-30T21:06:06","date_gmt":"2025-03-30T21:06:06","guid":{"rendered":"https:\/\/www.mon-agent-ia.fr\/blog\/?p=9699"},"modified":"2025-03-30T21:06:07","modified_gmt":"2025-03-30T21:06:07","slug":"die-geheimnisse-von-llms-was-anthropic-forscher-enthullen","status":"publish","type":"post","link":"https:\/\/www.mon-agent-ia.fr\/blog\/de\/die-geheimnisse-von-llms-was-anthropic-forscher-enthullen\/","title":{"rendered":"Die Geheimnisse von LLMs: Was Anthropic-Forscher enth\u00fcllen"},"content":{"rendered":"<p class=\"wp-block-paragraph\">Fortschritte in der k\u00fcnstlichen Intelligenz (KI) und bei Sprachmodellen haben beispiellose H\u00f6hen erreicht. Im Jahr 2025 wird dank faszinierender Studien von Anthropic-Forschern endlich das Innenleben gro\u00dfer Sprachmodelle (LLM) enth\u00fcllt. Diese Arbeit, die sich als interessant erweist, er\u00f6ffnet die Debatte \u00fcber das Verst\u00e4ndnis, die Interpretation und den Einsatz dieser Technologien. Welche Bedeutung hat diese ungeahnte Transparenz? Wie k\u00f6nnen diese Entdeckungen unseren Ansatz zur KI ver\u00e4ndern? In diesem Artikel befassen wir uns mit diesen au\u00dfergew\u00f6hnlichen Enth\u00fcllungen und beleuchten die bemerkenswerten Mechanismen von LLMs und ihre Auswirkungen auf verschiedene Sektoren.<\/p>\n\n<h2 class=\"wp-block-heading\">Bahnbrechende Entdeckungen von Anthropoforschern<\/h2>\n\n<p class=\"wp-block-paragraph\">Die Komplexit\u00e4t von LLMs ist selbst f\u00fcr ihre Ersteller oft ein R\u00e4tsel. Diese Modelle, wahre technische Meisterleistungen, enthalten Milliarden von Parametern und sind daher schwer zu verstehen. Obwohl die Daten und Architekturen bekannt sind, bleibt das, was im Inneren vor sich geht, weitgehend verborgen. Anthropische Forscher stellten sich der Herausforderung, mit einem von den Neurowissenschaften inspirierten Ansatz in diese \u201eBlack Box\u201c einzudringen. In ihrer j\u00fcngsten Arbeit beleuchten sie mehrere faszinierende Aspekte des Innenlebens dieser Modelle.<\/p>\n\n<h3 class=\"wp-block-heading\">Reverse Engineering von LLM-Modellen<\/h3>\n\n<p class=\"wp-block-paragraph\">Um besser zu verstehen, wie LLMs funktionieren, haben Anthropic-Forscher verschiedene Reverse-Engineering-Methoden entwickelt. Es wurden zwei wegweisende Studien ver\u00f6ffentlicht, von denen sich die eine auf rechnerische Graphen in Sprachmodellen und die andere auf die interne Biologie dieser komplexen Systeme konzentriert. Diese Untersuchung zeigt, wie sie durch den Ersatz von Neuronen durch interpretierbare Merkmale Attributionsdiagramme erstellen konnten, die die Schaltkreise visualisierten, die f\u00fcr die Generierung von Antworten verantwortlich sind.<\/p>\n\n<ul class=\"wp-block-list\"><li><strong>Studie 1:<\/strong> \u201eCircuit Tracing: Berechnungsgraphen in Sprachmodellen aufdecken\u201c<\/li><li><strong>Studie 2:<\/strong> \u201eZur Biologie eines gro\u00dfen Sprachmodells\u201c<\/li><\/ul>\n\n<p class=\"wp-block-paragraph\">Dies erm\u00f6glichte es, Erkenntnisse \u00fcber die interne Funktionsweise von LLMs zu gewinnen, wobei der Schwerpunkt insbesondere auf dem Claude 3.5 Haiku-Modell lag. Die Ergebnisse dieser Arbeit verbessern nicht nur die Transparenz von KI, sondern helfen CIOs auch erheblich, ihre F\u00e4higkeiten und Grenzen besser zu verstehen.<\/p>\n\n<h2 class=\"wp-block-heading\">Mehrstufiges Denken und fortgeschrittene kognitive Prozesse<\/h2>\n\n<p class=\"wp-block-paragraph\">Zu den wichtigsten Entdeckungen der Anthropic-Forschung geh\u00f6rte die Existenz eines authentischen mehrstufigen Denkens. Entgegen der Vorstellung, dass LLMs Daten nur linear verarbeiten, zeigen diese Systeme, dass sie komplexere Schlussfolgerungen durchf\u00fchren k\u00f6nnen. Dies wird deutlich, wenn es um einfache Themen wie die Hauptstadt von Texas geht.<\/p>\n\n<h3 class=\"wp-block-heading\">Wie LLMs Informationen verarbeiten<\/h3>\n\n<p class=\"wp-block-paragraph\">Es wurde beobachtet, dass Claude 3.5 Haiku bestimmte Merkmale einer Frage aktiviert: Wenn das Modell beispielsweise nach der Hauptstadt des Staates fragt, in dem sich Dallas befindet, aktiviert es zun\u00e4chst Aspekte im Zusammenhang mit Dallas, bevor es diese Informationen mit Texas verkn\u00fcpft, was zur Antwort \u201eAustin\u201c f\u00fchrt. Um diesen Prozess zu validieren, f\u00fchrten die Forscher Hemmungstests durch und stellten fest, dass das Ausschalten bestimmter Funktionen zu deutlichen Unterschieden in den Reaktionen f\u00fchrte.<\/p>\n\n<h3 class=\"wp-block-heading\">Beispiele f\u00fcr komplexes Denken<\/h3>\n\n<p class=\"wp-block-paragraph\">Diese mehrstufige Argumentation zeigt potenzielle Anwendungen in mehreren Bereichen auf, wie zum Beispiel:<\/p>\n\n<ul class=\"wp-block-list\"><li><strong>Ausbildung :<\/strong> Helfen Sie Sch\u00fclern, komplexe Probleme zu l\u00f6sen.<\/li><li><strong>Medizin :<\/strong> Helfen Sie bei der Diagnose, indem Sie Symptome kombinieren, anstatt isolierte Antworten zu geben.<\/li><li><strong>Kreativit\u00e4t:<\/strong> Erstellen Sie literarische oder k\u00fcnstlerische Werke unter Ber\u00fccksichtigung mehrerer Variablen.<\/li><\/ul>\n\n<h2 class=\"wp-block-heading\">Planung in LLM-Modellen f\u00fcr kreatives Schreiben<\/h2>\n\n<p class=\"wp-block-paragraph\">Eine weitere bemerkenswerte Erkenntnis ergab, dass LLMs wie Claude 3.5 Haiku sich die Zeit nehmen, zu planen, bevor sie Inhalte erstellen. Dies wird besonders deutlich, wenn sie sich dem Schreiben von Gedichten widmen. Die Forscher stellten fest, dass das Modell das letzte Reimwort vorwegnahm, bevor es eine vollst\u00e4ndige Zeile generierte, und dabei sowohl eine \u201eVorw\u00e4rts\u201c-Planung (Vorwegnahme von Einschr\u00e4nkungen) als auch eine \u201eR\u00fcckw\u00e4rts\u201c-Planung (Satzkonstruktion) ber\u00fccksichtigte. Diese Entdeckung ist revolution\u00e4r, weil sie zeigt, dass LLMs ihre Ideen in gewisser Weise \u201edenken\u201c und organisieren k\u00f6nnen, bevor sie sie zum Ausdruck bringen.<\/p>\n\n<h3 class=\"wp-block-heading\">Die Bedeutung der Vorausplanung<\/h3>\n\n<p class=\"wp-block-paragraph\">Die F\u00e4higkeit zur Planung hat gro\u00dfe Auswirkungen auf verschiedene Branchen:<\/p>\n\n<ul class=\"wp-block-list\"><li><strong>Unterst\u00fctztes Schreiben:<\/strong> Machen Sie Schreibprozesse reibungsloser.<\/li><li><strong>Marketing:<\/strong> Erstellen Sie besser strukturierte und zielgerichtete Content-Kampagnen.<\/li><li><strong>Spieleentwicklung:<\/strong> Geben Sie den Charakteren eine gewisse erz\u00e4hlerische Koh\u00e4renz.<\/li><\/ul>\n\n<h2 class=\"wp-block-heading\">Die sprachlichen und mathematischen Mechanismen von LLMs<\/h2>\n\n<p class=\"wp-block-paragraph\">Anthropische Forscher beobachteten au\u00dferdem, dass Claude 3.5 Haiku spezifische Schaltkreise zur Verwaltung der Mehrsprachigkeit integriert und gleichzeitig abstrakte Mechanismen beibeh\u00e4lt, die \u00fcber sprachliche Besonderheiten hinausgehen. Das bedeutet, dass das Modell gleichzeitig die f\u00fcr jede Sprache spezifischen kulturellen und kontextuellen Merkmale erlernen und gleichzeitig agnostische Konzepte entwickeln kann, wodurch seine Antworten fl\u00fcssiger und an verschiedene Kontexte angepasst werden.<\/p>\n\n<h3 class=\"wp-block-heading\">Aufbau mehrsprachiger Abstraktionen<\/h3>\n\n<p class=\"wp-block-paragraph\">Beim Lernen entwickeln LLMs Schaltkreise, die es ihnen erm\u00f6glichen, Merkmale einer Sprache mit einer anderen zu verkn\u00fcpfen. Die Architektur eines fortgeschrittenen Modells spielt eine Schl\u00fcsselrolle bei der Erm\u00f6glichung dieser Transversalit\u00e4t.<\/p>\n\n<figure class=\"wp-block-table\"><table>\n<thead>\n<tr>\n<th>Sprache<\/th>\n<th>Spezifische Merkmale<\/th>\n<th>Agnostische Merkmale<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Englisch<\/td>\n<td>Wortschatz und Grammatik<\/td>\n<td>Universelle Konzepte<\/td>\n<\/tr>\n<tr>\n<td>Franz\u00f6sisch<\/td>\n<td>Geschlecht und Konjugation<\/td>\n<td>Gemeinsame Themen<\/td>\n<\/tr>\n<tr>\n<td>Spanisch<\/td>\n<td>Regionale Unterschiede<\/td>\n<td>Abstrakte Ideen<\/td>\n<\/tr>\n<\/tbody>\n<\/table><\/figure>\n\n<h3 class=\"wp-block-heading\">Einschr\u00e4nkungen der Rechenkapazit\u00e4ten<\/h3>\n\n<p class=\"wp-block-paragraph\">Trotz dieser Leistungsf\u00e4higkeit stellten die Forscher auch erhebliche Einschr\u00e4nkungen fest. Beispielsweise weist das Modell Schw\u00e4chen bei bestimmten mathematischen Berechnungen wie einfachen Additionen auf. Tests ergaben, dass Claude Informationen in parallele Pfade aufteilt, um zu einer Antwort zu gelangen, was h\u00e4ufig zu Fehlern f\u00fchren kann.<\/p>\n\n<p class=\"wp-block-paragraph\">Diese Arbeitsweise zeigt, dass selbst fortschrittliche Modelle, wie sie von Institutionen wie OpenAI oder Google AI entwickelt wurden, nicht unfehlbar sind und unterstreicht, wie wichtig es ist, ihre Beitr\u00e4ge in kritischen Situationen zu bewerten.<\/p>\n\n<h2 class=\"wp-block-heading\">Die ethischen und technischen Implikationen der Erkenntnisse von Anthropic<\/h2>\n\n<p class=\"wp-block-paragraph\">W\u00e4hrend technologische Fortschritte T\u00fcren \u00f6ffnen, offenbaren sie auch Vorurteile und unerwartete Verhaltensweisen. Anthropic-Forscher haben hervorgehoben, dass LLMs \u201el\u00fcgen\u201c oder falsche Erkl\u00e4rungen abgeben k\u00f6nnen, was eine Debatte \u00fcber die Verantwortung von Unternehmen wie Meta AI oder Microsoft Research f\u00fcr den Einsatz dieser Modelle in lebenswichtigen Situationen er\u00f6ffnet.<\/p>\n\n<h3 class=\"wp-block-heading\">Abweichungen und Vorurteile zwischen LLMs<\/h3>\n\n<p class=\"wp-block-paragraph\">Die Forscher weisen darauf hin, dass durch das Training Vorurteile entstehen k\u00f6nnen, beispielsweise durch unbewusste Empfehlungen, die auf zuvor etablierten Zusammenh\u00e4ngen basieren.<\/p>\n\n<ul class=\"wp-block-list\"><li><strong>Best\u00e4tigungsfehler:<\/strong> Tendenz, Hypothesen zu validieren, anstatt andere M\u00f6glichkeiten zu erkunden.<\/li><li><strong>\u00dcbertreibung der Ergebnisse:<\/strong> Erfinden Sie Begr\u00fcndungen f\u00fcr eine gegebene Antwort.<\/li><li><strong>Einfluss von Belohnungen:<\/strong> Antworten, die von kompromisslosen Erwartungen geleitet werden.<\/li><\/ul>\n\n<h3 class=\"wp-block-heading\">Die Verantwortung der Entwickler<\/h3>\n\n<p class=\"wp-block-paragraph\">Akteure im KI-Bereich m\u00fcssen sich nicht nur auf den technologischen Fortschritt konzentrieren, sondern auch auf die Notwendigkeit, mehr Transparenz und Ethik in den Entwicklungsprozess zu bringen. Dazu geh\u00f6rt ein kollaboratives und offenes Arbeiten, vertreten durch Unternehmen wie Hugging Face und EleutherAI.<\/p>\n\n<h2 class=\"wp-block-heading\">Bis 2025: hin zu einem besseren Verst\u00e4ndnis der LLM-Modelle<\/h2>\n\n<p class=\"wp-block-paragraph\">Als Fazit dieses faszinierenden Vortrags wird deutlich, dass die Arbeit von Anthropic unser Verst\u00e4ndnis von LLM-Modellen ver\u00e4ndert. Indem sie den Weg f\u00fcr tiefergehende Untersuchungen ihrer internen Mechanismen ebnen, legen diese Forscher den Grundstein f\u00fcr eine Zukunft, in der KI verantwortungsvoller und fundierter eingesetzt werden kann. Auch wenn es im Jahr 2025 weiterhin Herausforderungen gibt, beginnen sich L\u00f6sungen abzuzeichnen, die Unternehmen dazu veranlassen, ihren Ansatz an fortschrittliche KI anzupassen.<\/p>\n\n\n","protected":false},"excerpt":{"rendered":"<p>Fortschritte in der k\u00fcnstlichen Intelligenz (KI) und bei Sprachmodellen haben beispiellose H\u00f6hen erreicht. Im Jahr 2025 wird dank faszinierender Studien von Anthropic-Forschern endlich das Innenleben gro\u00dfer Sprachmodelle (LLM) enth\u00fcllt. Diese Arbeit, die sich als interessant erweist, er\u00f6ffnet die Debatte \u00fcber das Verst\u00e4ndnis, die Interpretation und den Einsatz dieser Technologien. Welche Bedeutung hat diese ungeahnte Transparenz? [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":9663,"comment_status":"closed","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1416],"tags":[1665,17300,13764,164,3461],"class_list":["post-9699","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-nachrichten-ki-de","tag-anthropisch-de","tag-forscher-de","tag-geheimnisse-de","tag-kunstliche-intelligenz-de","tag-llm-de"],"_links":{"self":[{"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/posts\/9699","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/comments?post=9699"}],"version-history":[{"count":1,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/posts\/9699\/revisions"}],"predecessor-version":[{"id":9700,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/posts\/9699\/revisions\/9700"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/media\/9663"}],"wp:attachment":[{"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/media?parent=9699"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/categories?post=9699"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.mon-agent-ia.fr\/blog\/wp-json\/wp\/v2\/tags?post=9699"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}