Obwohl bereits viel über Agentenarchitekturen geschrieben wurde, sind praxistaugliche Implementierungen weiterhin selten. Dieser Artikel beleuchtet das agentenbasierte KI-Netzwerk , ein Konzept, das kürzlich von McKinsey vorgestellt wurde. 1
Wir werden die Herausforderungen untersuchen, die in Produktionsumgebungen auftreten, und aufzeigen, wie unsere vorgeschlagene Architektur eine kontrollierte Skalierung der KI-Fähigkeiten ermöglicht.
Herausforderungen in agentenbasierten Systemen
Beim Übergang von der Testphase und dem Experimentieren mit KI-Agenten zur Bereitstellung skalierbarer, realer Anwendungsfälle treten mehrere Herausforderungen auf:
- Integrationslücken : In der Experimentierphase nutzen Teams vorgefertigte Lösungen, um die Entwicklung zu beschleunigen. Diese Lösungen bieten jedoch beim Skalieren oft keinen einheitlichen Ansatz. Dadurch entstehen Integrations- und Koordinationsprobleme, die zu Lücken in der Abdeckung führen. Beispielsweise haben wir beobachtet, dass bei der Skalierung KI-gestützter Chatbots unterschiedliche Systeme für Kundendaten und -interaktionen nicht synchronisiert werden.
- Isolation von Agenten : Die meisten Agenten arbeiten heutzutage unabhängig voneinander mit lokalen Informationen. Beispielsweise fehlt einem über APIs verbundenen Planer-, Abrufer- und Ausführungsagenten möglicherweise ein einheitlicher Kontext. Mit der Skalierung von Organisationen hin zu Multi-Agenten-Ökosystemen wird das Fehlen eines gemeinsamen Speichers und einer gemeinsamen Koordination zu einer zentralen Herausforderung.
- Betriebliche Einschränkungen : Anwendungen von KI-Agenten können zu unvorhersehbaren Ergebnissen und nicht-deterministischem Verhalten führen, wodurch inkonsistente Antworten generiert oder keine genauen Lösungen geliefert werden.
Einführung der agentenbasierten Mesh-Architektur
Das KI-Netzwerk stellt sich ein „Internet für Agenten“ vor, in dem mehrere Agenten über ein verteiltes Netzwerk von Systemen und Werkzeugen hinweg argumentieren, zusammenarbeiten und autonom handeln können.
Anders als bei RAG-Pipelines oder Microservice-APIs wird ein System zur Aufzeichnung des Agentenverhaltens geschaffen: Jeder Werkzeugaufruf, jeder Fehler und jedes Ergebnis wird über das Ereignisnetz verteilt und von der Koordinierungsschicht gespeichert.
Im Laufe der Zeit entwickelt sich aus dieser gemeinsamen Geschichte eine umfassendere Wissensbasis, die es den Akteuren ermöglicht, sich auf einen gemeinsamen Kontext auszurichten und effektiver zusammenzuarbeiten.
Wie funktioniert ein Agentennetz?
1. Kompositionsfähigkeit:
Jeder Agent, jedes Werkzeug oder jedes Modell (zum Beispiel ein neues LLM) kann mit dem Netz verbunden werden, ohne dass Änderungen an anderen Komponenten erforderlich sind.
Dieses modulare Design unterstützt die Skalierbarkeit, indem es Unternehmen ermöglicht, Funktionen schrittweise hinzuzufügen oder zu ersetzen, ohne bestehende Arbeitsabläufe zu stören.
2. Paralleles Agenten-Schlussfolgern:
Das Netzwerk ermöglicht es, das Denkvermögen auf mehrere Agenten zu verteilen. Dies erhöht zwar die Komplexität, erlaubt es aber spezialisierten Agenten, Teile einer größeren Aufgabe zu bearbeiten, anstatt sich auf ein einzelnes LLM zu verlassen.
Diese Arbeitsteilung erleichtert die Skalierung von KI-Systemen, da die Arbeitslasten auf parallel laufende Agenten verteilt werden können.
3. Geschichtete Kopplung:
Das Mesh trennt Schlüsselfunktionen (z. B. Logik, Speicher, Orchestrierung und Schnittstellen) in separate Schichten. Dadurch kann die Logik eines Agenten unabhängig von seinem Datenspeicher oder seiner Benutzerschnittstelle funktionieren.
4. Anbieterneutralität:
Das Netzwerk ist nicht an einen bestimmten Anbieter oder eine bestimmte Plattform gebunden. Komponenten können unabhängig voneinander ausgetauscht oder aktualisiert werden, wobei offene Standards wie das Model Context Protocol (MCP) und Agent2Agent (A2A) gegenüber proprietären APIs bevorzugt werden.
Googles A2A definiert beispielsweise ein gemeinsames Nachrichtenformat und einen gemeinsamen Erkennungsmechanismus für die frameworkübergreifende Zusammenarbeit, während Anthropics MCP eine universelle Methode für Agenten zum Abrufen von Daten bereitstellt. Ähnlich wie USB ermöglichen diese Standards Interoperabilität, sodass Teams Tools und Modelle verschiedener Anbieter ohne zusätzlichen Integrationsaufwand kombinieren können.
5. Regierte Autonomie:
Die Agenten im Netzwerk agieren zwar selbstständig, jedoch innerhalb vorgegebener Richtlinien und anderer Beschränkungen. Anders ausgedrückt: Jede autonome Aktion ist durch Regeln vordefiniert.
Betriebliche Fähigkeiten: Wie funktioniert das Netz in der Praxis?
Jede dieser Funktionen erstreckt sich über das gesamte Mesh (ist also nicht an eine einzelne Plattform gebunden) und weist oft Parallelen zu Konzepten aus Cloud- oder Microservices-Umgebungen auf, wie beispielsweise Service-Registries oder Audit-Logs.
Im Folgenden beschreiben wir die einzelnen Funktionen und ihre praktische Funktionsweise:
Agenten- und Workflow-Erkennung :
Das Netzwerk verwaltet ein zentrales Verzeichnis aller verfügbaren Agenten und Workflows. Dadurch können Teams bestehende Funktionen einfach finden, wiederverwenden und integrieren, anstatt sie von Grund auf neu zu entwickeln. Agenten können außerdem standardisierte „Funktionskarten“ veröffentlichen, die ihre Möglichkeiten beschreiben und von anderen Agenten oder menschlichen Bedienern abgefragt werden können.
Durch die Durchsetzung einer gemeinsamen Taxonomie und von Metadatenstandards können Organisationen auch Governance-Richtlinien anwenden, wie beispielsweise die Beschränkung bestimmter sensibler Aufgaben auf zertifizierte Agenten.
KI-Asset-Register :
Das Asset-Register dient als Repository für alle kritischen KI-Assets, die das Verhalten von Agenten prägen. Dazu gehören Eingabeaufforderungen, Werkzeugdefinitionen, Modellkonfigurationen, Datensätze und Richtlinien. Alle Inhalte des Repositorys sind versionskontrolliert, auditierbar und unterliegen Governance-Richtlinien.
Zu den wesentlichen Vermögenswerten gehören oft:
- Hinweise und Anweisungen wurden auf Jailbreaks und Voreingenommenheit getestet.
- Agentenkonfigurationen, die festlegen, welche Tools, APIs und Modelle zulässig sind.
- LLM-Einstellungen zur Definition der verfügbaren Modelle und Parameter.
- Werkzeugdefinitionen und MCP-Server mit integrierten Zugriffskontrollen.
- Goldene Input/Output-Beispiele , die als verlässliche Referenzen für Lernen und Bewertung dienen.
Feedbackmanagement :
Feedbackschleifen sind in das Netzwerk integriert, sodass jede Workflow-Ausführung zu einer Lernquelle wird. Kennzahlen wie Latenz, Genauigkeit, Fehlerraten oder auch menschliche Bewertungen werden erfasst und in das System zurückgeführt.
Compliance & Risikomanagement :
Jeder Agenten-Workflow muss innerhalb definierter Regeln und Einschränkungen ablaufen. Compliance- und Risikomanagement-Tools sind direkt in das Netzwerk integriert, um dies zu gewährleisten.
Zum Beispiel,
- Compliance-Beauftragte können Maßnahmen anhand von Organisations- oder Regulierungsstandards prüfen, bevor die Ergebnisse endgültig festgelegt werden.
- Richtlinien können vorschreiben, dass sensible Aufgaben von Datenschutz- oder Sicherheitsbeauftragten überprüft werden, während Prüfprotokolle jede Aktion zur späteren Überprüfung aufzeichnen.
Evaluierungssysteme :
Evaluierungspipelines funktionieren wie Integrationstests für agentenbasierte Arbeitsabläufe. Ziel ist es, sicherzustellen, dass Arbeitsabläufe auch dann robust bleiben, wenn sich die zugrunde liegenden LLMs ändern oder sich die externen Bedingungen ändern.
Bei jeder Bereitstellung oder Modellaktualisierung führen sie strukturierte Testreihen durch, um die Korrektheit zu überprüfen.
Sie umfassen typischerweise:
- Tests auf Schrittebene (z. B. wurde die richtige API/das richtige Tool aufgerufen?).
- Tests auf Workflow-Ebene (z. B.: Hat der Gesamtprozess das erwartete Ergebnis erzielt?).
- Adversarial Tests (z. B. Prompt-Injection, Misuse, Denial-of-Service).
Beobachtbarkeit :
In einem Agentennetzwerk gewährleistet die Beobachtbarkeit, dass jede Agenteninteraktion und jeder Workflow nachvollzogen, protokolliert und analysiert werden kann. Diese Funktion bietet vollständige Transparenz darüber, wie Agenten zusammenarbeiten, welche Tools verwendet werden und welche Ressourcen verbraucht werden.
Durch die Zentralisierung von Kennzahlen und Ereignisprotokollen können Organisationen Anomalien erkennen, Kosten kontrollieren und sicherstellen, dass die Ergebnisse den Governance-Richtlinien entsprechen.
Neue Standards wie OpenTelemetry für Agenten tragen dazu bei, die Beobachtbarkeit über verschiedene Laufzeitumgebungen hinweg interoperabel zu gestalten.
Authentifizierung und Autorisierung :
In einem Agentennetzwerk muss jeder Anruf zwischen Agenten oder zwischen Agent und Service authentifiziert und autorisiert werden. Man kann sich das wie die Ausgabe temporärer Sicherheitsausweise vorstellen: Agenten erhalten nur die Berechtigungen, die sie benötigen, und diese verfallen nach kurzer Zeit.
Durch die Verwendung von Standards wie OAuth 2.0, JWTs und dem Prinzip der minimalen Berechtigungen werden die Interaktionen sicher gehalten und die Auswirkungen begrenzt, falls eine Komponente kompromittiert wird.
Warum ist das wichtig?
Zusammengenommen verwandeln diese Funktionen lose verbundene Agenten in ein kohärentes, gut gesteuertes Netzwerk. Arbeitsabläufe werden überwacht, nachvollziehbar und anpassungsfähig, während gleichzeitig die Flexibilität erhalten bleibt, bei Bedarf neue Agenten, Tools oder Modelle zu integrieren.
Ein von Atlassian entwickelter Agent könnte beispielsweise nahtlos über das Netzwerk einen spezialisierten Salesforce-Agenten erkennen und aufrufen, wobei Identitäts- und Datenflüsse durch gemeinsame Protokolle verwaltet werden.
Genau das unterscheidet ein agentenbasiertes Netzwerk von herkömmlichen Workflow-Management-Systemen. Konventionelle Orchestratoren können zwar APIs und Aufgaben verbinden, ihnen fehlen aber typischerweise die integrierten Governance-, kontinuierlichen Feedback- und Compliance-Mechanismen, die das Netzwerk bietet.
Anwendungsfälle von Agentic Mesh
Agentenbasierte Mesh-Konzepte gewinnen an Bedeutung, doch praxisnahe, produktionsreife Implementierungen sind noch selten . Die meisten aktuellen Beispiele sind frühe Implementierungen oder Machbarkeitsstudien. Dennoch beginnen einige Anbieter, praktische Anwendungsfälle zu präsentieren:
Kubernetes und Ingress-Steuerung
Anstatt sich ausschließlich auf statische Ingress-Controller zu verlassen, können KI-Agenten in einem agentenbasierten Mesh-System Kubernetes-native Umgebungen erweitern, indem sie Agenten in die Lage versetzen, den Datenverkehr zu verwalten, die Sicherheit durchzusetzen und Workloads über APIs und Ereignisströme hinweg zu optimieren.
Anwendungsbereiche:
- Zugangskontrolle : Agenten erzwingen Authentifizierung, TLS-Terminierung und Richtlinienregeln, um APIs vor unberechtigtem Zugriff zu schützen.
- Cluster-fähige Orchestrierung : Agenten skalieren Arbeitslasten nach oben oder unten und passen Routing-Strategien basierend auf der Ressourcenverfügbarkeit an.
Beispiel aus der Praxis:
Optimierung von Backend-Systemen
Ein Agentennetzwerk kann zur Optimierung von Backend-Systemen beitragen, indem es Agenten ermöglicht, den Datenverkehr zu verwalten, Richtlinien durchzusetzen und Arbeitslasten in Echtzeit auszugleichen.
Anwendungsbereiche:
- Verkehrsmanagement : Um eine Überlastung zu vermeiden, sollten fein abgestufte Ratenbegrenzungen, Quoten und Spitzenkontrollen angewendet werden.
- Lastausgleich : Verteilen Sie eingehende API-Aufrufe und Event-Stream-Datenverkehr auf mehrere Server, um reaktionsschnelle Dienste zu gewährleisten.
- Vermeidung von Engpässen : Übermäßige API- oder Datenstromanfragen erkennen und drosseln, um eine gleichbleibende Leistung zu gewährleisten.
- Resilienz und Verfügbarkeitsoptimierung : Verbesserung der Fehlertoleranz durch Umleitung fehlgeschlagener API-/Ereignisanfragen.
Beispiel aus der Praxis:
Das Eisenbahnunternehmen Eurostar nutzt ein Agentennetzwerk zur Optimierung seiner Backend-Systeme. Es verwaltet den Clientzugriff auf APIs detailliert, um eine sicherere Verkehrssteuerung und Lastverteilung zu gewährleisten. 5
Zentralisierte API-Verwaltung
Ein Agentennetzwerk hilft Organisationen dabei, APIs, Ereignisströme und KI-Agenten auf einer einheitlichen Plattform zu zentralisieren.
Anwendungsbereiche:
- Unterstützung mehrerer Gateways : Integration von APIs verschiedener Plattformen wie AWS, Azure und Apigee
- Authentifizierung auf Unternehmensebene : Gewährleisten Sie eine angemessene Zugriffskontrolle, um festzulegen, wer mit APIs und Agenten interagieren darf.
Beispiel aus der Praxis :
SKF, ein Fertigungsunternehmen, nutzt eine agentenbasierte Mesh-Plattform zur Zentralisierung und Verwaltung seiner APIs. 6
Verwaltung und Bereitstellung von Echtzeitdaten und Ereignisströmen
Ein agentenbasiertes Netzwerk unterstützt Unternehmen bei der Verwaltung und Sicherung des Zugriffs auf Echtzeitdaten und Ereignisströme und ermöglicht so eine nahtlose Integration und Kontrolle. Man kann es sich als zentrale Drehscheibe vorstellen, über die verschiedene Systeme wie APIs und Event-Broker effizient kommunizieren und Daten austauschen können.
Anwendungsbereiche:
- Zentralisierte Sicherheit : Sicherstellen, dass alle Daten und APIs sicher sind und den Organisationsstandards entsprechen.
- Protokollmediation : Konvertierung verschiedener Arten von Datenströmen (z. B. Kafka, MQTT) in gängige, einfach zu verwendende Formate wie REST oder WebSocket.
- API- und Ereigniserkennung : Bereitstellung eines zentralen Portals für Entwickler zum Auffinden und Verwenden von Daten und APIs.
- Einheitliches Management : Alle Arten von APIs und Datenströmen, einschließlich REST und WebSocket, können an einem Ort verwaltet werden.
Die Zukunft von Agentic Mesh: Nur ein weiterer Hype?
Agentic Mesh verspricht eine transformative Möglichkeit für autonome KI-Agenten, innerhalb eines strukturierten Ökosystems zusammenzuarbeiten. Es besteht jedoch die Gefahr, dass es sich zu einem weiteren technischen Rahmenwerk entwickelt, das von Infrastrukturlösungen wie Service Meshes und Integration Fabrics dominiert wird .
- Ein ähnliches Muster zeigte sich beim Data-Mesh- Konzept. Als Zhamak Dehghani es einführte, revolutionierte die Idee das Datenmanagement, indem sie Eigentum, Governance und die Behandlung von Daten als Produkt in den Mittelpunkt stellte. Dennoch vermarkteten Anbieter bestehende Lösungen schnell unter dem neuen Namen Data Mesh. 7
- Derselbe Trend ist nun auch bei agentenbasierten Netzwerken zu beobachten. Obwohl sich die Diskussion auf technische Aspekte wie sichere Kommunikation/Orchestrierung konzentriert, handelt es sich dabei primär um Infrastrukturkomponenten.
Um zu vermeiden, dass es sich nur um ein weiteres Service Mesh 2.0 oder Data Fabric 2.0 mit KI handelt, liegt die eigentliche Chance darin, sich auf die Wertschöpfung zu konzentrieren und nicht nur auf die zugrunde liegende Infrastruktur.
Es ist unerlässlich, dass Geschäftsbereiche die Verantwortung für ihre Agenten übernehmen und sich nicht allein auf Middleware-Anbieter verlassen. Wenn Unternehmen Domänenbesitz, -verwaltung und föderierte Governance fördern, kann ein Agentennetzwerk zu einem wirkungsvollen Transformationswerkzeug werden.
Seien Sie der Erste, der kommentiert
Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich.