Was ist ein Agentensystem? Mein technischer Steckbrief aus der Praxis.

Marcus Machon
vor 7 Tagen
10 Min. Lesezeit

Aktualisiert: vor 1 Tag

Dieser Beitrag ist selbst schon ein Teil des Beispiels. Die Brücke ist wichtig: Die Frage "Was ist ein Agentensystem?" beantworte ich hier nicht abstrakt, sondern mit einem echten Output meines End-to-End-Blogprozesses. Der Text, den Sie gerade lesen, ist also nicht nur ein Artikel über ein Agentensystem.

Laptop-Hero zum Agentensystem mit großer Text-Hook und eingebetteter Architektur-Infografik. — Die Vorschau bringt die Kernaussage auf den Punkt: Ein Agentensystem ist kein Chatbot, sondern ein steuerbares Arbeitssystem aus Wissen, Werkzeugen und Kontrolle.

End-to-End, kurz E2E, heißt hier: nicht nur "KI schreibt einen Text". Gemeint ist der ganze Weg von der ersten Idee bis zum geprüften Website-Entwurf. In diesem konkreten Fall hat Nous internes Wissen gesucht, ältere Blogposts verlinkt, SEO- und GEO-Daten geprüft, passende Grafiken und Screenshots aus der Asset-Bibliothek gezogen, den Text erstellt, Quellen geprüft und Pre-Publish-Checks ausgeführt.

SEO steht für Suchmaschinenoptimierung: Wird der Beitrag bei Google oder Bing zu den richtigen Begriffen auffindbar? GEO steht für Generative Engine Optimization: Wird der Beitrag so geschrieben und belegt, dass KI-Suchsysteme und Antwortmaschinen ihn sauber verstehen, einordnen und zitieren können? Das klingt nach Marketing, ist hier aber vor allem Quellen- und Strukturarbeit.

Wichtig: Das heißt nicht "vollautomatisch veröffentlichen". Der Artikel ist als lebendes Dokument angelegt. Beim Refresh können Kennzahlen wie Tabellen, Datensätze, Markdown-Dateien, Skills, Skripte oder aktive Automatisierungen neu aus dem System gezogen werden. Genauso können neue Erfahrungen, bessere Workflows, neue Vorteile und neu erkannte Risiken ergänzt werden. Veröffentlicht wird aber erst nach menschlicher Prüfung.

Ich will diesen Beitrag künftig als aktuellen Überblick nutzen. Neue Blogposts können hierauf verlinken, damit Leserinnen und Leser nicht jedes Mal das ganze System neu erklärt bekommen, sondern einen gepflegten Stand sehen: Was kann Nous gerade, wo hilft es wirklich, wo nervt es, und welche Risiken sind heute sichtbar?

Was ist ein Agentensystem?

Kurz gesagt: Ein Agentensystem ist ein KI-Arbeitssystem, das wiederkehrende Aufgaben nicht nur beantwortet, sondern entlang von Wissen, Werkzeugen, Regeln und Prüfungen ausführt.

Ein Chatbot beantwortet Fragen. Ein Agentensystem erledigt wiederkehrende Wissensarbeit in einem dauerhaften Arbeitskontext.

Bei mir arbeitet die KI nicht nur im Chatfenster, sondern direkt mit Dateien, Datenbank, Suchsystem und Workflows, abgesichert durch Qualitätsregeln und Freigabe-Gates. Was ist ein Agentensystem in der Praxis? Genau diese Verbindung aus Wissen, Ausführung und Kontrolle. Wie unterscheidet sich ein Agentensystem von einem Chatbot? Vor allem dadurch, dass es Arbeitsschritte ausführt und dokumentiert, statt nur Antworten zu formulieren. Es recherchiert und schreibt, prüft Quellen, aktualisiert Dokumente und spielt geprüfte Ergebnisse zurück ins Wissenssystem.

Mein System heißt intern Nous. Das Nous Agentensystem ist kein Produkt von Microsoft, OpenAI oder Anthropic, sondern mein eigenes lokales KI-Arbeitssystem für Beratung, Content, Akquise, Wissensmanagement, Reporting und kontinuierliche Verbesserung.

Ich habe den grundsätzlichen Aufbau schon einmal ausführlicher beschrieben: Wie ich mein Multi-Agent-System aufgebaut habe. Die Schwächen und Fehlerklassen liegen separat hier: Multi-Agent-System Schwächen. Dieser Beitrag ist der technische Steckbrief aus heutiger Sicht.

Technischer Steckbrief: Stand 24. Mai 2026

Die folgenden Zahlen sind keine Marketingzahlen, sondern live aggregierte Systemdaten. Keine Inhalte, keine Kundendaten, nur Zählwerte.

159 fachliche Datenbanktabellen in der zentralen SQLite-Datenbank
279.566 Datensätze über diese fachlichen Tabellen
5.506 Markdown-Dateien im nous-Repo, ohne Node-Abhängigkeiten
24 aktive Skills: 19 fachliche Skills plus 5 System-Skills
26 Skill-Dateien insgesamt, inklusive Archivbestand
29 definierte Workflows
375 operative Skriptdateien mit Python, Shell oder JavaScript; 686 Dateien insgesamt unter scripts/
175 registrierte Automatisierungen, davon 149 aktiv
27 Feed-Ordner mit 1.366 Feed-Dateien
6 produktive Node-Apps plus ein geteiltes Modul
1.887 Content-Pieces im Content-System, darunter 33 Blog-Pieces

Das ist für eine Solo-Beratung ziemlich groß. Gleichzeitig ist es bewusst kein Enterprise-System. Es läuft lokal, mit klaren Grenzen, ohne kritische Kundendaten im Wissensspeicher.

Was bedeutet LLM-agnostisch?

Kurz gesagt: Das Modell ist austauschbarer als der Arbeitsprozess. Wissen, Regeln und Workflows bleiben lokal, auch wenn sich das ausführende LLM ändert.

LLM-agnostisch heißt: Die Arbeitslogik hängt nicht vollständig an einem einzigen Modell oder Anbieter. Für mich ist Nous deshalb bewusst als LLM-agnostisches KI-Arbeitssystem angelegt.

Claude Code ist aktuell mein wichtigstes Arbeitswerkzeug. Codex nutze ich für Reviews, Gegenprüfungen und Code-Perspektive. Andere Modelle können dazukommen. Entscheidend ist: Die Regeln, Skills, Workflows, Dokumente, Daten und Prüfprozesse liegen lokal im System, nicht nur im Gedächtnis eines Chatbots.

Das reduziert Lock-in. Wenn ein Modell schwächer wird, teurer wird oder ein anderes Modell für eine Aufgabe besser passt, muss ich nicht das ganze System neu bauen. Ich tausche eher den ausführenden Agenten als die Architektur.

Die Architektur: Layer, Domänen und CCCs

Ich denke Nous inzwischen in drei Koordinaten: Layer, Domänen und Cross-Cutting Concerns. Das klingt technischer als es ist.

Infografik zum Multi-Agent-System mit fünf Layern, neun Domänen, Cross-Cutting Concerns und Feedback-Loop. — Die technische Landkarte: Layer ordnen Verantwortung, Domänen ordnen Arbeit, Cross-Cutting Concerns sichern Qualität.

Layer beantworten die Frage: Auf welcher Ebene passiert die Arbeit?

Strategie und Vision: Ziele, Positionierung, Angebote, Prioritäten, Grenzen.
Wissen und Architektur: KI-Wiki, Quellen, Entscheidungen, Regeln, Erfahrungswissen.
Infrastruktur, Daten und Apps: Datenbank, Apps, Skripte, Schnittstellen, Logs, Backups.
Operations: Skills, Workflows, Automatisierungen, Audits, Content, Leads, Projekte.
Business-Outcome und Markt: Resonanz, Leads, Gespräche, Umsatz, Kundennutzen, Lerneffekte.

Domänen beantworten die Frage: In welchem Arbeitsbereich wird das System eingesetzt?

System- und Infrastruktur-Betrieb: Apps, Backups, Monitoring, Laufzeitfehler.
Sales und Akquise: Leads, Briefings, CVs, Angebote, Gesprächsvorbereitung.
Marketing, Content und Brand: Blog, LinkedIn, Website, Themenplanung, Stilregeln.
Produkte und produktisierte Services: Angebote, Pakete, Leistungslogik.
Service Delivery und Consulting: Kundennahe Arbeitsabläufe, Konzepte, Vorbereitung.
Finance, Faktura und Zeiterfassung: Rechnungsentwürfe, Zeiten, Projektkosten.
Wissensmanagement: KI-Wiki, Evidence, Studien, interne Suche, Feeds.
Reporting und Analytics: Website, Content, KPIs, Systemzustand.
Self-Improvement: Fehlerwissen, Skill-Evals, Architektur-Reviews, Drift-Korrektur.

CCCs sind die Prüfbrillen, die überall mitlaufen. CCC steht für Cross-Cutting Concern. Gemeint sind Themen, die nicht in eine einzelne Schublade passen.

Security: Was darf ein Agent lesen, schreiben oder ausführen?
Datenschutz und Compliance: Welche Daten gehören nicht ins System?
Kosten und Tokenverbrauch: Ist der Aufwand wirtschaftlich sinnvoll?
Observability: Merke ich, wenn etwas schiefläuft?
Reliability und Backup: Was passiert bei Fehlern, Ausfällen oder Datenverlust?
Knowledge Governance: Bleiben Wiki, Datenbank, Workflows und Realität synchron?
Voice und Authentizität: Klingt ein Text nach mir oder nach generischer KI?
Multi-LLM-Orchestration: Welches Modell macht welche Aufgabe, und wer prüft wen?
Operator Capacity: Wie viel Systempflege kann ich als Einzelperson realistisch tragen?

Ohne diese drei Ebenen wäre Nous nur eine große Tool-Sammlung. Mit ihnen wird es steuerbar.

Eine Oberfläche dafür ist Nous HQ, eine interne Web-App und mein täglicher Einstieg ins System. Die Gartenhaus-Analogie ist meine Kurzsprache: Das Grundstück zeigt den Gesamtzustand, die Wetterstation Systemsignale, die Werkbank offene Arbeit, der Marktstand Akquise und Leads, die Bücherei Wissen und Quellen. Im Blog zeige ich bewusst den zugeschnittenen Ausschnitt, nicht operative Detailpanels.

Screenshot der Nous HQ Gartenhaus-Ansicht mit Grundstück, Wetterstation, Werkbank, Marktstand und Bücherei als Systemmetapher. — Nous HQ übersetzt den Systemzustand in eine Arbeitsoberfläche: Gartenhaus statt reiner Tabellen- oder Ticketansicht.

Wie funktioniert ein End-to-End-Blogprozess mit einem Agentensystem?

Der Blogprozess ist das beste Beispiel, weil dieser Artikel genau dadurch entstanden ist und künftig darüber gepflegt werden soll.

Der Ablauf ist grob:

Thema oder Impuls aufnehmen.
Vorhandenes Wissen im KI-Wiki suchen.
Alte Blogposts, Content-Pieces, Studien und Evidence prüfen.
SEO- und GEO-Daten aus Search Console, Bing und Content-Performance auswerten.
Struktur und Argumentation entwickeln.
Draft schreiben.
Fakten, Quellen, Tonalität und Anti-KI-Tells prüfen.
Asset-Bibliothek nach passenden Infografiken oder Screenshots durchsuchen.
Veröffentlichung im Website-CMS vorbereiten. CMS heißt Content-Management-System, also das System, in dem ein Website-Artikel als Entwurf landet.
Nach Veröffentlichung Performance messen und später refreshen.

Das Entscheidende ist der Kreislauf. Ein Blogartikel ist nicht nur Output. Er erzeugt wieder Daten: Welche Themen funktionieren? Welche Begriffe ranken? Welche Aussagen brauchen bessere Belege? Welche Grafiken werden wiederverwendet?

Den separaten Werkstattbericht zu genau diesem Workflow habe ich hier dokumentiert: Mein automatisierter Blogprozess.

Infografik des automatisierten Blogprozesses bei Nous Works, neun Phasen vom Prompt bis zur Veröffentlichung. — Der Blogworkflow ist kein einzelner Prompt, sondern ein Prozess aus Recherche, Schreiben, Faktencheck, Asset-Auswahl, Publishing und späterem Refresh.

Wie kann ein KI-Wiki beim Faktencheck helfen?

Das KI-Wiki ist der Kern des Systems. Dort liegen Architekturentscheidungen, Workflows, Quellen, Studien, Erkenntnisse, Fehlerpattern und operative Dokumentation.

Feeds bringen laufend neue Signale hinein: Microsoft 365 Roadmap, BSI, Arxiv, Hacker News, Marktquellen, Wettbewerber, Projektbörsen und weitere Quellen. Diese Signale werden nicht automatisch als Wahrheit übernommen. Sie können triagiert, bewertet, mit bestehendem Wissen verknüpft und bei Bedarf in Evidence, Tasks, Content-Ideen oder Reports überführt werden.

Beim Faktencheck läuft es ähnlich. Ein Claim soll nicht nur "plausibel" klingen. Das System sucht vorhandene Quellen, prüft Primärquellen, markiert Konfidenz und trennt interne Hypothesen von veröffentlichbaren Aussagen. Das ist langsamer als reines Schreiben, aber deutlich robuster.

Genau dieser Punkt unterscheidet ein Agentensystem vom Chatfenster: Wissen wird nicht nur konsumiert, sondern dauerhaft sortiert, geprüft und wiederverwendbar gemacht.

Den Faktencheck-Teil habe ich ausführlicher in einem eigenen Beitrag beschrieben: KI-Faktenprüfung: Wie ein Wissenssystem Fakten prüft, bevor sie im Feed landen.

Der Begriff Agent Skills meint in meinem System wiederverwendbare Arbeitsanweisungen für wiederkehrende Aufgaben. Das ist kein Prompt-Sammelsurium, sondern eher eine kleine Betriebsanleitung pro Arbeitsform.

Dynamische CV-Erstellung

Ein anderes Beispiel ist die CV-Erstellung.

Der Lebenslauf wird nicht manuell als Word-Datei gepflegt. Er entsteht aus strukturierten Quellen: Profil, Projektfälle, Erfahrungsbausteine und bei Bedarf ein konkretes Briefing. Daraus erzeugt das System einen passenden CV als Markdown, HTML und PDF.

Das klingt klein, ist praktisch aber relevant. Für eine Recruiter-Anfrage brauche ich keinen halben Tag, um alte Projekte zusammenzukopieren. Der Workflow zieht passende Erfahrungen, achtet auf externe Sprache, meidet interne Begriffe und erzeugt ein sauberes PDF. Vor Versand läuft ein Validator: Seitenzahl, sichtbare Platzhalter, interne Begriffe, Kundennamen, Layout.

Das ist für mich ein typischer Agentensystem-Use-Case: nicht spektakulär, aber wiederholbar, prüfbar und direkt nützlich.

Screenshot eines automatisch erzeugten CVs von Marcus Machon mit redigierter Telefonnummer und angepassten Projektbausteinen. — Der CV wird aus Profil, Projektbausteinen und Briefing dynamisch erzeugt; sichtbare Telefonnummer wurde für den Blog redigiert.

Recherche, Leads und Marktbeobachtung

Nous verarbeitet außerdem Markt- und Lead-Signale. Damit meine ich nicht nur klassische "Leadlisten", sondern laufende Hinweise aus mehreren Quellen: Freelancer-Plattformen, Vermittler-Mails, Microsoft-News, Microsoft-365-Roadmap, BSI-Meldungen, arXiv/Paper-Feeds, Studien, Marktquellen und Wettbewerber.

Ein greifbares Beispiel ist meine Freelancer-Projektpipeline. Plattformen wie freelance.de, freelancermap, GULP oder Vermittler-Mails schicken neue Projektanfragen. Nous extrahiert daraus die wichtigsten Punkte: Titel, Quelle, Ort oder Remote-Anteil, Start, Dauer, Stundensatz, gesuchte Skills und fachlichen Fit zu meinem Profil. Danach bewertet das System den Treffer grob auf einer Skala von 0 bis 10.

Bei einem relevanten Treffer bekomme ich keine fertige Bewerbung, sondern einen kompakten Hinweis. Der Discord-Screenshot zeigt so einen Fall: Microsoft 365, SharePoint und Exchange Online, Score 7,0 von 10, Rahmenbedingungen und nächster Schritt. Discord ist hier nur der Alarmkanal. Die eigentliche Arbeit passiert vorher in der Pipeline.

Discord-Benachrichtigung des Nous Sales-Bots zu einem Freelancer-Match mit Score, Skills, Rahmen und nächstem Schritt. — Discord ist hier nur der Alarmkanal: Das System hat vorher ein Projekt erkannt, bewertet und mit nächstem Schritt verdichtet.

Auch hier gilt: Kein Blindflug. Ein Lead oder Projekt ist nicht automatisch gut, nur weil die KI ihn gefunden hat. Interessant wird es, wenn Quelle, Kriterien, Kontext und nächste Aktion zusammenkommen: ignorieren, prüfen, CV anpassen, Bewerbung vorbereiten, Aufgabe anlegen oder als Marktsignal speichern.

Das gleiche Prinzip gilt für inhaltliche Feeds. Ein konkretes Beispiel war Microsofts Automated Readiness Assessment, kurz ARA, für Microsoft 365 Copilot Readiness. Den Hinweis hätte ich fast übersehen. Mein eigenes KI-Wiki und Feed-System hat mich darauf gestoßen. Daraus wurde erst eine Analyse mit Testlauf und dann ein veröffentlichter Beitrag. Den LinkedIn-Post dazu habe ich hier dokumentiert: ARA wäre fast untergegangen; mein KI-Wiki hat mich darauf gestoßen.

Aktuelle Chancen und Vorteile

Wissen verschwindet nicht im Chatverlauf. Recherchen, Entscheidungen und Fehler landen im Wiki oder in der Datenbank und werden später wiedergefunden.
Wiederholbare Qualität. Blog, CV, Faktencheck, Recherche oder Review laufen nicht jedes Mal als improvisierter Prompt, sondern entlang definierter Workflows.
Bessere Quellenhygiene. Veröffentlichbare Aussagen können mit Evidence, Primärquelle und Konfidenz verknüpft werden.
Schnellere Umsetzung. Viele Strukturänderungen, Auswertungen oder Dokumentationsupdates dauern Minuten statt Stunden, weil die KI direkt mit Dateien und Skripten arbeiten kann.
Mehr Hebel für Solo-Arbeit. Ich kann Themen parallel vorbereiten, die ohne System schlicht liegenbleiben würden.
LLM-Wechsel bleibt möglich. Wissen und Prozesslogik liegen lokal. Modelle sind ausführende Rollen, nicht das eigentliche System.
Lernschleifen entstehen automatisch leichter. Fehler, Performance-Daten und Reviews können zurück in Skills, Regeln und Workflows fließen.
Die Richtung wird extern bestätigt. Microsoft geht mit Copilot Cowork ebenfalls von Chat zu Ausführung: Aufgaben erledigen, Dokumente erstellen, E-Mails und Kalender steuern, jeweils mit Freigabe vor Aktionen Microsoft Learn, 2026.

Welche Risiken haben Agentensysteme aktuell?

Tokenverbrauch ist real. Anthropic berichtet für Multi-Agent-Systeme von etwa 4-fachem Tokenverbrauch gegenüber Chat und etwa 15-fachem Verbrauch bei Multi-Agent-Systemen gegenüber einfachen Chats Anthropic Engineering, 2025. Das passt zu meiner Praxis: bessere Ergebnisse, aber nicht kostenlos.
Agent Drift passiert leise. Der Agent arbeitet formal sauber, entfernt sich aber vom eigentlichen Ziel, nutzt veraltete Hinweise oder gewichtet Regeln falsch.
Mehr System heißt mehr Pflege. Skills, Skripte, Workflows, Datenbank, Apps und Dokumentation müssen zusammenbleiben. Sonst entsteht Scheinsicherheit.
Automatisierung wiederholt auch falsche Annahmen. Ein schlechter Cronjob ist nicht einmal falsch, sondern jeden Tag wieder.
Security ist kein Nebenthema. Lokaler Betrieb reduziert bestimmte Risiken, ersetzt aber keine Zugriffskontrolle, Secret-Hygiene und klare Grenzen.
Datenschutz setzt harte Grenzen. Kundendaten gehören bei mir nicht ins Markdown-Wiki. Kundennähe bleibt in kontrollierteren Strukturen.
Cross-Reviews sind hilfreich, aber keine Wahrheit. Zwei LLMs können sich gegenseitig bestätigen und trotzdem falsch liegen.
Over-Engineering ist eine echte Gefahr. Man kann sich hervorragend mit Systempflege beschäftigen und dabei Markt, Kunden und Umsatz aus den Augen verlieren.
Der Mensch bleibt der Engpass. Ich muss Ziele setzen, Prioritäten wählen, Freigaben geben und entscheiden, wann ein Ergebnis gut genug ist.

Einordnung zu Microsoft 365 Copilot Cowork

Microsoft 365 Copilot Cowork ist für mich ein spannender Referenzpunkt, weil Microsoft damit dieselbe Richtung bestätigt: weg vom Chat, hin zu delegierter Arbeit. Cowork soll Aufgaben in Microsoft 365 ausführen, Skills nutzen, Integrationen anbinden und in der Frontier-Phase laufend erweitert werden Microsoft, 2026.

Microsoft beschreibt Cowork knapp als System, das nicht nur beschreibt, was man tun könnte, sondern Arbeit ausführt: "it does the work" Microsoft Learn, 2026.

Fairerweise hat Cowork Dinge, die mein System nicht hat: tiefe Microsoft-365-Integration, Enterprise-Nähe, Benutzeroberfläche, Berechtigungsmodell, Hersteller-Support.

Mein System hat dafür andere Stärken: lokale Dateien, eigene Datenbank, eigene Skills, eigene Workflows, eigene Skripte, eigenes Wiki, freie Modellwahl, volle Anpassbarkeit. Es ist flexibler, aber auch rauer. Ich trage Betrieb, Pflege, Security-Entscheidungen und Fehler selbst.

Deshalb ist mein Punkt nicht: "Mein System ist besser als Cowork." Mein Punkt ist: Cowork zeigt, wohin der Markt geht. Mein System zeigt, was heute schon möglich ist, wenn man die Plattformgrenzen nicht akzeptieren muss und bereit ist, die technische Verantwortung selbst zu tragen.

Was ich daraus ableite

Für mich ist Nous kein Beweis, dass Agentensysteme magisch funktionieren. Es ist eher der Beweis, dass sie nützlich werden, wenn vier Dinge zusammenkommen:

echtes Wissen statt Chatverlauf
Werkzeuge mit klaren Grenzen
wiederholbare Workflows
harte Prüfungen vor Veröffentlichung oder Außenwirkung

Die wichtigste Lektion ist unspektakulär: Autonomie allein bringt wenig. Ein Agentensystem wird stark, wenn es gute Leitplanken, gute Quellen, gute Feedbackschleifen und einen Menschen hat, der Verantwortung übernimmt.

Wenn Sie im Mittelstand über KI nachdenken, würde ich nicht mit "großer Transformation" anfangen. Ich würde mit unkritischen, wiederkehrenden Wissensprozessen starten: Recherche, internes Wiki, Content, Angebotsvorbereitung, CVs, Marktbeobachtung, einfache Reports. Dort lernt man schnell, ohne gleich die riskanten Daten anzufassen.

Der ergänzende strategische Blick dazu steht hier: KI-Strategie im Mittelstand.

Mein aktueller Stand: Ich würde Nous nicht mehr abschalten wollen. Aber ich würde es auch niemandem als Selbstläufer verkaufen. Es ist ein Werkzeug für Menschen, die bereit sind, sauberer zu arbeiten als vorher. Nicht weniger.

Wenn Sie prüfen wollen, welche unkritischen Wissensprozesse in Ihrem Unternehmen für so einen Einstieg taugen, können wir das in einem kompakten Reality Check sortieren.

Weiterführende Blogbeiträge

Kennenlerngespraech buchen

Über den Autor: Marcus Machon berät mittelständische Unternehmen bei Microsoft 365 Governance, SharePoint-/Teams-Struktur, Power-Platform-Automatisierung und Copilot-/KI-Readiness.

LinkedIn-Profil · Über Marcus

Quellen

Anthropic Engineering (2025): How we built our multi-agent research system. https://www.anthropic.com/engineering/built-multi-agent-research-system
Anthropic (2026): Building Effective AI Agents. https://resources.anthropic.com/building-effective-ai-agents
Microsoft Learn (2026): Cowork overview (Frontier). https://learn.microsoft.com/en-us/microsoft-365/copilot/cowork/
Microsoft 365 Blog (2026): Copilot Cowork: From conversation to action across skills, integrations, and devices. https://www.microsoft.com/en-us/microsoft-365/blog/2026/05/05/copilot-cowork-from-conversation-to-action-across-skills-integrations-and-devices/