KI-Agent aufbauen: 8 Bausteine für Ihr Unternehmen

KI-Agent aufbauen: 8 Bausteine für Ihr Unternehmen

Table of Contents

Dieser Artikel wurde mit Künstlicher Intelligenz erstellt und redaktionell kuratiert.

⚡ In 30 Sekunden

  • Ein KI-Agent ist kein Chatbot – er verfolgt Ziele, nutzt Werkzeuge und trifft eigenständig Entscheidungen innerhalb definierter Grenzen.
  • Der Aufbau gelingt mit 8 Bausteinen: Ziel, System Prompt, Modellwahl, Tools, Memory, Orchestrierung, Interface und Evaluation.
  • Praxisbeispiel im Artikel: Ein Handelsunternehmen baut einen Bestell-Agenten – von der Problemstellung bis zum laufenden System.
  • Für Unternehmen gilt: Klein anfangen, einen messbaren Prozess wählen, Risiken begrenzen.
  • Geeignete Plattformen reichen von No-Code-Tools (n8n, Relay.app) bis zu Entwickler-Frameworks (LangGraph, CrewAI).

👤 Für wen ist dieser Artikel?

Geschäftsführer & Entscheider: Verstehen, was einen KI-Agenten ausmacht und welche Voraussetzungen nötig sind. IT-Leiter & Projektverantwortliche: Praktische Checkliste für die Planung des ersten Agenten. Fachabteilungen: Einschätzen, welche eigenen Prozesse sich für eine Agentenlösung eignen.

Ein mittelständisches Handelsunternehmen aus dem Ruhrgebiet kämpft mit einem klassischen Problem: Jeden Montag verbringen zwei Mitarbeiter je drei Stunden damit, Lagerbestände zu prüfen, Lieferanten-Angebote zu vergleichen und Bestellungen manuell in das ERP-System einzupflegen. 30 Arbeitsstunden pro Monat – für einen Prozess, der nach festen Regeln abläuft und in dem selten wirklich kreative Entscheidungen gefragt sind.

Genau für solche Szenarien sind KI-Agenten gemacht. Kein Hype, keine Science-Fiction – sondern ein Software-System, das Ziele verfolgt, Daten abruft, Entscheidungen nach definierten Regeln trifft und Ergebnisse dokumentiert. Dieser Artikel zeigt, welche acht Bausteine ein solcher Agent braucht – am durchgehenden Beispiel des Bestell-Agenten.

Was ist ein KI-Agent – und was nicht?

Ein KI-Agent unterscheidet sich grundlegend von einem einfachen Chatbot. Ein Chatbot antwortet auf Fragen. Ein Agent handelt: Er analysiert eine Situation, wählt das passende Werkzeug, führt einen Schritt aus, wertet das Ergebnis aus – und wiederholt diesen Zyklus, bis das Ziel erreicht ist oder ein Mensch eingreifen muss.

Unser Bestell-Agent würde also nicht einfach fragen: „Soll ich bestellen?" Er prüft selbstständig die Lagerbestände, ruft aktuelle Preise von drei Lieferanten ab, berechnet die wirtschaftlich sinnvollste Option und legt einen Bestellvorschlag an – zur finalen Freigabe durch einen Mitarbeiter.

Baustein 1: Zweck und Umfang – der Agent braucht einen klaren Auftrag

Am Anfang steht nicht die Technologie, sondern die Frage: Welches konkrete Problem soll der Agent lösen? Je enger und messbarer dieser Auftrag ist, desto einfacher lassen sich alle weiteren Entscheidungen ableiten.

Für das Handelsunternehmen lautet die Antwort: „Der Agent prüft montags um 07:00 Uhr automatisch alle Artikel mit Mindestbestand, vergleicht die aktuellen Preise der drei Hauptlieferanten und erstellt einen Bestellvorschlag im ERP-System – zur manuellen Freigabe durch den Einkaufsleiter." Das ist kein vages Ziel, sondern ein messbarer Workflow.

✅ Checkliste: Zweck definieren

  • Welchen Prozess soll der Agent übernehmen – vollständig oder nur Teile davon?
  • Wer ist der Nutzer oder Auftraggeber des Agenten?
  • Woran erkennen wir, dass der Agent erfolgreich arbeitet?
  • Welche Entscheidungen darf er allein treffen – und wo muss ein Mensch freigeben?

Baustein 2: System Prompt – die Betriebsanleitung des Agenten

Der System Prompt ist der unsichtbare Chef-Instrukteur des Agenten. Er legt fest, wie der Agent denkt, kommuniziert, handelt – und wo seine Grenzen liegen. Ein schlecht formulierter System Prompt ist der häufigste Grund für unzuverlässige Agenten-Ergebnisse.

Für den Bestell-Agenten könnte das so aussehen: „Du bist ein Einkaufsassistent für [Unternehmen]. Deine Aufgabe ist es, wöchentlich Bestellvorschläge zu erstellen. Du darfst Preise vergleichen und Vorschläge anlegen, aber keine Bestellungen ohne Freigabe auslösen. Wenn ein Lieferant keine aktuellen Preise liefert, kennzeichne den Artikel als unklar und eskaliere an den Einkaufsleiter."

Wichtige Elemente eines guten System Prompts sind die Rollenbeschreibung, die konkreten Handlungsanweisungen, klare Grenzen (sogenannte Guardrails) und das gewünschte Ausgabeformat. Für produktive Agenten empfiehlt sich, Prompts versioniert zu pflegen – kleine Änderungen können große Auswirkungen auf das Verhalten haben.

Baustein 3: Das passende KI-Modell wählen

Nicht jeder Agent braucht das leistungsstärkste – und damit teuerste – Sprachmodell. Die Modellwahl sollte sich am konkreten Anwendungsfall orientieren. Für einfache Klassifikationen und regelbasierte Prozesse genügt oft ein kostengünstigeres Modell. Für komplexe Planung, mehrstufige Schlussfolgerungen oder das Verarbeiten langer Dokumente lohnt sich ein leistungsstärkeres.

AnforderungEmpfehlungTypisches Modell
Einfache Klassifikation, TextzusammenfassungKleines, schnelles Modellz.B. GPT-4o mini, Claude Haiku
Mehrstufige Planung, komplexe EntscheidungenLeistungsstarkes Modellz.B. Claude Sonnet, GPT-4o
Sehr lange Dokumente, hohe PräzisionGroßes Kontextfensterz.B. Claude Opus, Gemini Pro
Sensible Daten, DSGVO-kritischOn-Premise oder EU-hostedz.B. Llama 3 lokal, Azure EU
Orientierungshilfe – die optimale Wahl hängt immer vom konkreten Workflow ab.

Für den Bestell-Agenten reicht in der Regel ein mittelgroßes Modell: Der Prozess ist klar strukturiert, die Datenmenge überschaubar, und es geht weniger um kreatives Denken als um zuverlässiges Befolgen von Regeln.

Baustein 4: Tools anbinden – der Agent braucht Werkzeuge

Der entscheidende Unterschied zwischen einem Chatbot und einem echten Agenten liegt in den Tools. Ein Agent kann externe Systeme nutzen: Er ruft Daten ab, schreibt Einträge, löst Aktionen aus. Für den Bestell-Agenten bedeutet das konkret: eine Schnittstelle zum ERP-System, ein Tool zum Abrufen von Lieferantenpreisen (per API oder Web-Abfrage) und eventuell einen Zugang zum internen Dateiserver.

Ein wichtiger Grundsatz: Der Agent bekommt nur die Tools, die er wirklich braucht. Zu viele Berechtigungen erhöhen das Risiko von Fehlern und erschweren spätere Audits. Wer den Agenten in ein Unternehmenssystem integriert, sollte auch prüfen, ob ein verwalteter Agentendienst wie Claude Managed Agents die Infrastrukturarbeit abnehmen kann.

Baustein 5: Memory – was der Agent wissen und behalten darf

Ein Agent ohne Gedächtnis fängt bei jedem Lauf bei null an. Das reicht für einfache Aufgaben – aber nicht, wenn der Bestell-Agent wissen muss, welche Artikel letzte Woche bestellt wurden, ob ein Lieferant zuletzt verzögert geliefert hat oder welche Saisonprodukte gerade im Fokus stehen.

Memory-Systeme für Agenten funktionieren auf verschiedenen Ebenen: das kurzfristige Working Memory (aktuelle Sitzung), ein Verlaufsgedächtnis für zurückliegende Aufgaben und eine Wissensdatenbank für Stammdaten wie Lieferantenkonditionen. Für Unternehmen gelten dabei klare Regeln: Was gespeichert wird, muss DSGVO-konform sein – mit definierten Löschfristen und Zugriffsrechten.

⚠️ DSGVO-Hinweis

Sobald ein Agent personenbezogene Daten verarbeitet oder speichert – z.B. Namen von Lieferantenkontakten oder Mitarbeiterdaten – greift die DSGVO. Eine Datenschutz-Folgenabschätzung (Art. 35 DSGVO) kann erforderlich sein. Im Einzelfall empfiehlt sich die Rücksprache mit dem Datenschutzbeauftragten.

Baustein 6: Orchestrierung – wie der Agent seinen Ablauf steuert

Orchestrierung beschreibt, wie der Agent seinen Workflow organisiert: Wann startet er, in welcher Reihenfolge führt er Schritte aus, was passiert bei Fehlern – und wann holt er sich menschliche Rückendeckung?

Für den Bestell-Agenten sieht der Ablauf so aus: Montags 07:00 Uhr startet ein automatischer Trigger. Der Agent prüft alle Artikel mit Mindestbestand (Schritt 1), ruft für jeden Artikel die Preise der drei Lieferanten ab (Schritt 2), berechnet den günstigsten Anbieter unter Berücksichtigung der Lieferzeit (Schritt 3) und legt den Bestellvorschlag im ERP an (Schritt 4). Scheitert Schritt 2 für einen Artikel – weil kein Preis verfügbar ist – markiert er diesen als „ungeklärt" und sendet eine Slack-Nachricht an den Einkaufsleiter.

Besonders wichtig in Unternehmensumgebungen ist der sogenannte Human-in-the-Loop: Der Agent handelt nicht unkontrolliert, sondern holt sich dort menschliche Freigabe, wo Entscheidungen finanzielle oder rechtliche Konsequenzen haben. Bei unserem Beispiel ist das die finale Bestellfreigabe.

Baustein 7: Interface – wie Nutzer mit dem Agenten interagieren

Ein Agent braucht eine passende Oberfläche. Das muss kein aufwendiges Frontend sein – häufig reicht ein Slack-Bot, eine E-Mail-Benachrichtigung oder ein einfaches Dashboard, das den Status anzeigt. Wichtig ist, dass Nutzer verstehen, was der Agent getan hat, warum er eine bestimmte Entscheidung getroffen hat und wo menschliche Rückmeldung erwartet wird.

Beim Bestell-Agenten sieht das Interface simpel aus: Der Einkaufsleiter erhält montags früh eine E-Mail mit dem Bestellvorschlag als PDF. Ein Klick führt ihn zur Freigabe-Seite im ERP. Artikel mit ungeklärtem Status sind farbig markiert. Das reicht – kein Chat, keine eigene App.

Baustein 8: Testing und Evaluation – erst testen, dann produktiv schalten

Ein Agent ist erst dann produktionsreif, wenn er systematisch getestet wurde. Dabei reicht es nicht, einige Beispieldurchläufe manuell zu beobachten. Gute Evaluation umfasst realistische Testfälle aus dem Alltag – inklusive Grenzfällen.

Für den Bestell-Agenten bedeutet das: Wie verhält er sich, wenn ein Lieferant keine aktuellen Preise liefert? Was passiert, wenn das ERP-System kurzzeitig nicht erreichbar ist? Gibt er korrekte Vorschläge bei Saisonartikeln mit unregelmäßigem Bedarf? Stimmen Kosten und Latenz im Alltag mit den Erwartungen überein?

Für Unternehmen gilt: Halten Sie die Testfälle und deren Ergebnisse fest. Sie bilden die Grundlage für kontinuierliche Verbesserungen – und bei EU AI Act-relevanten Einsatzgebieten (z.B. automatisierte Entscheidungen im Finanzbereich) können sie auch für Dokumentationspflichten relevant sein.

Welche Plattformen eignen sich für den Einstieg?

Nicht jedes Unternehmen muss einen Agenten von Grund auf selbst entwickeln. Je nach technischer Reife und Anforderung gibt es sehr unterschiedliche Ausgangspunkte:

KategorieBeispieleGeeignet fürTypischer Einsatzbereich
No-Code Buildern8n, Relay.app, LindyTeams ohne Entwickler, schnelle AutomatisierungenBestellprozesse, Datenpflege, Benachrichtigungen
Verwaltete AgentendiensteClaude Managed Agents, Azure AI Agent ServiceIT-Teams, die keine eigene Infrastruktur aufbauen wollenDokumentenverarbeitung, mehrstufige Workflows
Agentic Coding ToolsCursor, Claude CodeEntwicklungsteamsCode-Reviews, automatisierte Tests, Refactoring
Entwickler-FrameworksLangGraph, CrewAI, LlamaIndexUnternehmen mit speziellen AnforderungenMulti-Agenten-Systeme, RAG-Workflows, Individuallösungen
Stand April 2026 – Plattformmarkt entwickelt sich schnell.

Für den Bestell-Agenten aus unserem Beispiel wäre n8n oder Relay.app ein sinnvoller Einstieg: Die ERP-Anbindung lässt sich per API realisieren, der Workflow visuell abbilden – ohne eigenes Entwicklungsteam.

Von der Idee zum ersten Agenten: Empfohlener Einstieg

✅ In 7 Schritten zum ersten Agenten

  1. Einen konkreten, messbaren Prozess auswählen – idealerweise regelbasiert, zeitintensiv, wenig kreativ.
  2. Erfolgskriterien definieren – was muss der Agent liefern, damit er als „gut" gilt?
  3. System Prompt und Grenzen formulieren – Rolle, Aufgaben, Guardrails, Ausgabeformat.
  4. Nur die nötigen Tools anschließen – Datenprinzip: so wenig Zugriff wie möglich.
  5. Mit realistischen Beispielfällen testen – inklusive Grenzfälle und Fehlerzustände.
  6. Human-in-the-Loop einbauen – Freigabe-Schritte dort, wo Entscheidungen Konsequenzen haben.
  7. Feedback sammeln, iterieren – erst nach stabilen Ergebnissen skalieren.

Fazit: KI-Agenten sind kein Selbstläufer – aber auch kein Hexenwerk

Das Handelsunternehmen aus unserem Beispiel kann mit dem richtigen Agenten die 30 monatlichen Arbeitsstunden für den Bestellprozess deutlich reduzieren. Nicht auf null – die finale Freigabe und die Pflege der Stammdaten bleiben beim Menschen. Aber die aufwändige Vorarbeit übernimmt der Agent zuverlässig, rund um die Uhr, ohne Flüchtigkeitsfehler.

Entscheidend ist nicht die Wahl des Modells oder der Plattform, sondern die Klarheit darüber, was der Agent leisten soll – und wo er an seine Grenzen stoßen darf. Wer diese Grundlagen sauber umsetzt, baut keine Technologie-Demo, sondern einen zuverlässigen digitalen Mitarbeiter.

FAQ: KI-Agent aufbauen

Was kostet es, einen KI-Agenten aufzubauen?

Das hängt stark vom Ansatz ab. Mit No-Code-Tools wie n8n entstehen erste Agenten für einige hundert Euro im Monat (Lizenz + API-Kosten). Individuelle Entwicklungen mit eigener Infrastruktur können schnell in den fünfstelligen Bereich gehen. Verwaltete Dienste wie Claude Managed Agents berechnen Tokenkosten plus eine kleine Laufzeitgebühr – für einfache Workflows oft unter 50 Euro monatlich.

Brauche ich ein eigenes Entwicklungsteam?

Für einfache, regelbasierte Agenten mit No-Code-Tools ist kein Entwicklungsteam nötig – technisch affine Fachanwender kommen damit weit. Sobald API-Anbindungen, eigene Datenbanken oder komplexe Entscheidungslogik ins Spiel kommen, ist technisches Know-how hilfreich. Für produktionskritische Systeme empfiehlt sich professionelle Unterstützung.

Ist ein KI-Agent DSGVO-konform einsetzbar?

Ja – aber nicht ohne Vorbereitung. Sobald personenbezogene Daten verarbeitet werden, braucht es einen Auftragsverarbeitungsvertrag mit dem KI-Anbieter (Art. 28 DSGVO), ggf. eine Datenschutz-Folgenabschätzung (Art. 35 DSGVO) und – bei Systemen, die Mitarbeiter-Workflows berühren – eine Betriebsvereinbarung nach § 87 BetrVG. Im Einzelfall sollte der Datenschutzbeauftragte eingebunden werden.

Wie lange dauert es, den ersten Agenten zu bauen?

Mit einem klaren Ziel, einem No-Code-Tool und einfachen API-Anbindungen können erste funktionsfähige Prototypen in ein bis zwei Wochen entstehen. Für produktionsreife Systeme mit Testing, Fehlerbehandlung und Dokumentation sollten eher vier bis acht Wochen eingeplant werden.

Teile es