KW 12 – KI-Wochenrückblick: Agentic AI, neue Modelle und Microsoft-Offensive

Table of Contents

Dieser Artikel wurde mit Künstlicher Intelligenz erstellt und redaktionell kuratiert.

🎙️ KW 12 als Podcast – jetzt reinhören

Alle Highlights der Woche in 25 Minuten – für unterwegs oder als Ergänzung zum Leseartikel.

🗓️ KW 12 in 30 Sekunden

Agentic Commerce: Santander und Visa testen KI-Agenten-Zahlungen in 5 lateinamerikanischen Märkten – die erste regulierte End-to-End-Transaktion ihrer Art
Microsoft-Offensive: M365 E7 für 99 $/Nutzer/Monat, Agent 365 für 15 $/Nutzer/Monat – beide ab 1. Mai verfügbar
Modell-Releases: Mistral Small 4 (119B MoE, Apache 2.0) vereint drei Modell-Familien; 40 % niedrigere Latenz, dreifacher Durchsatz gegenüber Small 3
Marktdynamik: Anthropics Enterprise-Anteil steigt auf 40 % der Unternehmens-KI-Ausgaben – OpenAIs Anteil sank von 50 % auf 27 % in einem Jahr
DACH-Relevanz: Betriebsräte, DSGVO-Compliance und Datenschutzbehörden werden durch alle fünf Trendthemen direkt adressiert

Kalenderwoche 12 war keine normale Nachrichtenwoche für Künstliche Intelligenz. Sie war eine Woche der Präzedenzfälle: Das erste vollständig autonome Bankzahlungssystem geht live, Microsoft bündelt seine gesamte KI-Infrastruktur in einer neuen Lizenz, und der Kampf um die Vorherrschaft im Enterprise-Segment kippt messbar zugunsten von Anthropic. Gleichzeitig erscheint mit Mistral Small 4 ein Open-Source-Modell, das die Kosten-Nutzen-Kalkulation für On-Premise-Deployments neu aufstellt. Dieser Rückblick ordnet die 13 veröffentlichten AI-Fabrik-Artikel thematisch ein – mit den Datenpunkten und DACH-Einordnungen, die in den Schlagzeilen oft fehlen.

🤖 Agentic Commerce: Von der Theorie in die Finanzinfrastruktur

Der signifikanteste Präzedenzfall der Woche kam aus Lateinamerika: Santander und Visa schlossen den ersten kontrollierten Pilot für KI-agenten-initiierte Zahlungen in fünf Märkten gleichzeitig ab – Argentinien, Brasilien, Chile, Mexiko und Uruguay. Nicht als Demo, sondern als Realtransaktion: KI-Agenten kauften im Namen von Konsumenten Bücher und Schokolade, innerhalb des regulierten Bankrahmens und unter Einhaltung bestehender Aufsichtsstandards. Visa-Studien zeigen zudem, dass bereits über 70 % der lateinamerikanischen Konsumenten KI-Tools in ihren Einkaufsprozess integriert haben – womit die Nachfrage für Agentic Commerce bereits vorhanden ist.

Für DACH-Finanzinstitute und Retailer stellt sich jetzt eine konkrete Frage: Wer haftet, wenn ein KI-Agent eine fehlerhafte Transaktion auslöst? Das Santander-Visa-Pilotrahmenwerk arbeitet mit explizitem Consent-Capture und Interoperabilitätsstandards – ein Modell, das direkt mit den DSGVO-Anforderungen an Datenverarbeitung und mit §25a KWG-Anforderungen an das Outsourcing von Kernbankprozessen kollidiert. Santander konnte darüber hinaus zehn Tage zuvor bereits den ersten regulierten Agentic Payment mit Mastercard in Europa demonstrieren – Lateinamerika ist also keineswegs Pilotregion ohne globale Konsequenzen, sondern Vorreiter eines Modells, das Europa direkt erreichen wird.

Eng verwandt: Microsoft Copilot Wave 3 positioniert Agenten als zentrales Bedienkonzept für Microsoft 365. Copilot Cowork – entwickelt in enger Kooperation mit Anthropic auf Basis der Claude-Cowork-Architektur – soll langfristige Mehrschrittaufgaben autonom abarbeiten: Meetings vorbereiten, Dokumente zusammenstellen, E-Mails verschicken, alles aus einer Anfrage heraus. Microsoft-CMO Jared Spataro beschreibt die Stoßrichtung knapp: von KI-Assistenz zu echtem KI-Tun. Für den DACH-Raum ist entscheidend: Copilot Cowork läuft im M365-Tenant des Unternehmens – damit unter Microsoft-Datenschutzbedingungen. Doch Claude-Modelle, die dabei zum Einsatz kommen, sind derzeit explizit von Microsoft-In-Country-Datenresidenz-Commitments ausgenommen. Compliance-Teams sollten das prüfen, bevor Wave 3 produktiv geht.

Passend dazu stellte Anthropic mit Claude Cowork Dispatch eine mobile Schnittstelle für die Agentensteuerung vor: KI-Tasks lassen sich damit unterwegs überwachen und delegieren. Das schließt die Lücke zwischen der Produktivitäts-Suite und dem Smartphone-Alltag – relevant vor allem für Führungskräfte, die KI-Workflows im Außendienst überwachen wollen.

⚠️ DACH-Hinweis: Betriebsrat und Agentic AI

Wenn KI-Agenten eigenständig Aufgaben ausführen, die bisher von Mitarbeitenden erledigt wurden – Terminbuchungen, Bestellungen, Kommunikation –, greift §87 BetrVG (Mitbestimmung bei technischen Überwachungseinrichtungen). Unternehmen, die Wave 3 oder vergleichbare Agentic-Lösungen einführen, sollten vor dem Rollout eine Betriebsvereinbarung vorbereiten.

🏗️ Microsoft-Offensive: Was M365 E7 konkret kostet – und bringt

Mit Microsoft 365 E7 bündelt Microsoft ab dem 1. Mai 2026 seine gesamte KI-Infrastruktur in einer einzigen Lizenz: M365 E5, Microsoft 365 Copilot, Agent 365 (die zentrale Governance-Plattform für KI-Agenten) und die vollständige Microsoft Entra Suite. Der Preis: 99 US-Dollar pro Nutzer und Monat. Zum Vergleich: Wer diese Komponenten einzeln kauft, zahlt laut Microsoft-Angaben rund 117 US-Dollar – E7 spart also 18 Dollar pro Nutzer, bei 1.000 Nutzern rund 210.000 US-Dollar im Jahr.

Komponente	Einzelpreis	In E7 enthalten
M365 E5	60 $/Nutzer/Monat (ab Juli 2026)	✅
Microsoft 365 Copilot	30 $/Nutzer/Monat	✅
Agent 365	15 $/Nutzer/Monat	✅
Entra Suite (Add-on)	~12 $/Nutzer/Monat	✅
Gesamt einzeln	~117 $/Nutzer/Monat	–
E7 Preis	99 $/Nutzer/Monat	–

Agent 365 verdient besondere Aufmerksamkeit: Microsofts eigene Daten zeigen, dass bereits über 500.000 interne Agenten über Agent 365 überwacht werden. Innerhalb von zwei Monaten Preview haben Zehntausende externer Kunden begonnen, das Tool für die Agenten-Governance einzusetzen. Das Beratungsunternehmen Gartner sieht in der Bündelung von Identität, Management und Security als zentrales Argument für den Unternehmenseinsatz: Keine Organisation will zwölf verschiedene 20-Dollar-Produkte koordinieren. E7 versucht, genau dieses Problem zu lösen.

Ebenfalls neu im Microsoft-Portfolio: MAI-Image-2, Microsofts eigenes Bildgenerierungsmodell, das laut Benchmark-Rankings Platz 3 im aktuellen Vergleich belegt – nach Midjourney und DALL·E 3, aber vor Stable Diffusion und Adobe Firefly. Damit dringt Microsoft in ein Segment vor, das bisher von spezialisierten Anbietern dominiert wurde.

⚔️ Marktdynamik: Harte Zahlen zum Anthropic-OpenAI-Kräfteverhältnis

Der meistdiskutierte Artikel der Woche war: „Anthropic überholt OpenAI: Wer dominiert Enterprise-KI 2026?" – und die zugrundeliegenden Daten sind substanzieller als viele Schlagzeilen vermuten lassen. Laut Ramp, einem auf Business-Ausgaben spezialisierten Fintech, stieg Anthropics Anteil an Unternehmens-KI-Abonnements in nur zwei Monaten um insgesamt 7,7 Prozentpunkte, während OpenAIs Anteil im Februar seinen stärksten monatlichen Rückgang seit Beginn der Messung verzeichnete: minus 1,5 %. Vor einem Jahr zahlte noch ein von 25 Unternehmen auf Ramp für Anthropic-Dienste – heute ist es fast jedes vierte.

Die übergeordnete Marktstruktur: OpenAIs Anteil an den Enterprise-KI-Ausgaben sank binnen eines Jahres von 50 % auf 27 %, Anthropics Anteil stieg auf 40 %. Besonders markant ist die Dominanz im Code-Segment: Claude hält laut unabhängigen Analysen 42 bis 54 % des Enterprise-Coding-Markts, OpenAI kommt auf 21 %. Claude Code erreichte in nur zehn Monaten einen annualisierten Umsatz von 2,5 Milliarden US-Dollar. Anthropic erzielte im März 2026 einen annualisierten Jahresumsatz von 19 Milliarden US-Dollar – gegenüber 9 Milliarden Ende 2025 und 1 Milliarde vor fünfzehn Monaten.

Für DACH-Entscheider ist die strategische Lesart wichtiger als die Zahlen allein: Anthropic positioniert sich als Enterprise-first-Unternehmen – 85 % des Umsatzes kommen von Geschäftskunden, nicht von Konsumenten. OpenAI hat den umgekehrten Schwerpunkt. Die Entscheidung, welche Plattform ins KI-Stack kommt, ist damit keine rein technische, sondern eine unternehmerische: Wer langfristige Compliance-Sicherheit und Governance-Fokus braucht, findet bei Anthropic aktuell mehr strukturelle Argumente. Ergänzend erschien dazu „OpenClaw & Claude Code: Was Unternehmen jetzt wirklich wissen müssen" sowie der kritisch einordnende „OpenClaw: Nvidia nennt es das nächste ChatGPT".

🧠 Neue Modelle: Mistral Small 4 und Cursor Composer 2

Mistral Small 4 (veröffentlicht am 16. März 2026) ist das technisch bedeutsamste Open-Source-Release der Woche. Das Modell vereint erstmals drei bisher getrennte Mistral-Produktlinien in einem einzigen Endpoint: Magistral (Reasoning), Pixtral (Vision) und Devstral (Agentic Coding). Die Architektur: 119 Milliarden Parameter insgesamt, davon nur 6,5 Milliarden aktiv pro Token – durch eine Mixture-of-Experts-Architektur mit 128 Experten, von denen jeweils vier aktiv sind. Das Ergebnis: Compute-Kosten auf dem Niveau eines 6-Milliarden-Parameter-Modells bei Wissenskapazität weit darüber hinaus.

Die Benchmark-Zahlen (laut Mistral): Im LiveCodeBench übertrifft Small 4 GPT-OSS 120B bei 20 % kürzeren Ausgaben. Im MMLU Pro benchmarkt Small 4 auf Höhe von Mistral Medium 3.1 und Large 3, trotz deutlich kleinerem Aktivierungsfootprint. Gegenüber Small 3 liefert das Modell 40 % niedrigere Latenz und dreifachen Durchsatz. Der Apache-2.0-Lizenz ist dabei besondere Bedeutung beizumessen: Unternehmen können das Modell ohne Lizenzkosten On-Premise betreiben, fine-tunen und in eigene Produkte einbetten – ein direktes Argument für alle, die Datensouveränität und Vendor-Lock-in-Freiheit priorisieren.

Zu beachten: Für Self-Hosting werden mindestens vier NVIDIA-H100-GPUs empfohlen – die Einstiegshürde für On-Premise-Deployment bleibt damit signifikant. Räumliche Reasoning-Aufgaben und SVG-Generierung zeigen in Community-Tests Schwächen. Cursor Composer 2 schließt laut eigenen Benchmarks die Lücke zu Claude 3.5 Sonnet im Code-Kontext und adressiert damit direkt das Segment, in dem Anthropic aktuell am stärksten wächst.

🔍 KI-Recherche für alle: Perplexity Deep Research

Perplexity Deep Research ist nun auch für Pro-Nutzer zugänglich – nicht mehr nur für Max-Abonnenten. Das Tool führt mehrstufige Rechercheaufgaben autonom durch, zitiert Quellen und liefert strukturierte Reports. Die praktische Relevanz für DACH-Unternehmen liegt im Wissensmanagement: Statt stundenlanger Marktrecherche durch Fachabteilungen übernimmt Deep Research das strukturierte Zusammentragen und Aufbereiten von Informationen aus öffentlichen Quellen. Für sensible oder regulierte Branchen gilt jedoch: Perplexity verarbeitet Anfragen auf US-Servern, was DSGVO-Compliance-Fragen aufwirft, sobald personenbezogene oder vertrauliche Geschäftsdaten Teil der Recherche werden.

🔐 Enterprise-KI-Infrastruktur: NVIDIA NemoClaw und Sicherheitsframework

NVIDIA NemoClaw war der technisch dichteste Infrastruktur-Artikel der Woche. NeMo ist NVIDIAs Framework für den Aufbau und das Fine-Tuning unternehmenseigener Sprachmodelle – NemoClaw erweitert dies um strukturierte Agenten-Workflows und tiefe Integration in die CUDA-Infrastruktur. Für Unternehmen, die KI-Modelle On-Premise oder im eigenen Rechenzentrum betreiben wollen, liefert NemoClaw ein reproduzierbares Framework, das mit Mistral Small 4 oder anderen Open-Weight-Modellen kombiniert werden kann.

Den sicherheitstechnischen Rahmen der Woche setzte das SlowMist Fünf-Schichten-Sicherheitsframework für KI-Agenten. Die Schichtenarchitektur – Inputvalidierung, Zugriffssteuerung, Auditlogging, Isolierung, Monitoring – lässt sich direkt auf Enterprise-Kontexte übertragen und ist kompatibel mit BSI-Grundschutz-Anforderungen für KI-Systeme. Angesichts des Santander-Visa-Pilots, der Copilot-Wave-3-Einführung und der generellen Ausweitung autonomer Agenten-Aktivität in Unternehmensumgebungen sollte jedes Security-Team dieses Framework als Checkliste nutzen.

📊 KW 12 auf einen Blick: Die Woche in der Übersicht

Thema	Anbieter	DACH-Relevanz	Artikel
Agentic Commerce Pilot	Santander / Visa	Hoch – Haftung, DSGVO, KWG §25a	→ Artikel
M365 Copilot Wave 3 + E7	Microsoft	Sehr hoch – Lizenzkalkulation, BetrVG §87	→ Artikel
Anthropic vs. OpenAI Enterprise	Anthropic / OpenAI	Mittel – Vendor-Entscheidung, Compliance	→ Artikel
Mistral Small 4	Mistral AI	Hoch – On-Premise, Datensouveränität	→ Artikel
NVIDIA NemoClaw	NVIDIA	Mittel – KI-Infrastruktur, Fine-Tuning	→ Artikel
Perplexity Deep Research	Perplexity	Mittel – Wissensmanagement, DSGVO	→ Artikel
SlowMist Sicherheitsframework	SlowMist	Hoch – BSI, Agenten-Governance	→ Artikel

✅ Fazit: Was KW 12 für Entscheider bedeutet

1. Agentic AI wird infrastrukturell ernst – und regulatorisch relevant. Santander/Visa und Microsoft Copilot Wave 3 zeigen: Autonome Agenten sind kein Laborprojekt mehr. Sie führen Bankentransaktionen aus und orchestrieren Unternehmensworkflows. DACH-Unternehmen sollten jetzt Governance-Prozesse definieren – inklusive Betriebsvereinbarungen nach BetrVG §87 und DSGVO-Folgenabschätzungen für agentische Systeme.

2. Open-Weight-Modelle werden enterprise-tauglich. Mistral Small 4 mit Apache-2.0-Lizenz und 40 % niedrigerer Latenz gegenüber seinem Vorgänger verändert die Make-or-Buy-Kalkulation. Wer Datensouveränität ohne Vendor-Lock-in braucht, hat jetzt eine konkrete On-Premise-Option – wenn die H100-Hardware vorhanden ist.

3. Der Markt verdichtet sich – Vendor-Entscheidungen werden strategisch. Anthropics Wachstum von 50 % auf 40 % Enterprise-Marktanteil in einem Jahr, kombiniert mit Microsofts Multi-Modell-Strategie (Copilot unterstützt jetzt auch Claude), signalisiert: Die Ära der Single-Vendor-KI-Strategie endet. Unternehmen, die heute ihre KI-Infrastruktur um einen einzigen Anbieter herum aufbauen, riskieren Flexibilitätsverluste in einem Markt, der sich weiterhin schnell verändert.

🔭 Ausblick: Was KW 13 bringen wird

Folgende Entwicklungen werden in Kalenderwoche 13 voraussichtlich Aufmerksamkeit auf sich ziehen: Microsoft beginnt mit dem Frontier-Program-Rollout von Copilot Cowork (Research Preview läuft seit 9. März), die ersten Enterprise-Reaktionen auf die E7-Lizenz werden spürbar. Im Modell-Segment stehen mögliche Ankündigungen von Google (Gemini-Update-Zyklus) und OpenAI (GPT-5-Folge-Releases) im Raum. Zudem könnte die EU-KI-Büro-Guidance zu Hochrisiko-KI-Systemen nach Art. 9 EU AI Act konkretere Handlungsempfehlungen für Finanzdienstleister enthalten – direkt relevant für alle, die Agentic Commerce nach dem Santander-Visa-Vorbild in Europa erproben wollen.