Einblick in die hochmoderne Fertigung der CiS electronic GmbH in Krefeld: KI-gestützte Prozesse steigern Effizienz, Qualität und Innovation in der Kabelkonfektion. © CiS electronic GmbH

Research

AI Agents

Das Modell wird zur Commodity. Die Ontologie konsolidiert sich. Die Frage, die sich jetzt jede europäische CIO stellen sollte, lautet: Wessen Ontologie?

Article by

Dr. Anoj Winston Gladius

·

Im gleichen Fünf-Wochen-Fenster zwischen Mitte Mai und Mitte Juni 2026 haben sich zwei Entwicklungen parallel entfaltet, die, nebeneinandergelegt, auf eine einzige architektonische Schlussfolgerung hinauslaufen. Am 13. Juni hat Z.ai GLM-5.2 auf Hugging Face unter der MIT-Lizenz veröffentlicht — ein Mixture-of-Experts-Modell mit 753 Milliarden Parametern und einem Kontextfenster von einer Million Tokens, das 62,1 auf SWE-bench Pro und 81,0 auf Terminal-Bench 2.1 erreicht, GPT-5.5 schlägt und bei FrontierSWE bis auf einen Prozentpunkt an Claude Opus 4.8 heranrückt — bei etwa einem Sechstel der Kosten. Die Veröffentlichung wurde von Z.ai explizit als Reaktion auf den Rückruf von Claude Fable 5 durch die US-Regierung am Vortag gerahmt; die Positionierung des Unternehmens war, dass offene Gewichte die strukturelle Antwort auf die „geopolitische Einschränkung des KI-Zugangs“ seien. [¹] Im gleichen Fünf-Wochen-Zeitraum haben vier der größten Enterprise-Softwareanbieter der Welt — SAP, Microsoft, Google und Palantir — Ontologie und Knowledge Graph zu ihrem architektonischen Leitmotiv erklärt. SAP Sapphire hat den SAP Knowledge Graph als „die bedeutendste technische Entwicklung des Events“ vorgestellt und die neue SAP Business AI Platform um eine Drei-Schichten-Architektur aus Kontext, Build und Governance herum verankert, die fast wortgleich von Palantirs veröffentlichter Architektur übernommen wurde. Microsoft Build hat Microsoft Fabric IQ als strukturierte Business-Datenebene von Microsoft IQ ausgebaut. Google Cloud Next hat zuvor den Knowledge Catalog und den Enterprise Knowledge Graph lanciert. Palantir, mit einem Jahrzehnt Vorsprung bei der Ontologie, wurde als SAP Endorsed App für Migration und als Co-Integrationsziel über den neuen Vendor-Stack hinweg positioniert. Vier Anbieter. Vier Ontologien. Gleicher Einsatz. Das sind nicht zwei unabhängige Geschichten. Es ist ein und dieselbe Geschichte. Während sich die Modellebene zur Commodity entwickelt, wird die semantische Ebene zum neuen Moat — und die vier größten Enterprise-Softwareanbieter der Welt liefern sich ein Rennen darum, sie zu besitzen, bevor europäische Unternehmen merken, dass der nächste Vendor-Lock-in-Zyklus bereits begonnen hat.

Dies ist das zehnte Stück in einer Reihe, die ich für neuland.ai schreibe. Der rote Faden, der sich durch alle zieht, ist derselbe: Im Enterprise-KI-Kontext liegen Wert, Risiko und Moat in der Ebene über und um das Modell herum — nicht im Modell selbst. [²] Frühere Beiträge haben dieses Argument entlang von Control Plane und Execution Surfaces, Model Drift und Multi-LLM-Observability, Modell-Topologie, Compliance als Systemeigenschaft, Agentensicherheit und der „lethalen Trifekta“, MCP-Protokoll-Governance, der Fast-Follower-Workhorse-These, den neuen Enterprise-Datensilos, die durch die AI-Gateways von SAP und Microsoft entstehen, und dem Flexibilität-als-Architektur-Argument, das sich nach dem Fable-5-Rückruf herauskristallisierte, entfaltet. [²] Dieses Stück zieht das Argument um eine weitere Ebene hoch. Der nächste Moat ist die Ontologie. Und die europäischen Unternehmen, die sie jetzt nicht architektonisch einplanen, werden sich in zwölf Monaten in einem Modell wiederfinden, in dem sie pro Aktion Miete auf einer semantischen Ebene zahlen, die ihr eigenes Geschäfts­wissen innerhalb eines Vendor-Produkts kodiert.

The model just commoditised in public

Es lohnt sich, einen Moment auf das zu verwenden, was GLM-5.2 tatsächlich demonstriert, denn die Schlagzeilenzahlen können die strukturelle Schlussfolgerung überdecken.

Die Veröffentlichung von Z.ai ist ein Mixture-of-Experts-Modell mit 753 Milliarden Parametern und rund 40 Milliarden aktiven Parametern pro Token, verteilt unter einer permissiven MIT-Lizenz ohne regionale Nutzungsbeschränkungen. Das Modell wird mit FP8-Varianten ausgeliefert und ist über gereifte Open-Source-Serving-Stacks wie vLLM, SGLang, xLLM und Ktransformers unterstützt. Es führt eine architektonische Optimierung namens IndexShare ein, die einen leichten Indexer über jeweils vier Sparse-Attention-Layer wiederverwendet, die FLOPs pro Token bei voller Kontextlänge von einer Million Tokens um den Faktor 2,9 reduziert und dabei die Genauigkeit beibehält. Die Benchmark-Zahlen sind unabhängig verifizierbar: 62,1 auf SWE-bench Pro, 81,0 auf Terminal-Bench 2.1, 74,4 auf FrontierSWE — das stärkste Open-Source-Modell über alle drei Long-Horizon-Coding-Benchmarks hinweg und in Schlagweite von Claude Opus 4.8 (85,0 auf Terminal-Bench, ~75,0 auf FrontierSWE). Die Preise für die gehostete API liegen bei etwa 1,10 £ pro Million Input-Tokens, gegenüber ungefähr dem Sechsfachen bei proprietären Frontier-Angeboten. [³]

Die klarste Lesart dessen, was das strukturell bedeutet, ergibt sich aus dem Blick auf die Zeitlücke. Anthropic Opus 4.5 — der Benchmark-Setter für Coding-Agenten am Frontier — wurde am 24. November 2025 ausgeliefert. GLM-5.2 wurde am 16. Juni 2026 ausgeliefert. Die Lücke beträgt 204 Tage. Im vorherigen Stück dieser Reihe zum Workhorse-Ansatz habe ich den Fast-Follower-Einsatz von Open-Weight-Modellen mit dem Argument vertreten, dass sich die Fähigkeitslücke zwischen Closed und Open auf ein Fenster verkleinert hat, das die meisten Enterprise-Workloads tolerieren können. GLM-5.2 ist der empirische Beweis. Die Lücke beträgt jetzt ungefähr sieben Monate an der absoluten Frontlinie der Coding-Fähigkeit, weniger für die breitere Workload-Verteilung, die in Wahrheit den Großteil des Enterprise-AI-Traffics ausmacht — und schrumpft mit jedem Release-Zyklus.

Es gibt ein Caveat, das europäische Unternehmen einkalkulieren müssen. Z.ais gehostete API unterliegt dem National Intelligence Law Chinas, der im Fall einer Anfrage zur Offenlegung gegenüber der Volksrepublik verpflichtet — ein Beschaffungs-Risikoprofil, das sich materiell von der MIT-lizenzierten, selbst gehosteten Bereitstellung unterscheidet. Dasselbe Modell, auf der Infrastruktur des Kunden betrieben, trägt diese Exponierung nicht. [⁴] Es ist dieselbe architektonische Unterscheidung, die diese Reihe in neun Stücken gezogen hat: Weder Protokoll noch Gewichte sind die Jurisdiktion; die Deployment-Topologie ist es.

Die strukturelle Schlussfolgerung ist eindeutig, und die großen Enterprise-Softwareanbieter sind unabhängig voneinander zu ihr gekommen. Wenn Frontier-Fähigkeit inzwischen unter MIT-Lizenz herunterladbar ist, mit reifen Serving-Stacks, auf Hardware aus dem sekundären GPU-Markt zu akzeptablen Economics, dann ist die Modelle­bene nicht mehr der Ort, an dem die Vendor-Marge leben kann. Die Marge muss sich verlagern. Die Anbieter haben entschieden, wohin.

The four-vendor ontology race

Im Fünf-Wochen-Fenster zwischen SAP Sapphire und Microsoft Build haben vier der größten Enterprise-Softwareanbieter der Welt die Ontologie — verschieden benannt als Knowledge Graph, semantische Ebene, Foundry Ontology oder Knowledge Catalog — zu ihrem zentralen Architekturcommitment für das agentische Zeitalter gemacht.

SAP hat den SAP Knowledge Graph auf der Sapphire als Grundlage der neuen SAP Business AI Platform angekündigt, strukturiert als Drei-Schichten-Architektur — Kontext, Build, Governance —, die von unabhängigen Analysten als fast wortgetreue Übernahme aus der veröffentlichten Architektur von Palantir Foundry eingeordnet wurde. Die Vokabel der „einzelnen semantischen Datenebene“ ist direkt übertragen. Joule Studio 2.0 ist inzwischen modellagnostisch und unterstützt Anthropic, Cohere, Mistral und andere als zugrunde liegende Reasoning Engines — ein explizites Zugeständnis, dass SAP nicht an der Modellebene konkurrieren wird. Die kommerzielle Schranke hat sich, entscheidend, verschoben: SAP monetarisiert nicht mehr primär über Software-Lizenzen oder über das Modell. Monetarisiert wird über AI Units — einen Consumption-Meter pro Agentenaktion gegen einen Budgetpool, der jedes Mal angezapft wird, wenn ein Agent innerhalb der SAP-Umgebung ausführt. Freier Zugang zur Design-Zeit von Joule Studio läuft bis Ende 2026; die Monetarisierung setzt bei der Ausführung ein, auf einem Meter, gegen die Ontologie, in die die Geschäftsprozesse des Kunden kodiert worden sind. [⁵]

Microsoft hat Microsoft Fabric IQ als strukturierte Business-Datenebene innerhalb der breiteren Microsoft IQ-Kontextarchitektur bei Build 2026 positioniert, neben Work IQ (aus M365 Signals) und dem neuen Web IQ. Frontier Tuning, das privat vorgestellte Microsoft-Angebot, ermöglicht es Agenten, innerhalb der Compliance-Grenzen von Microsoft zu lernen, wie das Geschäft eines Kunden funktioniert. Das Microsoft Agent Framework 1.0 hat den GA-Status erreicht. All dies läuft über Microsoft-365-Tenants, auf Microsoft Foundry, auf Microsoft-Azure-Infrastruktur. [⁶]

Google ist bei Google Cloud Next ’26 mit Knowledge Catalog und Enterprise Knowledge Graph in das Rennen eingestiegen und hat sich damit neben Microsoft Fabric IQ und Palantir Foundry als dritte Hyperscaler-Wette auf die Ontologie als zentrale Enterprise-AI-Architektur positioniert. [⁷]

Palantir ist in diesem Feld seit mehr als einem Jahrzehnt unterwegs. Die Foundry-Ontologie — unabhängig beschrieben als „nicht nur ein Schema, sondern ein Modell jeder realen Entität, der Logik, die Entscheidungen rund um sie steuert, und der Aktionen, die daraus ausgelöst werden können“ — lief bereits quer durch Nachrichtendienste, Gesundheitssysteme, Fertigung und Lieferketten, während die BI-Industrie noch an der Perfektionierung von LookML arbeitete. Palantir AIP für Migration ist jetzt eine SAP Endorsed App, mit einer SAP Solution Extension für Q3 2026 geplant. Apollo, Palantirs Continuous-Delivery-Plattform, betreibt Foundry und AIP über Multi-Cloud-, On-Premises-, Private-Network- und vollständig air-gapped Deployments — eine Deployment-Topologie-Flexibilität, die die cloud-nativen Ontologie-Konkurrenten noch nicht erreichen. Die Partnerschaftsunterzeichnung auf der Sapphire 2026 bedeutet, dass Palantir jetzt nicht als Wettbewerber zur SAP-Ontologie positioniert ist, sondern als Migrationsbeschleuniger in sie hinein. [⁸]

Das technische Argument, das alle vier Anbieter vorbringen, ist tatsächlich korrekt. Large Language Models kennen Ihr Geschäft nicht. Ohne eine Wissensebene, die das Reasoning der Agenten in den tatsächlichen Entitäten, Beziehungen, Entscheidungsregeln und erlaubten Aktionen Ihrer konkreten Organisation verankert, erzeugt selbst das beste Modell generische Outputs, die an der Präzisions- und Verantwortlichkeits­hürde scheitern, die mission-kritische Enterprise-Workflows verlangen. Das ist kein Vendor-Marketing. Es ist die zentrale technische Einsicht, die Palantirs Wachstum über ein Jahrzehnt hinweg in regulierten Branchen getragen hat, die die Wirkstoffforschung und klinischen Entscheidungsunterstützungssysteme hervorgebracht hat, die durch Semantic-Web-Forschung ermöglicht wurden, und die „KI, die Ihre Frage beantworten kann“ von „KI, die in Ihrem Geschäft handeln kann“ trennt. [⁹]

Die technische Einsicht ist korrekt. Die architektonische Schlussfolgerung, die die Anbieter möchten, dass Sie aus ihr ziehen, ist der Teil, über den europäische Unternehmen jetzt sehr sorgfältig nachdenken müssen.

What the lock-in mechanism actually is

Hier ist der Mechanismus in klarer Sprache, denn er wird die nächsten zwei Jahre der Enterprise-AI-Beschaffung prägen.

Jedes Unternehmen hat eine endliche Menge von Entitäten, Beziehungen, Regeln und Aktionen, die ausmachen, wie das Geschäft tatsächlich funktioniert. Kunden, Lieferanten, Verträge, Assets, Mitarbeitende, Produkte, Bestellungen, Lagerbestände, Ausnahmen, Freigabeschwellen, Audit-Trails — all die Dinge, über die ein ernsthafter Agent nachdenken muss, um Handlungen zu setzen, die im Unternehmen irgendetwas bedeuten. All dies in eine formale Ontologie zu kodieren, ist die Arbeit, die die KI-Agentenebene braucht, um produktiv zu sein. Sie ist zudem teuer, langsam und kundenspezifisch. Ist diese Arbeit einmal getan — ist die operative Architektur des Unternehmens in das Ontologie-Produkt eines bestimmten Anbieters eingebettet —, wird die Kostenfrage einer Verlagerung nicht mehr in Software-Wechselgebühren gemessen. Sie wird im Verlust des institutionellen Selbstwissens gemessen, das die Plattform inzwischen absorbiert hat.

Die unabhängige Analyse nach SAP Sapphire hat diese Dynamik am schärfsten formuliert: „Sobald ein Unternehmen seine operative Architektur in die Ontologie eingebettet hat, wird der Preis des Herausreißens nicht in Softwaregebühren gemessen. Er wird im Verlust des eigenen Selbstwissens des Unternehmens gemessen, das in der Plattform kodiert ist.“ [¹⁰]

Strukturell ist das ein tiefergehender Lock-in als der aus der SaaS-Ära. Der SaaS-Lock-in drehte sich um die Daten, die der Kunde in die Datenbank des Anbieters einbrachte. Der Ontologie-Lock-in dreht sich um die Bedeutung, die die Organisation des Kunden über Jahre aufgebaut hat — die semantischen Beziehungen, die Entscheidungslogik, die Regeln, Ausnahmen und Sonderfälle, die institutionelles Wissen ausmachen. Der Anbieter, dem die Ontologie gehört, in die all dies kodiert ist, wird strukturell in einer Weise eingebettet, die keine Rip-and-Replace-Migration „sauber“ lösen kann. Die Monetarisierungsschranke sitzt obendrauf: SAPs AI Units pro Agentenaktion; Microsofts tenantgebundene Metering durch Agent 365; Palantirs Consumption pro Execution; ServiceNows Action-Fabric-Abgabe pro externem Agenten. Das Modell ist gratis oder modellagnostisch. Die Ontologie ist der Meter.

Und die Jurisdiktionsdimension ist dieselbe, über die diese Reihe in zehn Stücken geschrieben hat. SAPs Knowledge Graph lebt in der SAP Business AI Platform in SAP Cloud-Regionen. Microsoft Fabric IQ lebt in Microsoft-365-Tenants auf Azure. Google Enterprise Knowledge Graph lebt auf Google Cloud. Palantir Foundry kann air-gapped laufen, aber nur auf Palantirs Deployment-Architektur. Keines davon ist ein souveränes Substrat, das der europäische Kunde besitzt. Es sind Venues, in die der Kunde eingeladen wird, sein institutionelles Wissen einzubetten — unter Deployment-Topologien, Preismodellen und Vertragskontinuität, die der Anbieter kontrolliert.

Why this is the wrong architecture for European enterprises

Das Argument, das ich in dieser Reihe entwickelt habe, kulminiert auf der Ontologie-Ebene in einer zugespitzten Version derselben Schlussfolgerung. Die semantische Ebene ist zu wichtig, um in einem einzigen Vendor-Produkt zu leben. Sie ist die Ebene, in der das eigene Wissen des Unternehmens lebt. Wenn Souveränität als Beschaffungsprinzip im KI-Kontext irgendetwas bedeutet — und der Fable-5-Rückruf, die SAP-API-Beschränkungen, das Microsoft-Agent-365-Routing und der politische Druck durch das EU Digital Omnibus sprechen alle dafür, dass sie es inzwischen tut —, dann ist die Ontologie die Ebene, in der es am meisten zählt.

Die architektonische Antwort ergibt sich aus der Diagnose. Ein europäischer Enterprise-AI-Stack, der den nächsten Vendor-Konsolidierungszyklus überstehen soll, muss seine eigene Ontologie hosten, auf Infrastruktur, die er besitzt oder kontrolliert, zugänglich für jedes Modell, das zu einem gegebenen Zeitpunkt das Beste ist, und portierbar über die vier Hyperscaler-eigenen Ontologieprodukte hinweg, statt in einem einzelnen von ihnen eingebettet zu sein. Die Ontologie sollte eine Eigenschaft des Unternehmens sein. Das Unternehmen sollte keine Eigenschaft der Ontologie sein.

Konkret braucht die Ontologie-Ebene dieselben fünf Bedingungen, die ich im vorherigen Stück für die Modellebene formuliert habe. Erstens: Sie muss kundeneigen sein, im neuland.ai HUB des Kunden deployt, zugänglich für mehrere Modellanbieter ohne Rekodierung. Zweitens: Sie muss von Beginn an hybrid sein — in der Lage, SAP Knowledge Graph, Microsoft Fabric IQ, Google Enterprise Knowledge Graph, Palantir Foundry oder jede standardbasierte Ontologie-Quelle als inbound Integration Points zu verbinden und dabei die entstehende semantische Ebene in einem Substrat zu materialisieren, das dem Kunden gehört. Die Vendor-Ontologien werden zu Quellen, aus denen gezogen wird, nicht zu Venues, in denen gelebt wird. Drittens: Sie muss souverän deployt sein — On-Premises, EU-jurisdiktionale Sovereign Cloud (STACKIT, IONOS, T Cloud Public, Plus Server, Hetzner, Aleph Alpha PhariaAI) oder Hyperscaler-Regionen nur dort, wo die konkrete Workload es rechtfertigt. Viertens: Sie muss Migration ohne Re-Integration unterstützen — wenn ein Modell wechselt, wenn ein Vendor-Ontologieprodukt die Preise verändert, wenn sich eine regulatorische Grenze verschiebt, bleibt die kodierte semantische Ebene des Kunden intakt, und allein das Routing wird aktualisiert. Fünftens: Die gleiche Orchestration-Ebene, die die Modellebene und die Tool-Ebene steuert, steuert auch die Ontologie-Ebene: dieselbe Identity, dieselbe RBAC, dieselbe Audit-Ebene, dieselbe Policy, dasselbe jurisdiktionale Routing, dieselbe Capability-Abstraktion. [¹¹]

Dies ist die architektonische Erweiterung, von der in meinem Verständnis die nächsten zwölf Monate europäischer Enterprise-AI-Beschaffung geprägt sein werden.

Where neuland.ai stands

Der neuland.ai HUB ist gebaut, um die Enterprise-AI-Orchestrierungs- und Management-Plattform zu sein, die die Ontologie des Kunden souverän beherbergt — zusammen mit dem Rest des Stacks, den wir über diese Reihe beschrieben haben. Der neuland.ai HUB sitzt über der Multi-Tier-Modellebene aus dem Workhorses-Stück, über den heterogenen Execution Surfaces aus dem Protokoll-Governance-Stück, über der multimodalen Ingestion- und Retrieval-Schicht aus dem Silos-Stück und über der Wissensebene des Kunden. Alles deployt auf kundengesteuertem Substrat — On-Premises, EU-jurisdiktionale Sovereign Cloud oder Hyperscaler-Region, wo die Workload es rechtfertigt. Alles gesteuert über eine einzige Identity-, RBAC-, Audit- und Policy-Ebene. Die Ontologie gehört dem Kunden. Die Orchestrierung ist hyperscaler-unabhängig. Das Substrat ist souverän. [¹²]

Unser Research-Team arbeitet seit Monaten genau an dieser Aufgabe. Die oben formulierte These — dass, während das Modell zur Commodity wird, die semantische Ebene zum Moat avanciert und die Ontologie des Kunden innerhalb der Orchestrierungsplattform des Kunden leben sollte statt innerhalb eines Vendor-Produkts — geht den großen Vendor-Ankündigungen voraus, die das architektonische Argument nun öffentlich gemacht haben. Felderfahrung mit Kundenprojekten in regulierten DACH-Industriesettings, einschließlich erweiterter strukturierter und unstrukturierter Wissensarbeit auf File-Server-Skala von Enterprise-Corpora mit formalen Ontologie-Ebenen, hat unsere Sicht auf die Architektur geprägt und die Arbeit des Research-Teams beeinflusst. Ich bin absichtlich vorsichtig mit der Detailtiefe, denn manches von dem, was unseren Ansatz architektonisch unterscheidet, gehört nicht in einen öffentlichen Blogpost. Aber die öffentlich darstellbare Form des Designs ist präzise genug, um sie zu benennen: kundeneigene Ontologie, deployt im neuland.ai HUB des Kunden, angebunden an Vendor-Ontologie-Systeme über dokumentierte Integrationspfade, aber materialisiert in einem Substrat, das der Kunde kontrolliert. Mehrere Modellanbieter — Frontier und Workhorse, proprietär und Open Weight — reasoning über dieselbe kundengesteuerte semantische Ebene. Migration ohne Re-Integration. Hyperscaler-unabhängig. [¹³]

Personal take

Wenn die Modellebe­ne zur Commodity wird — und GLM-5.2 ist jetzt der Beweis, MIT-lizenzierte Open Weights bis auf einen Prozentpunkt an Claude Opus 4.8 auf dem härtesten öffentlich verfügbaren Coding-Benchmark —, muss sich die Vendor-Marge verlagern. SAP, Microsoft, Google und Palantir haben alle, unabhängig voneinander und innerhalb eines Fünf-Wochen-Fensters, entschieden, dass der neue Ort die Ontologie-Ebene ist. Wer die semantische Ebene besitzt, in der das Geschäft des Kunden kodiert ist, besitzt den Kunden in der Post-Commodity-Modell-Ära. Die technische Einsicht ist korrekt. Die architektonische Schlussfolgerung, die die Anbieter möchten, dass ihre Kunden aus ihr ziehen, ist jene, über die europäische Unternehmen jetzt sehr aufmerksam nachdenken müssen — denn jedes vorherige Stück dieser Reihe hat gezeigt, was passiert, wenn europäische Unternehmen die bevorzugte Architektur der Anbieter übernehmen, ohne für das zu architecten, was als Nächstes kommt.

Wir werden proprietäre Frontier-Modelle nutzen — von Anthropic, OpenAI, Google, Microsoft —, solange die Deployment-Topologie es erlaubt und die jurisdiktionale Haltung akzeptabel ist. Wir werden europäische Workhorses nutzen — Mistral Large 3, Aleph Alpha Pharia 7B, LightOn für Long-Context-Dokument-Workloads —, wo sie das richtige Werkzeug sind. Wir werden Open-Weight-Modelle chinesischen Ursprungs wie GLM-5.2 auf kundengesteuerter Infrastruktur nutzen, wo die MIT-Lizenz es erlaubt und die Exponierung durch das National Intelligence Law durch Self-Hosting vermieden wird. Wir werden SAP Knowledge Graph, Microsoft Fabric IQ, Google Enterprise Knowledge Graph und Palantir Foundry integrieren, wo die Quellsysteme des Kunden es verlangen. Keines dieser Vendor-Ontologien jedoch wird zur Operating-Control-Plane der KI-Strategie des Kunden. Die Ontologie des Kunden lebt im neuland.ai HUB des Kunden, auf dem Substrat des Kunden, gesteuert durch den Kunden.

Das ist die Arbeit, die vor uns liegt — und die, an der wir bereits arbeiten.

Eine kurze Anmerkung zum regulatorischen Hintergrund, der sich fortlaufend weiterentwickelt. Die EU-weit am 7. Mai 2026 getroffene Digital-Omnibus-Einigung hat die High-Risk-Verpflichtungen in Annex III vom 2. August 2026 auf den 2. Dezember 2027 verschoben und die Annex-I-Verpflichtungen auf den 2. August 2028. [¹⁴] Die Durchsetzungsbefugnisse für GPAI unter Kapitel V bleiben im ursprünglichen 2.-August-2026-Zeitplan. Der Fable-5-Rückruf hat den politischen Druck in Europa auf souveräne KI-Infrastruktur eher verstärkt, und das Ontologie-Rennen fügt dieser politischen Lesart eine Beschaffungsdimension hinzu, die es vor sechs Monaten noch nicht gab.

Das Modell wird zur Commodity. Die Ontologie konsolidiert sich. Die Frage, die sich jetzt jede europäische CIO stellen und mit Absicht statt implizit beantworten sollte, lautet: Wessen?

¹ Z.ai (formerly Zhipu AI), GLM-5.2 release, 13–16 June 2026. Hugging Face: zai-org/GLM-5.2. MIT licence, no regional usage restrictions. Z.ai company history: Tsinghua University spinoff founded 2019, IPO on Hong Kong Stock Exchange (HKEX: 02513) on 8 January 2026. Z.ai company statement on the GLM-5.2 release framing it as a response to "geopolitical restriction of AI access": see The New Stack, VentureBeat and TechTimes coverage, June 2026.

² Series articles at neuland.ai/insights. Previous pieces have addressed: control panels and execution surfaces; model drift, Multi-LLM strategy and observability; model topology and hyperscaler independence; compliance as a system property; agent security and the lethal trifecta; MCP protocol governance; the fast-follower workhorse thesis with sovereign deployment; the new enterprise data silos created by SAP / Microsoft / ServiceNow / Salesforce AI gateways; and the flexibility-as-architecture argument crystallised by the Fable 5 recall.

³ GLM-5.2 architecture and benchmarks: 753-billion-parameter Mixture-of-Experts; ~40 billion active parameters per token; 1-million-token context window (stable, up to ~131,072 output tokens per response); IndexShare architectural optimisation reuses one lightweight indexer across every four sparse-attention layers, reducing per-token FLOPs by 2.9× at 1M context length; improved MTP layer for speculative decoding raises acceptance length up to 20%. Benchmarks: 62.1 on SWE-bench Pro (vs GLM-5.1 at 58.4); 81.0 on Terminal-Bench 2.1 (vs GLM-5.1 at 62.0; vs Opus 4.8 at 85.0); 74.4 on FrontierSWE (within ~1% of Opus 4.8); ranks 1st in open-weight category on Artificial Analysis Intelligence Index v4.1 (score 51 vs MiniMax-M3 44, DeepSeek V4 Pro 44, Kimi K2.6 43); 1st on Design Arena single-round HTML web design leaderboard, non-agent category. Pricing: ~$1.40 per million input tokens via Z.ai API; ~1/6th of comparable closed frontier API pricing. Serving stack support: vLLM, SGLang, xLLM, Ktransformers. Sources: Z.ai official model card (docs.z.ai/guides/llm/glm-5.2); VentureBeat 16 June 2026; The New Stack June 2026; AIToolsReview June 2026; LLM-Stats GLM-5.2 page.

⁴ National Intelligence Law of the People's Republic of China, applicable to Z.ai-hosted API operations. Risk profile applies to the hosted API only and does not apply to MIT-licensed self-hosted deployment of the GLM-5.2 weights. US House of Representatives formal inquiry, May 2026, into cybersecurity risks posed by PRC-origin AI models in critical infrastructure, naming Zhipu AI (Z.ai) alongside DeepSeek, MiniMax and ByteDance.

⁵ SAP Sapphire 2026, Orlando, 12–14 May 2026. SAP Knowledge Graph announcement; SAP Business AI Platform unified architecture (context-build-governance three-layer structure); Joule Studio 2.0 (model-agnostic, supporting Anthropic, Cohere, Mistral and others); SAP Autonomous Suite. Independent analysis on the architectural parallels with Palantir Foundry: Mario Defelipe, Medium, May 2026. Independent technical analysis on SAP Knowledge Graph as the "most significant technical development from the event": K2 University, May 2026. AI Units consumption-meter commercial structure: SAP Sapphire 2026 announcements; SAPinsider coverage, June 2026.

⁶ Microsoft Build 2026, San Francisco, 2–3 June 2026. Satya Nadella keynote: Microsoft IQ (Work IQ + Fabric IQ + Web IQ) as context layer architecture; Frontier Tuning (private preview); Microsoft Agent Framework 1.0 (GA); Microsoft Foundry continued maturation; Copilot Autopilots in M365 tenant; Microsoft Execution Containers; Project Solara (Microsoft + Qualcomm chip-to-cloud agent platform). Agent 365 tooling-server gateway: endpoints at agent365.svc.cloud.microsoft/agents/tenants/{tenant_id}/servers/.

⁷ Google Cloud Next '26, April 2026: Knowledge Catalog and Enterprise Knowledge Graph announcements. See independent analysis: Pankaj Kumar, "Google vs Microsoft vs Palantir: The Enterprise Ontology Race," Medium, May 2026.

⁸ Palantir Foundry Ontology: production deployments across intelligence agencies, healthcare and life sciences, manufacturing and supply chain since approximately 2012; Foundry Apollo continuous-delivery platform supports multi-cloud, on-premises, private-network and fully air-gapped deployments. Palantir AIP for SAP migration: SAP Endorsed App as of Sapphire 2026, with SAP Solution Extension planned for Q3 2026. See SAPinsider, "Palantir Foundry, AIP & Apollo in the SAP Enterprise: What Every CIO Needs to Know After Sapphire 2026," June 2026.

⁹ For the underlying technical argument on why ontology and knowledge graph architectures are structurally necessary for enterprise AI agent reasoning — distinct from semantic layers built for BI dashboarding — see: Context and Chaos, "Ontologies, Context Graphs, and Semantic Layers: What AI Actually Needs in 2026," January 2026. For the broader European enterprise knowledge graph platform landscape: d.AP, Neo4j, eccenca, Stardog, GraphAware, Palantir Foundry — see digetiers-dap.com, "Best Enterprise Knowledge Graph Platforms in 2026."

¹⁰ Mario Defelipe, Medium analysis of SAP Sapphire 2026 announcements, May 2026.

¹¹ For the underlying sovereign cloud landscape referenced — STACKIT (Schwarz Digits), IONOS, T Cloud Public (Deutsche Telekom), Plus Server, Hetzner, and Aleph Alpha PhariaAI for fully sovereign deployment — see the previous piece in this series on workhorse deployment topology.

¹² neuland.ai HUB capabilities referenced: identity / RBAC / audit trail / tool-call governance / capability abstraction / Multi-LLM routing / cost-aware and jurisdictional routing / hyperscaler-independent deployment (on-premises, EU-jurisdictional sovereign cloud, hyperscaler region as required) / multi-modal ingestion at petabyte-scale non-functional target / columnar storage backend unifying vector, full-text and columnar representations / in-cluster GPU-based embedding, reranking and OCR serving / customer-owned ontology and knowledge-graph layer deployed inside the orchestration plane. neuland.ai AG retains responsibility for content quality and clean delivery of results.

¹³ Field experience reference: ontology-grounded knowledge-tool architectures developed for DACH industrial customers, including file-server-scale enterprise corpora with formal ontology layers. Research-team work on customer-owned ontology and knowledge-graph capability for the HUB has been continuous through Q1 and Q2 2026.

¹⁴ Council of the EU and European Parliament provisional political agreement on the Digital Omnibus on AI, 7 May 2026. Annex III high-risk obligations postponed from 2 August 2026 to 2 December 2027 (16-month delay); Annex I obligations postponed to 2 August 2028 (12-month delay); Article 50(2) watermarking moved to 2 December 2026. GPAI enforcement powers under Chapter V remain on the original 2 August 2026 schedule.