Ein Retrieval-Score ist am Tag der Messung wahr und danach jeden Tag eine Behauptung. Die Maschinerie, die ihn wahr hält: Test-Suiten nach Zweck getrennt, synthetische Daten erst nach Validierung, Stratifizierung nach der steuerbaren Dimension und ein Regression-Gate in der CI.
Technische Artikel
Artikel
Architektur-Entscheidungen, Betriebs-Patterns und Implementierungsnotizen aus produktiven Daten- und KI-Systemen.
Die meisten RAG-Systeme, die in Produktion scheitern, scheitern vor dem Sprachmodell — daran, wie die Wissensbasis zu abrufbaren Chunks wurde. Das Argument, diese Schicht deterministisch zu machen, und was sie dann liefert.
Bei regulierten Daten ist die harte Frage nicht, wo ein RAG-System seine Daten speichert — sondern wer gezwungen werden kann, sie herauszugeben. Das hängt von einem Pfad ab, nicht von einem Ort. Ein schichtweiser Gang durch das Halten eines RAG-Systems innerhalb europäischer Jurisdiktion.
Die meisten Souveränes-RAG-Projekte scheitern an den zwei Teilen, die einem selbst gehören, nicht an denen, die man kauft: ob der Korpus zu guten abrufbaren Chunks werden kann, und ob die Daten rechtlich den Pfad nehmen dürfen, den die Architektur ihnen vorgibt. Ein Pre-Flight-Audit aus der Praxis — inklusive der teuren Fehler, die sich im Test-Set verstecken, nicht im Modell.
KI hat verändert, was ein einzelner Engineer bauen kann — aber ein Multiplikator verstärkt, worauf man ihn richtet, solide Struktur oder Slop gleichermaßen. Ein praxiserprobter Bericht, wie man die Geschwindigkeit ohne die Fäulnis nimmt: eine Over-Engineering-Warngeschichte, das schlanke Setup, das sie ersetzte, und das Eine, das das Werkzeug nie abnimmt.