Entscheider arbeitet mit ALBERT | AI in agorum core. Die KI durchsucht das Unternehmenswissen iterativ und liefert die relevanten Dokumente direkt aus der Plattform.

agorum® Agentic Search Warum hat Anthropic Vector-RAG aus Claude Code entfernt und was hat das mit deinem Unternehmenswissen zu tun?

Im Mai 2025 hat Anthropic Vector-RAG aus Claude Code entfernt und durch Agentic Search ersetzt. Boris Cherny, Schöpfer von Claude Code, beschreibt im Pragmatic Engineer Podcast, dass die agentische Suche „by a lot“ besser abgeschnitten hat als die klassische RAG-Pipeline mit Embeddings und Vektor-Datenbank. Cat Wu von Anthropic ergänzt, dass Vektor-Embeddings im Betrieb schwer zu pflegen seien, weil ständig neu indexiert werden müsse. Genau diesen Weg geht ALBERT | AI in agorum core seit jeher.

Die Beobachtung dahinter ist einfach. Eine KI, die iterativ und gezielt die vorhandene leistungsstarke Suche eines Systems nutzt, findet in einem produktiven Datenbestand präziser die richtigen Treffer als eine KI, die nur in einem vorab erzeugten Vektor-Index nach Ähnlichkeit sucht. Das gilt für Code in Claude Code genauso wie für die Dokumente, E-Mails und Vorgänge in einer KI-Business-Plattform für Unternehmenswissen. Quellen für diese Aussage sind die Anthropic-Mitarbeitenden selbst, zitiert auf Pragmatic Engineer sowie das öffentliche Cat-Wu-Zitat im Podcast every.to AI & I.

Was unterscheidet Agentic Search von klassischem Vector-RAG?

Die beiden Ansätze beantworten dieselbe Frage auf grundlegend unterschiedliche Weise. Wie findet eine KI in einem großen Datenbestand die Informationen, die sie zur Beantwortung einer Anfrage braucht.

Vector-RAG, der klassische Ansatz. Alle Dokumente werden in kleinere Stücke zerlegt, sogenannte Chunks. Jedes Chunk wird durch ein Embedding-Modell in einen Zahlenvektor übersetzt, der seine Bedeutung mathematisch beschreibt. Diese Vektoren werden in einer Vektor-Datenbank gespeichert. Stellt jemand eine Frage, wird auch die Frage in einen Vektor übersetzt und das System sucht die Chunks mit der größten mathematischen Ähnlichkeit. Diese Chunks landen im Prompt der KI. Funktioniert in der Theorie elegant. In der Praxis bedeutet das einen separaten Index, der laufend mit jeder Änderung im Datenbestand neu erzeugt werden muss, dazu Embedding-Modelle, Reranking-Modelle und Infrastruktur, die kontinuierlich gepflegt wird.

Agentic Search, der iterative Ansatz. Die KI bekommt die Such- und Lesewerkzeuge des Zielsystems direkt in die Hand und nutzt sie wie eine erfahrene Fachkraft. Sie formuliert eine Suchanfrage, prüft das Ergebnis, schärft nach, öffnet ein Dokument, liest, sucht weiter. So lange, bis sie genug Kontext hat, um die ursprüngliche Frage präzise zu beantworten. Es gibt keinen zwischengelagerten Vektor-Index. Die Suche läuft immer auf dem aktuellen Datenbestand. Das ist Agentic Search, oder im weiteren Sinne agentic Retrieval.

Der Unterschied auf den Punkt gebracht: Vector-RAG liefert das, was einer Anfrage am ähnlichsten klingt. Agentic Search liefert das, was tatsächlich relevant ist, weil die KI iterativ nachsteuert. Bei Code, bei Aktennummern, bei Vertragsklauseln und bei Produktcodes ist Ähnlichkeit die falsche Metrik. Bei einem normalen Geschäftsvorgang im Unternehmen genauso.

Vergleich der beiden Ansätze nebeneinander. Links ein komplexer Vektor-Index, rechts eine schlanke iterative Suche, wie sie Agentic Search verwendet.

Welche Probleme schafft Vector-RAG im Tagesbetrieb?

Wer eine Vektor-Datenbank produktiv betreibt, kennt die Aufwände. Sie tauchen in jeder seriösen Architektur-Diskussion auf und sind in den Anbieter-Dokumentationen selbst nachzulesen.

  1. Laufende Neuindexierung. Jede Änderung in einem Dokument verlangt, dass die zugehörigen Chunks neu eingebettet und im Index ausgetauscht werden. Cat Wu von Anthropic beschreibt das im Cat-Wu-Zitat zu Claude Code mit den Worten, dass Vektor-Embeddings „really tricky to maintain“ seien, weil ständig nachindexiert werden müsse. Quelle: Awesome Agentic Patterns.
  2. Hoher Speicherbedarf. Vektor-Indizes laden ihre Daten im Idealfall vollständig in den Arbeitsspeicher, damit Anfragen schnell beantwortet werden. Superlinked beschreibt in seinem Leitfaden zur Auswahl einer Vektor-Datenbank, dass In-Memory-Indizes zwar die schnellsten Antwortzeiten liefern, dabei aber durch RAM-Kapazität und Kosten begrenzt sind und für große Datenmengen häufig aufwendiges Sharding brauchen. Quelle: Superlinked.
  3. Reranking als Pflichtschritt. Reine Vektor-Ähnlichkeit reicht in der Praxis selten aus. Deshalb läuft hinter dem Vektor-Index in den meisten Produktiv-Pipelines ein Reranker-Modell, das die Treffer neu sortiert. Das ist eine zweite KI-Schicht mit eigener Latenz, eigenen Kosten und eigenem Tuning-Aufwand.
  4. Ähnlichkeit ist nicht Relevanz. Wer in einem Vorgang eine Rechnungsnummer wie INV-2026-04711 sucht, will exakt diese Nummer finden. Vektor-Ähnlichkeit liefert hier oft INV-2026-04710 oder INV-2025-04711 als wahrscheinlichsten Treffer. Jacky Liang von Tiger Data zeigt in seinem viel zitierten Beitrag, dass diese Schwäche genau der Grund war, warum Claude Code beim Code-Lookup von Vector-Suche auf lexikalische Suche umgestiegen ist. Quelle: Tiger Data.
  5. Stiller Fehler. Liefert ein Vektor-Index die falschen Chunks, bekommt die KI ein verzerrtes Bild der Daten und antwortet selbstbewusst falsch. Bei Q&A ist das ärgerlich. Bei einem KI-Agenten, der Vorgänge automatisiert weiterverarbeitet, ist es ein Geschäftsrisiko.

Wie funktioniert Agentic Search in ALBERT | AI konkret?

ALBERT | AI ist in agorum core eingebunden und nutzt die dort vorhandenen Werkzeuge. Eines der zentralen ALBERT | AI Tools ist search_in_agorum_core. Dieses Tool führt eine Suche auf Basis der Solr-basierten agorum core Suchsyntax aus und gibt die gefundenen Objekte mit UUIDs, Gesamtanzahl und Links zurück. Das ist in der agorum core Dokumentation öffentlich nachzulesen.

Damit kann ALBERT | AI auf demselben Datenbestand arbeiten, der bereits revisionssicher und berechtigt im DMS liegt. Ohne eigenen Vektor-Index. Ohne separate Embedding-Pipeline. Ohne nächtliche Re-Index-Jobs.

Eine typische Anfrage läuft in mehreren Schritten ab.

  1. ALBERT | AI nimmt die Anfrage entgegen, prüft den Berechtigungskontext des aktuellen Users und übersetzt die Frage in eine erste Solr-Suchanfrage in agorum core.
  2. Die Suche liefert eine Trefferliste mit UUIDs, Metadaten und Volltextausschnitten.
  3. ALBERT | AI bewertet die Treffer, öffnet die relevantesten Dokumente direkt aus agorum core, liest Inhalte und Metadaten.
  4. Reichen die Informationen nicht aus, formuliert ALBERT | AI weitere Suchanfragen, schärft Filter nach, schränkt Zeiträume ein oder folgt Verknüpfungen zu verwandten Objekten.
  5. Erst wenn der Kontext belastbar ist, formuliert ALBERT | AI die Antwort oder löst die nächste Aktion im Workflow aus.

Das ist agentic Search im Wortsinn. Die KI handelt als Agent, der das vorhandene Suchsystem geschickt nutzt, anstatt sich auf einen vorberechneten Ähnlichkeits-Vektor zu verlassen. Und sie tut das im Berechtigungskontext des jeweiligen Users, dieselbe Person sieht in agorum core nicht mehr und nicht weniger als sie als Mitarbeitende ohnehin sehen darf.

ALBERT | AI nutzt die bestehende leistungsstarke Suche von agorum core in der eigenen Infrastruktur, ohne dass ein zusätzlicher Vektor-Index aufgebaut werden muss.

Warum war ALBERT | AI von Anfang an auf Agentic Search ausgerichtet?

ALBERT | AI ist nicht erst auf Agentic Search umgeschwenkt, als Anthropic den Schritt in Claude Code öffentlich gemacht hat. Der Ansatz war bei agorum® von Beginn an die bewusste Entscheidung. Oliver Schulze, Geschäftsführer von agorum®, hat das Thema vor der Produktentscheidung gründlich recherchiert und ist zum selben Schluss gekommen, zu dem das Claude-Code-Team später ebenfalls gekommen ist. Eine KI, die eine leistungsstarke Suche iterativ benutzt, liefert in produktiven Datenbeständen die besseren Treffer als eine KI, die nur in einem vorberechneten Vektor-Raum sucht.

Drei technische Eigenschaften haben diese Entscheidung getragen.

  • agorum core bringt mit seiner Solr-basierten Suche bereits eine sehr leistungsfähige Volltext- und Metadatensuche mit Filtern, Bereichssuchen und Berechtigungskontext mit. Diese Suche steht produktiv zur Verfügung und wird ohnehin laufend gepflegt.
  • Unternehmenswissen besteht zu großen Teilen aus exakten Bezugspunkten. Vorgangsnummer, Kundennummer, Vertragsnummer, Rechnungsnummer, Datum, Status. Genau in dieser Klasse von Anfragen ist Ähnlichkeit die falsche Metrik. Lexikalische Suche kombiniert mit Filtern trifft hier präzise.
  • Eine zweite Datenbasis in Form eines Vektor-Index wäre eine weitere Stelle, an der Daten synchron gehalten werden müssen. Das widerspricht dem agorum® Architektur-Grundsatz, dass Wissen in einer zentralen, revisionssicheren Plattform lebt und nicht in mehreren Kopien.

Die externe Bestätigung kommt jetzt aus mehreren Richtungen. Das Claude-Code-Team und sein Lead Boris Cherny, die Tiger-Data-Analyse von Jacky Liang, die Cline-Veröffentlichung Why Cline Doesn’t Index Your Codebase und die zunehmende Diskussion um hybride Suche statt reiner Vektor-Suche. Quelle: Cline Blog.

Selbst in sehr großen Dokumentenbeständen findet ALBERT | AI mit Agentic Search gezielt die richtigen Treffer, weil die Suche iterativ nachschärft.

Funktioniert Agentic Search auch bei sehr großen Dokumentenmengen?

Das ist die häufigste Rückfrage von IT-Leitungen. Sie ist berechtigt, weil viele Vector-RAG-Argumente mit dem Bild operieren, dass nur Vektor-Datenbanken Millionen von Dokumenten beherrschen könnten. Die Praxis sieht anders aus.

Eine moderne Suchinfrastruktur wie die in agorum core integrierte Solr-Suche ist genau dafür gebaut, sehr große Dokumentenmengen mit Volltext, Metadaten und Berechtigungsfiltern in Millisekunden zu durchsuchen. Solr ist seit über zwei Jahrzehnten Standard für Enterprise-Suche und wird von zahlreichen großen Plattformen produktiv eingesetzt. Agentic Search verwendet diese vorhandene Stärke und ergänzt sie um die iterative Suchstrategie der KI.

Drei Punkte machen Agentic Search bei großen Beständen sogar überlegen.

  • Die Suche läuft immer auf dem aktuellen Datenbestand. Neue Dokumente sind direkt nach der Ablage in agorum core findbar. Bei einem klassischen Vektor-Index entstehen Lücken, solange neue Inhalte noch nicht eingebettet und indexiert wurden.
  • Berechtigungen wirken direkt in der Suche. ALBERT | AI bekommt nur die Treffer, die der jeweilige User auch sehen darf. Bei separaten Vektor-Indizes ist das deutlich schwieriger sauber abzubilden, weil die Berechtigungen außerhalb des Index liegen.
  • Die KI kann Suchen kombinieren und verfeinern. Eine erste Anfrage liefert zehn Treffer, ALBERT | AI prüft die Metadaten, fügt eine Datumsbeschränkung hinzu, kombiniert mit einer Dokumentart, folgt einer Verknüpfung zu einem Kunden. Das ist faktisch ein mehrstufiger Filterprozess auf dem gesamten Bestand.

Die Frage ist nicht, ob Agentic Search große Bestände beherrscht. Die Frage ist, ob ein vorberechneter Vektor-Index dem täglichen Veränderungsdruck in einer realen Dokumentenlandschaft standhält, ohne dass die laufende Pflege das Projekt teurer macht, als es nutzt.

Welche Vorteile bringt das deinem Unternehmen konkret?

Die Wahl zwischen Vector-RAG und Agentic Search ist keine akademische Frage. Sie wirkt auf Projektkosten, auf die Treffergenauigkeit im Tagesgeschäft und auf die Geschwindigkeit, mit der KI im Unternehmen produktiv wird. Die folgenden Vorteile fallen für Unternehmen an, die auf agorum core mit ALBERT | AI setzen.

  • Eine einzige Datenbasis, kein paralleler Vektor-Index, der synchron gehalten werden muss.
  • Treffer immer auf dem aktuellen Datenbestand, neue Dokumente sind sofort findbar.
  • Berechtigungen wirken direkt in der Suche, ALBERT | AI sieht nur, was der User auch sehen darf.
  • Hohe Präzision bei exakten Bezugspunkten wie Nummern, IDs, Codes und Datumsangaben.
  • Kein zusätzlicher RAM-Bedarf für Vektor-Indizes, kein Reranker als zweite KI-Schicht.
  • Multi-LLM-Fähigkeit bleibt unberührt, das Modell ist jederzeit wechselbar.
  • Die Daten liegen ausschließlich in der eigenen Infrastruktur, on-premises, in der eigenen Cloud oder in der agorum® Cloud.
  • Nachvollziehbarkeit, jede Suche und jede KI-Aktion ist protokolliert.
  • Geringere Betriebskosten, weil die Suche, die ohnehin gepflegt wird, gleichzeitig die KI bedient.

Der Effekt ist eine KI, die das Unternehmenswissen so präzise nutzt wie eine erfahrene Fachkraft, die die Suche im DMS gut beherrscht. Nur ohne Wartezeit, ohne Pausen und für jeden Mitarbeitenden gleichzeitig verfügbar.

agorum® Beratung Du willst Agentic Search in deinem Unternehmen erleben?

Unsere KI-Berater zeigen dir in einer kostenlosen Online-Demo, wie ALBERT | AI in agorum core das Unternehmenswissen agentisch durchsucht, im Berechtigungskontext deiner Mitarbeitenden, ohne separaten Vektor-Index und mit voller Datenhoheit in der eigenen Infrastruktur.

Jetzt unverbindlich beraten lassen

agorum® FAQ Agentic Search und Vector-RAG für Unternehmenswissen

Bitmi