Ein Legal AI Glossar erklärt die technischen Begriffe hinter KI-gestützten Rechtswerkzeugen – von Large Language Models über RAG bis zu Halluzinationen. Wer Legal-AI-Produkte evaluiert oder täglich damit arbeitet, braucht dieses Vokabular: Es hilft, Anbieterclaims einzuordnen, Risiken zu benennen und fundierte Entscheidungen über den Einsatz in Kanzleien oder Inhouse-Teams zu treffen.

Was ist Legal AI?

Legal AI bezeichnet KI-Systeme, die speziell für juristische Aufgaben eingesetzt werden – Vertragsanalyse, Risikoerkennung, Rechtsrecherche, Dokumentenprüfung. Sie ersetzen keine Anwälte, übernehmen aber repetitive kognitive Arbeit: Texte lesen, Strukturen erkennen, Abweichungen markieren.

In der Schweiz nutzen Kanzleien und Inhouse-Teams zunehmend Plattformen wie CASUS, die Dokumente direkt in Microsoft Word oder einer Web-App analysieren – ohne Datenübertragung in die USA und mit Zero Data Retention.

Die 25 wichtigsten Legal-AI-Begriffe

1. Artificial Intelligence (KI)

Maschinen, die menschliche Denkprozesse simulieren: Lernen, Mustererkennung, Problemlösung. Aktuelle Legal-AI ist sogenannte Narrow AI – auf spezifische Aufgaben spezialisiert. Allgemeine, bewusste KI existiert nicht produktiv.

2. Machine Learning (ML)

ML-Systeme lernen Regeln aus Daten und Ergebnissen, anstatt explizit programmiert zu werden. Im Rechtsbereich: Vertragsklassifizierung, Risikoerkennung, Clustering ähnlicher Dokumente.

3. Supervised Learning

Eine ML-Methode, bei der das Modell mit beschrifteten Beispieldaten trainiert wird – etwa Verträge, die manuell als "risikoreich" oder "unkritisch" markiert wurden. Das Modell lernt, neue Dokumente entsprechend einzuordnen.

4. Unsupervised Learning

ML ohne vorgegebene Labels. Das Modell erkennt eigenständig Muster und Gruppen in Daten. Nützlich für die Dokumentenstrukturierung in grossen Datensätzen, etwa bei Due-Diligence-Prozessen.

5. Deep Learning

Ein Unterbereich von ML, der mit mehrschichtigen neuronalen Netzen und grossen Datenmengen arbeitet. Ermöglicht komplexere Sprachverarbeitung und semantisches Verständnis von Vertragstexten.

6. Large Language Model (LLM)

Ein auf riesigen Textmengen trainiertes Sprachmodell, das menschliche Sprache versteht und generiert. Bekanntes Beispiel: GPT-4. LLMs sind die Grundlage der meisten modernen Legal-AI-Werkzeuge – für Zusammenfassungen, Entwürfe und Recherchen.

7. Natural Language Processing (NLP)

NLP bezeichnet Techniken, mit denen Maschinen natürliche Sprache verarbeiten und verstehen. In Legal AI: Extraktion von Klauseln, Erkennung von Vertragsparteien, Analyse unstrukturierter Rechtstexte.

8. Generative AI

KI, die neuen Inhalt erzeugt – Text, Entwürfe, Zusammenfassungen. Basiert auf LLMs und NLP. Im Rechtsbereich: Vertragsformulierungen, Memos, Antwort-E-Mails. Generative AI produziert Entwürfe, die juristisch geprüft werden müssen.

9. Prompt

Eine Anweisung oder Frage an ein KI-System. Im Legal-AI-Kontext: die genaue Formulierung des Prompts beeinflusst die Qualität der Ausgabe erheblich. Präzise, kontextreiche Prompts liefern bessere Ergebnisse als allgemeine Anfragen.

10. Context Window

Die Menge an Text, die ein Modell gleichzeitig verarbeiten kann – sein Arbeitsgedächtnis. Ein kleines Context Window bedeutet, dass lange Verträge in Teile aufgeteilt (chunked) werden müssen. Moderne Modelle haben zunehmend grössere Context Windows, was die Verarbeitung langer Dokumente verbessert.

11. Chunking

Das Aufteilen grosser Dokumente in kleinere Segmente für die Modellverarbeitung. Relevant, wenn der Vertrag das Context Window überschreitet. Gut implementiertes Chunking erhält den semantischen Zusammenhang über Segmentgrenzen hinweg.

12. Halluzination

Ein KI-System erfindet Informationen – Gerichtsurteile, Gesetzesartikel, Klauselinhalte –, die nicht existieren oder falsch sind. Halluzinationen sind das wichtigste Risiko im Legal-AI-Einsatz. Zuverlässige Systeme arbeiten quellenbasiert und machen Nachweise transparent.

13. RAG – Retrieval-Augmented Generation

RAG kombiniert ein Sprachmodell mit einer externen Wissensdatenbank. Statt nur aus dem Training zu schöpfen, sucht das System aktiv nach relevanten Dokumenten oder Entscheidungen und bezieht diese in die Antwort ein. Das reduziert Halluzinationen und macht Ausgaben nachvollziehbarer.

14. Embeddings

Mathematische Vektordarstellungen von Text, die semantische Ähnlichkeit messbar machen. Embeddings erlauben semantische Suche: "Finde alle Klauseln, die Haftungsbeschränkungen ähneln" – auch wenn andere Begriffe verwendet werden.

15. Fine-Tuning

Ein vortrainiertes Modell wird auf spezifischen Daten weitertrainiert – etwa auf einem firmeneigenen Vertragsbestand – um präzisere Ergebnisse für bestimmte Aufgaben zu liefern. Ressourcenintensiv und datenschutzrechtlich sensibel.

16. Agentic AI

KI-Systeme, die mehrstufige Aufgaben eigenständig planen und ausführen, ohne für jeden Schritt eine neue Anweisung zu brauchen. Im Vertragskontext: ein Agent analysiert, identifiziert Änderungsbedarf und fügt Klauseln an der richtigen Stelle ein. Agentic AI erfordert noch substanzielle menschliche Kontrolle.

17. Chain of Thought

Eine Technik, bei der das Modell seinen Denkprozess Schritt für Schritt offenlegt, bevor es zu einem Ergebnis kommt. Wichtig für nachvollziehbare, verteidigbare Ausgaben – etwa bei juristischen Einschätzungen oder Vertragsrisiken.

18. Guardrails

Technische oder policy-basierte Schutzmassnahmen, die das Verhalten eines KI-Systems begrenzen – etwa Verbote bestimmter Ausgabetypen, Genauigkeitsschwellen oder Eskalationspflichten bei Unsicherheit. In der Rechtsbranche besonders relevant für Compliance und Haftungsfragen.

19. Zero Data Retention

Ein Datenschutzprinzip: eingegebene Daten werden nach der Verarbeitung nicht gespeichert, nicht protokolliert und nicht für das Modelltraining verwendet. Relevant für anwaltliches Berufsgeheimnis und Mandantenschutz. CASUS arbeitet mit Zero Data Retention.

20. Data Residency

Der physische Ort, an dem Daten gespeichert und verarbeitet werden. Für Schweizer Kanzleien relevant: Daten dürfen oft nicht die Schweiz oder den EWR verlassen. CASUS hostet in der Schweiz und der EU – keine Datenübertragung in die USA.

21. Bias / Algorithmische Verzerrung

Wenn Trainigsdaten systematisch verzerrt sind, reproduziert das Modell diese Verzerrungen in seinen Ausgaben. Im Rechtsbereich problematisch bei Entscheidungsunterstützung, Risikoeinschätzungen oder Vorhersagemodellen.

22. Structured Output / Structured Findings

KI-Ausgaben in einem definierten Format – etwa eine Tabelle mit Risikostufe, Partei, Klauselauszug und Verbesserungsvorschlag. Strukturierte Outputs lassen sich direkt weiterverarbeiten, in Berichte übertragen oder mit Kollegen teilen. Der Risk & Quality Review von CASUS liefert Findings strukturiert mit Zuordnung, Relevanz und Schweregrad.

23. Legal Analytics

Auswertung grosser Mengen juristischer Daten – Gerichtsentscheide, Klageergebnisse, Richterverhalten – um strategische Insights zu gewinnen. Beispiele: Erfolgswahrscheinlichkeit in einem bestimmten Gericht, typische Urteilshöhen in Haftungsfällen.

24. Semantic Search

Suche, die Bedeutung und Kontext berücksichtigt, nicht nur exakte Schlüsselwörter. Ermöglicht z. B. das Auffinden aller Klauseln zu "Haftungsbeschränkungen", auch wenn die Klausel "Schadensersatzobergrenze" verwendet.

25. Vectorization

Der Prozess, Text in numerische Vektoren umzuwandeln, die mathematisch verglichen werden können. Grundlage für semantische Suche und Embedding-basierte Ähnlichkeitsvergleiche. In der Praxis: ein Vertrag wird "vektorisiert" und dann gegen eine Klauseldatenbank abgeglichen.

Warum diese Begriffe für Juristen in der Schweiz relevant sind

Wer Legal-AI-Produkte einkauft oder intern bewertet, begegnet diesen Begriffen in Anbieterpräsentationen, Datenschutz-Assessments und Sicherheitsfragebögen. Das Vokabular zu kennen, macht den Unterschied zwischen einem gut verhandelten SaaS-Vertrag und einem mit Datenschutzlücken.

Konkret: Wer versteht, was Zero Data Retention und Data Residency bedeuten, kann gezielt fragen, ob Anbieterdaten in die USA übertragen werden. Wer Halluzinationen kennt, stellt fest, ob ein System quellenbasiert arbeitet oder ins Blaue generiert.

Für Schweizer Kanzleien und Inhouse-Teams, die Legal AI einsetzen wollen, lohnt sich auch ein Blick auf die Sicherheits- und Datenschutzseite von CASUS, die die technischen Datenschutzmassnahmen der Plattform dokumentiert.

Wer mit CASUS arbeitet, sieht diese Konzepte in der Praxis: der AI-Chat mit Agent Mode nutzt strukturierte Outputs und Quellenverweise, der Legal Research Modus durchsucht über 660'000 kantonale und bundesgerichtliche Entscheide quellenbasiert, und der AI Data Room extrahiert Klauselinhalte nach selbst definierten Feldern aus hunderten Dokumenten. Wer diese Funktionen testen möchte, kann CASUS kostenlos auf app.getcasus.com/signup ausprobieren.

FAQ

Was ist ein Legal AI Glossar?

Ein Legal AI Glossar ist eine strukturierte Sammlung von Definitionen technischer Begriffe aus dem Bereich der KI-gestützten Rechtswerkzeuge – von Grundkonzepten wie Machine Learning bis zu spezifischen Sicherheitsbegriffen wie Zero Data Retention.

Was bedeutet Halluzination im Legal-AI-Kontext?

Halluzination bezeichnet KI-generierte Inhalte, die sachlich falsch oder frei erfunden sind – etwa nicht existierende Gerichtsurteile oder fehlerhafte Gesetzeszitate. Zuverlässige Legal-AI-Systeme arbeiten quellenbasiert und machen Belege transparent.

Was ist RAG und warum ist es für Legal AI wichtig?

RAG (Retrieval-Augmented Generation) kombiniert ein Sprachmodell mit einer externen Wissensdatenbank. Das System sucht aktiv nach relevanten Quellen – etwa Gerichtsentscheiden oder Gesetzesartikeln – bevor es antwortet. Das reduziert Halluzinationen und macht Ausgaben nachvollziehbarer.

Was bedeutet Zero Data Retention für Kanzleien?

Zero Data Retention bedeutet, dass eingegebene Daten nach der Verarbeitung nicht gespeichert werden – weder für Logs noch für Modelltraining. Für Kanzleien ist das relevant, weil Mandantendaten und privilegierte Informationen so nicht in fremde Systeme abfliessen.

Was ist der Unterschied zwischen Fine-Tuning und Pre-Training?

Pre-Training ist das initiale Training eines Modells auf grossen, allgemeinen Datensätzen. Fine-Tuning ist die Weiterentwicklung auf spezifischen Daten – etwa juristischen Texten – um Genauigkeit für bestimmte Aufgaben zu steigern. Fine-Tuning ist ressourcenintensiv und sensibel, wenn Mandantendaten verwendet werden.

Was ist Agentic AI im Rechtsbereich?

Agentic AI bezeichnet Systeme, die mehrstufige Aufgaben planen und ausführen können, ohne für jeden Schritt neu angewiesen zu werden. Beispiel: Ein Agent analysiert einen Vertrag, erkennt fehlende Klauseln und fügt eine passende Formulierung an der richtigen Stelle ein. Menschliche Kontrolle bleibt bei komplexen Rechtsfragen notwendig.

Was ist der Unterschied zwischen semantischer Suche und Schlüsselwortsuche?

Semantische Suche berücksichtigt Bedeutung und Kontext – sie findet relevante Passagen auch dann, wenn andere Begriffe verwendet werden als im Suchbegriff. Schlüsselwortsuche findet nur exakte Treffer. Im Vertragskontext bedeutet das: semantische Suche findet "Schadensersatzobergrenze" auch bei einer Suche nach "Haftungsbeschränkung".

Welche Datenschutzanforderungen gelten für Legal AI in der Schweiz?

Relevante Anforderungen kommen aus dem revidierten Schweizer Datenschutzgesetz (DSG), der DSGVO bei EU-Bezug und dem anwaltlichen Berufsgeheimnis. Kanzleien sollten sicherstellen, dass Anbieter keine Daten in die USA übertragen, Zero Data Retention einhalten und in der Schweiz oder im EWR hosten.

Legal AI Glossar: Die 25 wichtigsten Begriffe erklärt