Blog

Warum dein Hochdeutsch der KI egal ist

20 January 2026 By SwissMed AI
Warum dein Hochdeutsch der KI egal ist

Ein kurzer Guide für klinisches Prompting in der Schweiz: Entscheidend ist nicht nur die Sprache, sondern wie sauber und strukturiert die Eingabe ist.

Ärztinnen und Ärzte in der Schweiz wechseln zwischen Verlaufsnotizen auf Deutsch, Literatur auf Englisch, Patientenmessages im Dialekt und Übergaben auf Französisch, manchmal in derselben Schicht. Verändert die Sprache, in der du promptest, tatsächlich Genauigkeit und Sicherheit?

Die praktische Antwort: Nutze einen Hybrid-Workflow

  • Input: deine klinische Arbeitssprache (DE/FR/IT)

  • Prozess-Instruktion: „Analyze using international medical literature and standard medical terminology.“

  • Output: die Sprache, die du für Dokumentation und Übergaben brauchst

Warum das funktioniert: Es trennt klinisches Reasoning von Dokumentationsklarheit und macht deine Prompts nachvollziehbar.

Beispiel: 03:00 Aufnahmeanamnese in Schweizerdeutsch → Prompt „Summarize using standard medical terminology“ → strukturierter Output auf Deutsch für dein Klinikinformationssystem.

Vier Kernfakten

1) Englisch ist das Standard-Wissenssubstrat

Stand Dezember 2023 waren 86,5 % der in PubMed indexierten Publikationen auf Englisch.
Das ist relevant, weil Trainings- und Evaluationsdaten oft widerspiegeln, was am meisten verfügbar ist.

2) „Englisch ist immer besser“ ist kein Fakt

Multilinguale Performance variiert je nach Modell und Task, daher sollten Aussagen benchmark-basiert sein und nicht anekdotisch. Multilinguale medizinische Benchmarks wie MedExpQA existieren genau dafür, um Unterschiede zwischen Sprachen zu messen.
Takeaway: Englisch ist oft ein sinnvoller Default für komplexes Reasoning, aber keine Sicherheitsgarantie.

3) Das grössere Risiko sind chaotische Eingaben

Was Outputs zuverlässig verschlechtert, ist nicht „Deutsch vs Englisch“, sondern Mehrdeutigkeit und Rauschen:

  • unstrukturierte Anamnesen (z.B. „pt seit Tagen unwohl, evtl. Fieber?, Medis??, unklare Vorerkrankungen“)

  • inkonsistente Terminologie (z.B. „Luftnot“, „dyspnoe“, „kann nicht wirklich atmen“ ohne Beginn oder Schweregrad; „Nierenversagen“ ohne Stadium oder Kreatinin)

  • copy-paste von Patientenmessages (z.B. langer Chat-Text: „Ich fühle mich komisch… Herz macht Aussetzer… vielleicht seit gestern… könnte ich schwanger sein?“)

  • gemischte Sprachen in einem Prompt (z.B. „Anamnese: seit 3 Tagen Fieber. Triage: douleur thoracique 7/10. DDx: PE vs pneumonia. Angehörige: ‘sie isch hüt mega komisch gsi’.“)

Die Swiss trap: „copy-paste soup“ aus Notizfragmenten, Patientenmessages und Dialekt ist keine Prompting-Strategie.
Regel: normalisieren, strukturieren und klinische Begriffe verwenden, bevor du nach Reasoning fragst.

4) Schweiz-spezifische Tools entstehen, mit Vorbehalten

  • AlpineAI „SwissGPT“: AlpineAI sagt, SwissGPT könne in allen Schweizer Landessprachen und auf Englisch genutzt werden. Aber Sprachunterstützung ist nicht dasselbe wie klinisch validierte Leistung.

  • Apertus (EPFL/ETH/CSCS, Swiss AI Initiative): Apertus wird als grossskaliges, offenes, mehrsprachiges Schweizer Modell beschrieben, trainiert auf 15 Billionen Tokens in 1.000+ Sprachen, inklusive Schweizerdeutsch und Romanisch. Gleichzeitig ist Apertus primär ein General-Purpose-LLM, und sein Nutzen in der Medizin hängt von Domänenanpassung, klinischer Evaluation und passender Governance ab.

Fazit

  • Routinearbeit: Lokale Sprache ist ok.

  • Komplexes Reasoning: Englisch ist oft sinnvoll, aber nicht garantiert besser.

  • Immer erforderlich: klinisches Urteilsvermögen, Verifikation und Checks auf fehlende Daten.

LLM-Outputs sind Entscheidungsunterstützung, keine Entscheidungen.


Quellen