Claude AI: KI-Skill-Verbesserung durch Schleifenmethode

 

 

Stell dir vor, du hättest einen kleinen Roboter, der für dich Hausaufgaben macht oder Texte schreibt. Am Anfang ist er noch ein bisschen tollpatschig. Aber anstatt ihm jedes Mal zu sagen, was er falsch gemacht hat, gibst du ihm eine Checkliste und sagst: „Übe so lange von allein weiter, bis du jeden Punkt auf der Liste perfekt schaffst!“

Genau das ist die „Loop-Methode“ (Schleifen-Methode). Das Video zeigt, wie man eine KI dazu bringt, sich selbst immer weiter zu verbessern, bis das Ergebnis genau so ist, wie du es willst [03:13].

Hier ist die Anleitung, wie das funktioniert – erklärt für dich Schritt für Schritt:


 

Teil 1: Die allgemeine Beschreibung (Wie der Loop funktioniert)

Man kann diesen Prozess in drei große Phasen unterteilen:

  1. Die Anleitung (Der Skill): Du schreibst der KI eine erste Anleitung, was sie tun soll (z. B. „Schreibe eine Video-Beschreibung“).

  2. Die Prüfung (Die Eval): Du erstellst Test-Beispiele und eine Checkliste mit Fragen, die man nur mit „Ja“ oder „Nein“ beantworten kann (z. B. „Sind Emojis drin?“, „Ist der Text länger als 10 Sätze?“) [03:30].

  3. Der Trainer (Der Loop): Die KI lässt ihre Anleitung gegen die Test-Beispiele laufen. Wenn sie eine Regel bricht (z. B. doch ein Emoji benutzt), muss sie ihre eigene Anleitung umschreiben und es nochmal versuchen. Das macht sie so lange, bis sie 100 % der Punkte erreicht [08:14].

 


 

Teil 2: Ein konkretes Beispiel

Beispiel: Ein „Gaming-Tipp-Schreiber“ für YouTube. Du möchtest, dass die KI Tipps zu Spielen schreibt, aber sie soll keine Schimpfwörter benutzen, maximal 3 Tipps geben und am Ende immer schreiben: „Viel Spaß beim Zocken!“.

Schritt 1: Den Skill erstellen

Du sagst der KI, sie soll eine Datei namens gaming_skill.md anlegen, in der steht, wie man gute Tipps schreibt.

Schritt 2: Die Prüfung festlegen (Eval)

Du gibst der KI 5 verschiedene Spiele vor. Für jedes Spiel soll sie Tipps schreiben. Danach wird geprüft:

  • Hat der Text weniger als 100 Wörter? (Ja/Nein)

  • Sind es genau 3 Tipps? (Ja/Nein)

  • Fehlen Schimpfwörter? (Ja/Nein)

  • Ist der Satz „Viel Spaß beim Zocken!“ am Ende? (Ja/Nein)

Schritt 3: Den Loop starten

Die KI merkt vielleicht: „Oh, bei Minecraft habe ich 4 Tipps gegeben.“ Dann verbessert sie ihre Anleitung so lange, bis sie bei allen 5 Spielen immer genau 3 Tipps gibt [12:05].

 


 

Teil 3: Die Prompts (Die Befehle für die KI)

Hier sind die Befehle, die du nacheinander eingeben kannst (z. B. in Claude oder ChatGPT).

Wichtig: Wenn du mit Programmier-Code arbeitest, füge ich die Kommentare so ein, wie du es dir gewünscht hast.

Prompt 1: Den ersten Skill erstellen

„Erstelle mir einen Skill für einen [HIER THEMA EINSETZEN, z.B. Gaming-Tipp-Schreiber]. Schreibe die Anleitung in eine Datei namens skill.md. Die Anleitung soll erklären, wie man [DEIN ZIEL] erreicht.“

Prompt 2: Die Test-Datei (Eval) erstellen

„Erstelle eine Datei namens eval.json mit 5 Testfällen. Jeder Testfall braucht einen Beispiel-Input. Erstelle für jeden Testfall 5 Regeln (Assertions), die man nur mit JA oder NEIN beantworten kann. Die Regeln sollen prüfen, ob die Vorgaben aus der skill.md (z. B. keine Emojis, kurze Sätze) eingehalten werden.“

Prompt 3: Den Loop (die Selbstverbesserung) starten

„Starte jetzt einen Loop:

  1. Führe den Skill aus der skill.md für alle Testfälle in der eval.json aus.

  2. Prüfe für jeden Output die JA/NEIN-Regeln und berechne einen Score (Punkte).

  3. Schreibe die Ergebnisse in eine loop-log.md.

  4. Wenn der Score nicht perfekt ist: Analysiere die Fehler, verbessere die Anleitung in der skill.md und starte den Test von vorn.

  5. Wiederhole das so lange, bis der Score perfekt ist, ohne mich zwischendurch zu fragen.“

 


 

Das Skript-Gerüst (für deine Unterlagen)

Wenn du der KI sagst, sie soll ein Log-Skript erstellen, kannst du ihr dieses Format vorgeben:

SQL

 
/* * BESCHREIBUNG: Protokoll-Struktur für die KI-Selbstverbesserung
 * AUTOR: MN
 * DATUM: 2026-03-26 / 20:22
 */
-- In der loop-log.md Datei werden folgende Dinge gespeichert:
-- 1. Durchlauf-Nummer (Iteration)
-- 2. Erreichter Score (z.B. 23 von 25 Punkten)
-- 3. Welche Regel wurde gebrochen? (z.B. "Emoji gefunden")
-- 4. Was wurde an der Anleitung geändert?

Was du beachten solltest (Tipps für 12-Jährige):

  • Fachausdruck „Binäre Assertion“: Das klingt kompliziert, heißt aber nur: Eine Frage, die man nur mit „Wahr“ (Ja) oder „Falsch“ (Nein) beantworten kann [03:30].

  • Geduld: Manchmal braucht die KI 2 oder 3 Versuche, bis sie ihre eigene Anleitung so umgebaut hat, dass sie keine Fehler mehr macht [12:08].

  • Präzision: Je genauer deine Ja/Nein-Fragen sind, desto schneller lernt dein „Roboter“. Anstatt „Ist der Text gut?“ frage lieber „Hat der Text mehr als 50 Wörter?“.