Skip to content

中文版本 →

Zugehörige Lektionen: Lektion 11. Die Runtime des Agenten beobachtbar machen · Lektion 12. Sauberes Handoff am Ende jeder Session Vorlagendateien: templates/

Projekt 06. Einen vollständigen Agenten-harness bauen (Capstone)

Was du tust

Dies ist das Abschlussprojekt. Setze alles zusammen, was du in den ersten fünf Projekten gelernt hast, führe einen vollständigen Benchmark aus und mache danach einen Cleanup-Pass, um zu prüfen, ob die Qualität wartbar bleibt.

Nutze ein festes Multi-Feature-Aufgabenset, das einen vollständigen Produktschnitt abdeckt: Dokumentimport, Indexierung, Q&A mit Zitaten, Runtime-Beobachtbarkeit und einen lesbaren, wiederaufnehmbaren Repository-Zustand. Führe zuerst einen schwachen harness-Baseline-Lauf aus, dann deinen stärksten harness, danach Cleanup und erneuten Lauf. Zum Schluss machst du ein harness-Ablationsexperiment: Entferne jeweils eine Komponente und beobachte, welche wirklich wichtig sind.

Nutze das eingecheckte Projekt

Repository-Pfad: projects/project-06/

VerzeichnisInhaltVergleichspunkt
starter/Produktcode ist weitgehend vollständig, aber die Harness-Oberfläche ist absichtlich geschwächt: nur grundlegendes AGENTS.md, kein feature_list.json, kein session-handoff.md, keine Clean-State-Checkliste und keine Benchmark/Cleanup-Skripte.Manuelle Baseline-Beobachtungen mit schwachem Harness.
solution/Vollständiger Harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, Qualitäts-/Evaluator-Dokumente und Skripte.projects/project-06/solution/scripts/benchmark.sh und projects/project-06/solution/scripts/cleanup-scanner.sh ausführen und Qualitätsevidenz vergleichen.

Werkzeuge

  • Claude Code oder Codex
  • Git
  • Node.js + Electron
  • Vorlage für Qualitätsdokument
  • Evaluator-Rubrik
  • Alle harness-Komponenten aus den ersten fünf Projekten

Harness-Mechanismus

Vollständiger harness: alle Mechanismen + Beobachtbarkeit + Ablationsstudie