Skip to content

中文版本 →

Связанные лекции: Лекция 11. Сделайте runtime агента наблюдаемым · Лекция 12. Чистый handoff в конце каждой сессии Файлы шаблонов: templates/

Проект 06. Соберите полноценный агентский harness (Capstone)

Что вы делаете

Это capstone-проект. Соберите всё, чему научились в первых пяти проектах, проведите полный бенчмарк, затем сделайте проход уборки, чтобы убедиться, что качество поддерживаемое.

Используйте фиксированный набор multi-feature задач, охватывающий полный продуктовый срез: импорт документов, индексация, Q&A с цитатами, runtime-наблюдаемость и читаемое перезапускаемое состояние репозитория. Сначала запустите со слабым harness-baseline, затем с самым сильным harness, потом — уборку и повторный запуск. Наконец, проведите эксперимент с абляцией harness — убирайте по одному компоненту за раз и смотрите, какие из них реально важны.

Используйте проект из репозитория

Путь: projects/project-06/

КаталогЧто внутриЧто сравнивать
starter/Продукт почти готов, но harness намеренно ослаблен: базовый AGENTS.md, нет feature_list.json, session-handoff.md, clean-state checklist и benchmark/cleanup scripts.Ручные наблюдения baseline со слабым harness.
solution/Полный harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, quality/evaluator docs и scripts.Запустить projects/project-06/solution/scripts/benchmark.sh и projects/project-06/solution/scripts/cleanup-scanner.sh, затем сравнить quality evidence.

Инструменты

  • Claude Code или Codex
  • Git
  • Node.js + Electron
  • Шаблон quality-документа
  • Рубрика evaluator
  • Все компоненты harness, накопленные за первые пять проектов

Механизм harness

Полный harness: все механизмы + наблюдаемость + ablation-исследование