Bài giảng liên quan: Bài 11. Làm cho runtime của agent có thể quan sát được · Bài 12. Bàn giao sạch sẽ ở cuối mỗi phiên Tệp mẫu: templates/

Dự án 06. Xây dựng Harness Agent Đầy đủ (Capstone)

Bạn Làm Gì

Đây là dự án capstone. Tập hợp tất cả những gì đã học trong năm dự án đầu tiên, chạy một benchmark đầy đủ, sau đó thực hiện một lần dọn dẹp để xác minh chất lượng có thể duy trì được.

Sử dụng một bộ tác vụ đa tính năng cố định bao phủ toàn bộ product slice: import tài liệu, indexing, Q&A dựa trên trích dẫn, observability runtime, và trạng thái repo có thể đọc và khởi động lại. Lần đầu chạy với baseline harness yếu, sau đó với harness mạnh nhất của bạn, sau đó dọn dẹp và chạy lại. Cuối cùng, thực hiện thí nghiệm ablation harness — xóa từng thành phần một và xem cái nào thực sự quan trọng.

Dùng project có sẵn trong repo

Đường dẫn repo: projects/project-06/

Thư mục	Nội dung	So sánh gì
`starter/`	Sản phẩm gần như hoàn chỉnh, nhưng harness bị cố ý làm yếu: chỉ có `AGENTS.md` cơ bản, không có `feature_list.json`, `session-handoff.md`, clean-state checklist hay benchmark/cleanup scripts.	Ghi nhận thủ công baseline với harness yếu.
`solution/`	Harness đầy đủ: `AGENTS.md`, `CLAUDE.md`, `feature_list.json`, `init.sh`, `session-handoff.md`, `clean-state-checklist.md`, tài liệu chất lượng/đánh giá và scripts.	Chạy `projects/project-06/solution/scripts/benchmark.sh` và `projects/project-06/solution/scripts/cleanup-scanner.sh`, rồi so sánh bằng chứng chất lượng.

Công cụ

Claude Code hoặc Codex
Git
Node.js + Electron
Mẫu tài liệu chất lượng
Rubric evaluator
Tất cả các thành phần harness tích lũy từ năm dự án đầu tiên

Cơ chế Harness

Harness đầy đủ: tất cả các cơ chế + observability + nghiên cứu ablation

Dự án 06. Xây dựng Harness Agent Đầy đủ (Capstone) ​

Bạn Làm Gì ​

Dùng project có sẵn trong repo ​

Công cụ ​

Cơ chế Harness ​

Dự án 06. Xây dựng Harness Agent Đầy đủ (Capstone)

Bạn Làm Gì

Dùng project có sẵn trong repo

Công cụ

Cơ chế Harness