Lecciones relacionadas: Lección 09. Evita que los agentes declaren victoria demasiado pronto · Lección 10. Solo una ejecución de pipeline completo cuenta como verificación real Archivos de plantilla: templates/

Proyecto 05. Haz que el agente verifique su propio trabajo

Qué harás

Implementa separación de roles: un generator que implementa, un evaluator que revisa y opcionalmente un planner. Ejecuta tres veces para medir el efecto de cada rol añadido.

Elige una mejora sustancial de función, como conversación multi-turno, rediseño del panel de citas o filtrado de documentos, y mantenla igual en todas las ejecuciones.

Usa el proyecto incluido

Ruta en el repositorio: projects/project-05/

Directorio	Qué contiene	Qué comparar
`starter/`	Aplicación basada en Project 04 antes de la mejora de historial conversacional.	Punto de partida si quieres repetir las tres variantes.
`solution/single-role/`	Un solo agente planifica, implementa y se autoevalúa.	Puntuación y defectos en `evaluator-rubric.md`.
`solution/gen-eval/`	Generador + evaluador con evidencia de revisión.	Puntuación y notas de revisión en `evaluator-rubric.md`.
`solution/plan-gen-eval/`	Planificador + generador + evaluador con sprint contract.	`sprint-contract.md` y evidencia de mayor puntuación en `evaluator-rubric.md`.

Herramientas

Claude Code o Codex
Git
Node.js + Electron

Mecanismo de harness

Autoverificación + Q&A con fundamento + finalización basada en evidencia

Proyecto 05. Haz que el agente verifique su propio trabajo ​

Qué harás ​

Usa el proyecto incluido ​

Herramientas ​

Mecanismo de harness ​

Proyecto 05. Haz que el agente verifique su propio trabajo

Qué harás

Usa el proyecto incluido

Herramientas

Mecanismo de harness