Skip to content

中文版本 →

Lecciones relacionadas: Lección 09. Evita que los agentes declaren victoria demasiado pronto · Lección 10. Solo una ejecución de pipeline completo cuenta como verificación real Archivos de plantilla: templates/

Proyecto 05. Haz que el agente verifique su propio trabajo

Qué harás

Implementa separación de roles: un generator que implementa, un evaluator que revisa y opcionalmente un planner. Ejecuta tres veces para medir el efecto de cada rol añadido.

Elige una mejora sustancial de función, como conversación multi-turno, rediseño del panel de citas o filtrado de documentos, y mantenla igual en todas las ejecuciones.

Usa el proyecto incluido

Ruta en el repositorio: projects/project-05/

DirectorioQué contieneQué comparar
starter/Aplicación basada en Project 04 antes de la mejora de historial conversacional.Punto de partida si quieres repetir las tres variantes.
solution/single-role/Un solo agente planifica, implementa y se autoevalúa.Puntuación y defectos en evaluator-rubric.md.
solution/gen-eval/Generador + evaluador con evidencia de revisión.Puntuación y notas de revisión en evaluator-rubric.md.
solution/plan-gen-eval/Planificador + generador + evaluador con sprint contract.sprint-contract.md y evidencia de mayor puntuación en evaluator-rubric.md.

Herramientas

  • Claude Code o Codex
  • Git
  • Node.js + Electron

Mecanismo de harness

Autoverificación + Q&A con fundamento + finalización basada en evidencia