Skip to content

English version →

Tegishli maʼruzalar: 11-maʼruza. Agent ishining runtimeʼda kuzatilishini taʼminlang · 12-maʼruza. Har bir sessiya yakunida toza holat qoldiring Andoza fayllari: templates/

Loyiha 06. Toʻliq agent harnessʼini quring (Capstone)

Nima qilasiz

Bu capstone (yakunlovchi) loyihadir. Dastlabki beshta loyihada oʻrganilgan barcha narsalarni bir joyga toʻplang, toʻliq benchmark ishlating, soʻngra sifatni barqaror ushlab turish mumkinligini isbotlash uchun tozalash (cleanup) bosqichini amalga oshiring.

Toʻliq mahsulot boʻlagini (product slice) qamrab oladigan qatʼiy koʻp funksiyali (multi-feature) vazifalar toʻplamidan foydalaning: hujjatni import qilish, indekslash, iqtiboslarga asoslangan Q&A, runtime kuzatuvchanligi va oʻqish mumkin boʻlgan qayta ishga tushiriladigan (restartable) repo holati. Avval kuchsiz asosiy (baseline) harness bilan ishga tushiring, soʻngra oʻzingizning eng kuchli harnessʼingiz bilan, oxirida esa tozalash qilib, qayta ishlating. Va nihoyat, harnessʼda ablasyon (ablation) tajribasini oʻtkazing — har bir komponentni bittadan olib tashlang va haqiqatda qaysi biri muhim ekanligini aniqlang.

Repodagi tayyor loyihadan foydalaning

Repo yoʻli: projects/project-06/

KatalogNimalar borNimani taqqoslash
starter/Mahsulot deyarli tayyor, lekin harness ataylab zaiflashtirilgan: faqat asosiy AGENTS.md, feature_list.json, session-handoff.md, clean-state checklist va benchmark/cleanup scripts yoʻq.Zaif harness baselineʼini qoʻlda kuzatish.
solution/Toʻliq harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, quality/evaluator docs va scripts.projects/project-06/solution/scripts/benchmark.sh va projects/project-06/solution/scripts/cleanup-scanner.shni ishga tushirib, quality evidenceʼni taqqoslash.

Vositalar

  • Claude Code yoki Codex
  • Git
  • Node.js + Electron
  • Sifat hujjati andozasi (Quality document template)
  • Baholovchi rubrikasi (Evaluator rubric)
  • Dastlabki beshta loyihada toʻplangan barcha harness komponentlari

Harness mexanizmi

Toʻliq harness: barcha mexanizmlar + kuzatuvchanlik (observability) + ablasyon oʻrganish (ablation study)