Serie La Harness · 1 di 5

Esiste un paragone comune nel discorso AI, il modello è il cervello. Non è sbagliato. È anche incompleto, in un modo che costa milioni a trimestre.
La cosa che regge il cervello, gli dà gli strumenti, decide cosa può fare e quando si ferma, si chiama harness. L'industria la nomina quasi sussurrando. Questa serie la mette al centro, dove deve stare.
Stesso cervello, corpi diversi
A febbraio 2026 un gruppo di ricerca ha fatto girare 731 problemi su tre framework di agent diversi, lo stesso modello Opus 4.5 sotto ognuno. I risultati si sono distanziati di 17 issue, abbastanza da rimescolare la classifica. Un test indipendente di Matt Mayer ha fatto girare lo stesso Claude Opus dentro Claude Code e dentro Cursor. Stessi pesi, due harness diverse. Claude Code ha fatto 77%. Cursor ha fatto 93%. Sedici punti di capacità apparente, con il cervello tenuto fermo.
Qualunque cosa pensi stia facendo il modello, metà la sta facendo la harness al posto suo.
Cosa c'è nel corpo
La parola resta vaga di proposito, e il prossimo post della serie spiega perché. Qui in breve: una harness è l'impalcatura attorno al modello. Gestisce la context window, decide cosa il modello vede e cosa viene riassunto o tagliato. Espone un insieme specifico di tool e un formato specifico di chiamata, e cattura gli errori quando quei tool falliscono. Restituisce al modello l'output dei propri tentativi falliti precedenti, così il successivo è informato invece di ripetere il loop. Impone un budget di iterazioni, decide quanti cicli edit-test il modello ha prima che il task venga marcato fallito.
Lo stesso studio ha trovato che un feedback loop più intelligente sui tentativi falliti produce da 5 a 10 punti di miglioramento apparente del modello senza toccare un peso. Niente di tutto questo vive nel cervello. Tutto vive nel corpo.
L'errore di procurement
Nel procurement enterprise la discussione è quasi sempre sul cervello. Quale modello. GPT-5 o Opus 4.5 o Gemini 3. Il board firma. Sei mesi dopo l'agente non cammina, e il team dà la colpa al modello.
Compri il cervello. Ti stupisci che non cammini.
È il pattern, ed è strutturale. Il modello ormai è una quasi-commodity, i laboratori principali si tengono entro pochi punti l'uno dall'altro sulla maggior parte dei benchmark. Il cervello è praticamente deciso il giorno in cui scegli il vendor. Quello che determina il risultato è cosa gli metti attorno, e quasi nessuno al tavolo del procurement è qualificato per fare le domande giuste sul corpo.
Quindi la prossima volta che valuti un deployment agentic, non chiedere quale modello usa. Chiedi in quale harness gira, cosa fa quella harness quando qualcosa si rompe, e quanti punti del demo score appartengono al corpo, non al cervello.
— Pan
Parte di La Harness, serie sulla centralità della harness nell'AI agentic. Prossimo: il modello è la commodity, la harness è il moat.