#agent-testing

2 artículos

ai-agent-evaluation 8 de junio de 2026

Evaluación de agentes de IA en 2026: Construye un harness de evaluación que puntúe completitud de tareas, uso de herramientas, costo y seguridad

Construye en 2026 un harness de evaluación de agentes de IA code-first que puntúa completitud de tareas, selección de herramientas, costo, latencia, seguridad y determinismo, con puertas de CI y un corpus de seguridad de 30 payloads.

Intermedio 1 hora 30 minutos

Cómo construir un harness de evaluación de agentes de IA: Puntúa completitud de tareas, uso de herramientas, costo y seguridad

Tutorial paso a paso en TypeScript para construir un harness de evaluación de agentes de IA con puerta de CI. Puntúa completitud de tareas, selección de herramientas, costo, latencia, seguridad y determinismo de extremo a extremo.

ai-agent-evaluation 8 de junio de 2026