How do you detect AI-generated pull requests?

Detection uses multiple signals layered together: Co-authored-by commit trailers from tools like GitHub Copilot and Claude Code, PR labels such as ai-generated or copilot, known bot author accounts, and branch naming conventions like copilot/ or claude/ prefixes. Combining these signals reduces false negatives.

What should you scan AI-generated code for?

AI-generated code should be scanned for four categories: secrets and credentials, dependency vulnerabilities and hallucinated package names, static analysis findings, and infrastructure-as-code misconfigurations. Thresholds for AI-generated code should be stricter than for human-written code.

How do risk-tiered review gates work?

Risk-tiered review gates assign a composite risk score to each AI-generated pull request based on factors like files changed, sensitive paths touched, scan findings, and policy violations. Low-risk PRs may auto-merge, medium-risk PRs require one approval, and high-risk PRs require two approvals including security review.

Asegura agentes de codificación con IA: Sandbox, permisos y puertas de revisión

Los agentes de codificación con IA están escribiendo código de producción a escala. Las encuestas de la industria sitúan la adopción en el 84% entre desarrolladores profesionales, y ese número está subiendo. GitHub Copilot, Claude Code, Cursor, Amazon Q Developer y un creciente número de herramientas agénticas ahora generan todo desde funciones utilitarias repetitivas hasta implementaciones completas de funcionalidades. Las ganancias de velocidad son reales. La brecha de gobernanza también es real.

La mayoría de los equipos adoptaron agentes de codificación con IA pero no adoptaron gobernanza para agentes de codificación con IA. Las herramientas se enviaron más rápido que las políticas. El resultado es que el código generado por IA fluye hacia producción a través de los mismos flujos de trabajo de pull request diseñados para código escrito por humanos, pero sin el mismo escrutinio. Los revisores humanos a menudo hojean los PRs generados por IA porque asumen que la IA “lo hizo bien”, o porque el volumen de cambios generados por IA supera su capacidad de revisión. Asegurar los flujos de trabajo de agentes de codificación con IA requiere tratar los PRs generados por IA como un nivel de confianza distinto, uno con sus propios mecanismos de detección, restricciones de políticas, escaneo automatizado y puertas de revisión.

Esto no se trata de ralentizar las cosas. Se trata de construir una capa de gobernanza que iguale la velocidad y escala a la que operan los agentes de IA. Los equipos que hacen esto bien se mueven más rápido porque tienen confianza en su red de seguridad. Los equipos que lo omiten acumulan riesgo hasta que algo se rompe en producción.

Modelo de amenazas para código generado por IA

Antes de construir controles, necesitas entender qué puede salir mal. El código generado por IA introduce un conjunto específico de riesgos que difieren de los errores y vulnerabilidades que los humanos típicamente crean.

Filtración de secretos. Los agentes de IA pueden incluir inadvertidamente API keys, tokens o credenciales en el código generado. Pueden copiar patrones de datos de entrenamiento que incluyen secretos placeholder, o pueden extraer secretos de la ventana de contexto (archivos que el agente leyó durante su sesión) e incrustarlos en código nuevo. A diferencia de un humano que sabe qué strings son sensibles, un agente trata todo el contexto como material potencial.

Riesgos de dependencias. Los agentes frecuentemente sugieren paquetes que han visto en datos de entrenamiento, incluyendo paquetes obsoletos, sin mantenimiento o con vulnerabilidades conocidas. También pueden alucinar nombres de paquetes que no existen, creando una oportunidad para ataques de confusión de dependencias donde un atacante publica un paquete malicioso bajo el nombre alucinado.

Errores de lógica a escala. Un desarrollador humano que escribe un error sutil de lógica produce una instancia. Un agente de IA aplicando el mismo patrón defectuoso a través de veinte archivos produce veinte instancias. La velocidad que hace útiles a los agentes también amplifica el impacto de errores sistemáticos.

Escalación de permisos. Los agentes tienden a solicitar permisos amplios cuando permisos más estrechos serían suficientes. Un agente escribiendo una migración de base de datos podría agregar privilegios ALTER TABLE y DROP TABLE cuando solo necesita CREATE TABLE. Un agente configurando un rol IAM podría adjuntar AdministratorAccess porque resuelve el error de permisos inmediato sin entender el radio de impacto.

Inyección en la cadena de suministro. Si el contexto de un agente puede ser influenciado por entradas externas, ya sea a través de inyección de prompts en documentación que lee, archivos de repositorio envenenados o servidores MCP comprometidos, el código generado puede contener payloads intencionalmente maliciosos. Esto no es teórico. La investigación ha demostrado ataques de inyección de prompts que causan que los agentes introduzcan backdoors en código generado.

Para un tratamiento más amplio del panorama de amenazas, consulta nuestra guía para asegurar aplicaciones de IA agéntica. Para riesgos de cadena de suministro específicamente, consulta Seguridad de cadena de suministro de software en la era de la IA.

Las cuatro capas de gobernanza de código de IA

La gobernanza efectiva para código generado por IA opera en cuatro capas, cada una abordando una parte diferente del problema. Omite cualquier capa y tienes una brecha que las otras capas no pueden compensar.

Capa 1: Detección

No puedes gobernar lo que no puedes identificar. El primer requisito es detectar confiablemente qué PRs, commits y cambios de código fueron generados por agentes de IA.

Los métodos de detección incluyen:

Metadatos de commits: los agentes de codificación con IA típicamente agregan trailers Co-authored-by con patrones identificables (por ejemplo, Co-Authored-By: Claude <noreply@anthropic.com>). Analiza estos sistemáticamente.
Etiquetas de PR: muchos flujos de trabajo impulsados por agentes automáticamente agregan etiquetas como ai-generated, copilot o claude. Requiere estas etiquetas como parte de tu configuración de agentes.
Autores bot: cuando los agentes operan a través de GitHub Apps o cuentas bot, el autor del PR identifica la fuente.
Convenciones de nombres de ramas: aplica patrones de nombres para ramas creadas por agentes (por ejemplo, ai/feature-name o agent/ticket-123).

El objetivo es una determinación booleana a nivel de PR: ¿fue este cambio producido por un agente de IA? Esa bandera impulsa todo lo que sigue. Si tu detección tiene falsos negativos, el código generado por IA no detectado elude todos tus controles de gobernanza. Construye redundancia en la detección verificando múltiples señales.

Capa 2: Política

Una vez que sabes que un PR es generado por IA, aplica un conjunto de restricciones que definen lo que el agente tenía permitido hacer. Aquí es donde codificas la tolerancia al riesgo de tu organización.

La política responde preguntas como:

¿Qué archivos y directorios puede modificar el agente?
¿Qué archivos están prohibidos (autenticación, infraestructura como código, pipelines CI/CD)?
¿Cuántos archivos puede tocar un solo PR de IA?
¿Cuántas líneas de código puede agregar o modificar un solo PR de IA?
¿Necesita el agente incluir pruebas para cualquier código que escriba?

Las violaciones de política son bloqueos duros. Si un PR generado por IA modifica un archivo en la lista de blocked_patterns, el PR falla la verificación de gobernanza independientemente de cómo se vea el código. Esto es intencional. Algunas áreas del código requieren autoría humana no porque la IA no pueda escribir código correcto, sino porque el riesgo de un error no detectado en esas áreas es demasiado alto.

Capa 3: Escaneo

El escaneo de seguridad automatizado se ejecuta contra cada PR generado por IA antes de que pueda proceder a revisión. Esta capa incluye:

Detección de secretos: escanear en busca de API keys, tokens, contraseñas y otras credenciales en el diff. Herramientas como TruffleHog, GitLeaks y el escaneo de secretos integrado de GitHub detectan la mayoría de los patrones.
Análisis de dependencias: verificar cualquier dependencia recién agregada por vulnerabilidades conocidas (CVEs), problemas de compatibilidad de licencias y estado de mantenimiento. Marcar paquetes alucinados que no existen en el registro.
Análisis estático (SAST): ejecutar análisis estático específico del lenguaje para detectar patrones comunes de vulnerabilidad como inyección SQL, traversal de rutas y cross-site scripting.
Escaneo de infraestructura como código: si el PR modifica configuración de Terraform, CloudFormation o Docker, ejecutar herramientas como Checkov o Trivy para marcar configuraciones incorrectas.

La distinción clave del escaneo de seguridad estándar de CI es que los umbrales para código generado por IA deberían ser más estrictos. Un hallazgo de severidad media que produciría una advertencia en un PR humano podría producir un bloqueo duro en un PR generado por IA, porque la probabilidad de que la IA haya introducido la vulnerabilidad sin entender las implicaciones es mayor que para un humano que eligió aceptar el riesgo conscientemente.

Capa 4: Revisión

La capa final es la revisión humana, pero estructurada de manera diferente para código generado por IA. En lugar de la regla estándar de “una aprobación”, los PRs generados por IA pasan por un proceso de revisión por niveles de riesgo.

Una puntuación de riesgo se calcula basándose en factores como:

número de archivos cambiados
qué directorios y tipos de archivo están afectados
si el PR modifica áreas sensibles de seguridad
si el escaneo encontró advertencias (incluso no bloqueantes)
el tamaño y complejidad del diff

Los cambios de bajo riesgo (alcance pequeño, archivos no sensibles, escaneos limpios) pueden fusionarse automáticamente. Los cambios de riesgo medio requieren una aprobación humana. Los cambios de alto riesgo requieren dos aprobaciones incluyendo alguien del equipo de seguridad. Este escalonamiento te permite mantener la velocidad para el 70% de los cambios generados por IA que son genuinamente de bajo riesgo mientras concentras el esfuerzo de revisión donde importa.

Políticas como código para agentes de IA

Las capas de gobernanza descritas anteriormente necesitan una implementación concreta. El enfoque que recomendamos es un archivo de configuración declarativo que vive en el repositorio junto al código que gobierna. Llamamos a este archivo .ai-code-gate.yml.

detection:
  labels: ["ai-generated", "copilot", "claude"]
  co_authors: ["*[bot]@*", "*noreply@anthropic.com"]

policy:
  allowed_patterns:
    - "src/**/*.ts"
    - "src/**/*.tsx"
    - "tests/**"
  blocked_patterns:
    - "*.env*"
    - "**/auth/**"
    - "docker-compose*.yml"
    - ".github/workflows/**"
  scope_limits:
    max_files: 20
    max_lines_added: 500

review:
  risk_tiers:
    low:
      threshold: 30
      approvals: 0
      auto_merge: true
    medium:
      threshold: 70
      approvals: 1
    high:
      threshold: 100
      approvals: 2
      require_security_team: true

Esta configuración codifica las políticas de tu organización como datos estructurados que tu pipeline CI/CD puede aplicar automáticamente. Recorramos cada sección.

Reglas de detección

El bloque detection define cómo el pipeline identifica PRs generados por IA. Verifica etiquetas de PR y trailers Co-authored-by de commits contra patrones que defines. Los comodines estilo glob te permiten coincidir patrones amplios sin mantener una lista exhaustiva de cada dirección de correo de bot. Cuando cualquier señal de detección coincide, el PR se marca como generado por IA y se aplican las verificaciones de gobernanza restantes.

Patrones permitidos y bloqueados

La lista allowed_patterns es una lista blanca de rutas de archivo que el agente tiene permitido modificar. La lista blocked_patterns es una lista negra que tiene precedencia. Si un archivo coincide con ambas, el bloqueo gana.

Esto es conceptualmente similar a un archivo CODEOWNERS, pero sirve un propósito diferente. CODEOWNERS controla quién debe revisar un cambio. .ai-code-gate.yml controla si el cambio tiene permitido existir en absoluto. Un agente de IA podría estar bloqueado de modificar .github/workflows/ independientemente de quién lo revise, porque las modificaciones a pipelines CI/CD por una IA introducen demasiado riesgo para la tolerancia de tu organización.

Límites de alcance

La sección scope_limits limita el tamaño de los PRs generados por IA. Un límite de 20 archivos y 500 líneas agregadas obliga a los agentes (y a los humanos que los configuran) a dividir cambios grandes en fragmentos revisables. Esta es una barrera de protección contra el patrón común donde se le pide a un agente “refactorizar el módulo de autenticación” y produce un PR de 2,000 líneas que nadie realmente revisa porque es demasiado grande para razonar.

Niveles de riesgo

La sección review define tres niveles basados en una puntuación de riesgo calculada (0-100). El cálculo de puntuación considera conteo de archivos, tamaño del diff, qué directorios se tocan y resultados de escaneo. Los PRs de bajo riesgo se fusionan automáticamente si los escaneos están limpios. Los PRs de riesgo medio necesitan una aprobación. Los PRs de alto riesgo necesitan dos aprobaciones y alguien del equipo de seguridad.

Estos umbrales son ajustables. Comienza conservador y ajusta a medida que construyes confianza en tus capas de detección y escaneo. La mayoría de los equipos encuentran que el 60-70% de los PRs generados por IA caen en el nivel de bajo riesgo después de unas pocas semanas de ajuste, lo que significa que la gobernanza agrega casi cero fricción para la mayoría de los cambios.

Ejecución en sandbox

El análisis estático detecta mucho, pero no puede detectar todo. Algunas clases de errores solo aparecen en tiempo de ejecución: uso incorrecto de variables de entorno, secuencias incorrectas de llamadas a API, condiciones de carrera, integraciones rotas. La ejecución en sandbox te da una forma de ejecutar código generado por IA antes de fusionarlo, sin exponer tu entorno de producción o infraestructura CI.

Por qué ejecutar código antes de fusionar

El modelo tradicional es fusionar código y luego ejecutarlo en un entorno de staging. Para código generado por IA, quieres desplazar eso a la izquierda. Ejecutar el código en un sandbox antes de fusionar te da una señal sobre comportamiento en tiempo de ejecución que ninguna herramienta de análisis estático puede proporcionar. ¿El código realmente arranca? ¿Las pruebas pasan? ¿Intenta hacer llamadas de red inesperadas? ¿Consume memoria o CPU excesiva?

Esto es especialmente importante porque los agentes de IA no siempre escriben código correcto en el primer intento. Producen código que parece plausible pero puede tener problemas sutiles que solo aparecen cuando intentas ejecutarlo. Detectar estos antes de fusionar ahorra el tiempo y el costo de cambio de contexto de un revert.

Sandboxes basados en contenedores

El enfoque más práctico es ejecutar código generado por IA en contenedores Docker aislados con capacidades restringidas:

Sistema de archivos aislado: el contenedor obtiene una copia del repositorio con los cambios del PR aplicados, pero no puede escribir de vuelta al host o acceder a otros repositorios.
Restricciones de red: el contenedor no tiene acceso de red saliente, o acceso limitado a endpoints internos específicos necesarios para pruebas. Esto previene la exfiltración de secretos o datos, y bloquea la instalación de dependencias de fuentes no confiables.
Límites de recursos: CPU, memoria y tiempo de ejecución están limitados. Si el código generado por IA contiene un bucle infinito o una fuga de memoria, el contenedor se mata después del timeout en lugar de consumir recursos compartidos de CI.
Sin acceso privilegiado: el contenedor se ejecuta sin privilegios root y sin acceso al socket de Docker. El código generado por IA no puede escapar del sandbox.

Ejecución de pruebas en sandbox

Dentro del sandbox, ejecutas el suite de pruebas del proyecto contra los cambios generados por IA. Esto sirve dos propósitos: valida que el nuevo código funciona, y valida que el nuevo código no rompe funcionalidad existente. Si se suponía que el agente debía incluir pruebas para sus cambios (una política que puedes aplicar en la sección policy), el sandbox también verifica que esas pruebas existan y pasen.

Enfoques comparados

Existen varios enfoques para la ejecución en sandbox, cada uno con diferentes compensaciones:

Basado en Docker (DIY): gestionas tus propias imágenes de contenedor, configuración de seguridad y limpieza. Máximo control, mayor sobrecarga operacional. Bueno para equipos con infraestructura de contenedores existente.
E2B: un servicio gestionado que proporciona entornos sandbox diseñados para ejecución de código de agentes de IA. Menor sobrecarga operacional, pero agrega una dependencia externa y costo.
Kubernetes Jobs: pods efímeros con contextos de seguridad, políticas de red y cuotas de recursos. Bueno para equipos que ya ejecutan Kubernetes. Proporciona fuerte aislamiento a través de estándares de seguridad de pods.

Para la mayoría de los equipos, los sandboxes basados en Docker ejecutándose en tu infraestructura CI existente son el punto de partida correcto. No requieren nuevas dependencias externas y se integran limpiamente con GitHub Actions, GitLab CI o cualquier sistema CI que ya uses.

El rastro de auditoría

Cada decisión de gobernanza necesita un registro. Cuando un incidente ocurra seis meses desde ahora y necesites entender cómo una pieza de código generado por IA llegó a producción, necesitas reconstruir la cadena completa: quién activó el agente, qué prompt se usó, qué código se generó, qué escaneos se ejecutaron, cuáles fueron los resultados, quién lo aprobó y cuándo se fusionó.

Qué registrar

Un rastro de auditoría completo para código generado por IA incluye:

Evento disparador: quién inició la sesión del agente, qué ticket o tarea se referenció, cuál fue el prompt o instrucción original
Contexto de generación: qué modelo se usó, qué archivos leyó el agente para contexto, qué herramientas invocó el agente durante la generación
Diff de código: los cambios exactos que el agente produjo, almacenados como un artefacto versionado
Resultado de detección: cómo se identificó el PR como generado por IA, qué señales coincidieron
Resultado de verificación de política: qué patrones se evaluaron, si se encontraron violaciones
Resultados de escaneo: salida completa de detección de secretos, análisis de dependencias, SAST y cualquier otro escáner
Puntuación de riesgo: la puntuación calculada, los factores que contribuyeron a ella y la asignación de nivel resultante
Decisiones de revisión: quién revisó, cuándo, qué comentarios se hicieron, si alguna revisión fue anulada
Evento de fusión: cuándo se fusionó el código, por quién, a qué rama

Relevancia de cumplimiento

Si tu organización opera bajo SOC 2, ISO 27001, FedRAMP o marcos de cumplimiento similares, el código generado por IA crea requisitos de documentación específicos. Los auditores preguntarán cómo aseguras que el código generado por IA cumple los mismos estándares de seguridad que el código escrito por humanos. Tener un rastro de auditoría estructurado que demuestre detección, aplicación de políticas, escaneo y revisión es la diferencia entre una auditoría fluida y un hallazgo.

SOC 2 Type II en particular requiere evidencia de que los controles de seguridad operan consistentemente a lo largo del tiempo. Las capturas de pantalla puntuales no son suficientes. Necesitas recolección de evidencia continua y automatizada, que es exactamente lo que proporciona un rastro de auditoría bien implementado.

Eventos estructurados vs registros no estructurados

Evita volcar datos de gobernanza en registros de aplicación como texto no estructurado. En su lugar, emite eventos de auditoría estructurados con esquemas consistentes. Cada evento debería ser un objeto JSON con un tipo definido, marca de tiempo, ID de correlación (vinculándolo al PR) y payload específico del evento.

Los eventos estructurados son consultables, agregables e integrables con tu SIEM y herramientas de cumplimiento. Los registros no estructurados requieren parsing, se rompen cuando los formatos cambian y hacen la investigación de incidentes dolorosa. Invierte en el enfoque estructurado desde el principio.

El OWASP Top 10 para Aplicaciones Agénticas lista el registro y monitoreo insuficientes como un riesgo principal para sistemas agénticos. La Guía de Seguridad de Asistentes de Código IA de OpenSSF similarmente enfatiza los rastros de auditoría como un control fundamental. Estas no son recomendaciones teóricas; reflejan incidentes observados donde la falta de registro hizo imposible determinar el alcance de eventos de seguridad relacionados con IA.

La implementación de referencia ai-code-gate

Para hacer el marco de gobernanza concreto e inmediatamente utilizable, construimos ai-code-gate, una implementación de referencia que puedes instalar en cualquier repositorio de GitHub.

Estructura del repositorio

El repo está organizado como un conjunto de acciones compuestas de GitHub Actions que se encadenan en un pipeline de gobernanza completo:

ai-code-gate/
  .github/
    actions/
      detect-ai-pr/    # Identify AI-generated PRs
      policy-check/    # Enforce file and scope policies
      security-scan/   # Run secret, dependency, and SAST scans
      sandbox-test/    # Execute tests in isolated Docker container
      risk-assessment/ # Compute risk score and assign tier
    workflows/
      ai-code-gate.yml # Main workflow that chains all actions
  src/
    detect.ts          # AI PR detection engine
    policy.ts          # Policy loading and diff validation
    risk.ts            # Risk scoring and tier assignment
  examples/
    .ai-code-gate.yml  # Default configuration for adopters
  sample-app/          # Demo Express API for testing the pipeline
  .ai-code-gate.yml    # Policy for this repo itself
  README.md

Arquitectura del flujo de trabajo

El flujo de trabajo principal se activa en eventos pull_request y ejecuta la detección primero, luego despliega verificaciones de políticas, escaneos de seguridad y pruebas sandbox en paralelo antes de converger en la evaluación de riesgo:

name: AI Code Gate
on:
  pull_request:
    types: [opened, synchronize, reopened]

jobs:
  detect:
    runs-on: ubuntu-latest
    outputs:
      is_ai_pr: ${{ steps.detect.outputs.is_ai_pr }}
    steps:
      - uses: actions/checkout@v4
        with:
          fetch-depth: 0
      - uses: ./.github/actions/detect-ai-pr
        id: detect

  policy-check:
    needs: detect
    if: needs.detect.outputs.is_ai_pr == 'true'
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: ./.github/actions/policy-check

  security-scan:
    needs: detect
    if: needs.detect.outputs.is_ai_pr == 'true'
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: ./.github/actions/security-scan

  sandbox-test:
    needs: detect
    if: needs.detect.outputs.is_ai_pr == 'true'
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: ./.github/actions/sandbox-test

  risk-assessment:
    needs: [detect, policy-check, security-scan, sandbox-test]
    if: always() && needs.detect.outputs.is_ai_pr == 'true'
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: ./.github/actions/risk-assessment

El flujo de trabajo cortocircuita para PRs que no son de IA (las condiciones if en cada job). Los PRs de autoría humana pasan sin verificaciones adicionales, por lo que adoptar ai-code-gate agrega cero sobrecarga a tus flujos de trabajo humanos existentes.

Puntuación de riesgo

El calculador de riesgo evalúa múltiples factores y produce una puntuación ponderada de 0 a 100:

interface RiskFactors {
  filesChanged: number;
  linesAdded: number;
  sensitivePathsModified: string[];
  newDependenciesAdded: number;
  scanFindings: ScanFinding[];
  hasTests: boolean;
}

function calculateRiskScore(factors: RiskFactors): number {
  let score = 0;

  // File count contributes up to 20 points
  score += Math.min(20, factors.filesChanged * 2);

  // Lines added contributes up to 20 points
  score += Math.min(20, Math.floor(factors.linesAdded / 50));

  // Sensitive paths are heavily weighted
  score += factors.sensitivePathsModified.length * 15;

  // New dependencies add risk
  score += factors.newDependenciesAdded * 5;

  // Scan findings add directly to risk
  for (const finding of factors.scanFindings) {
    score += finding.severity === "high" ? 20 : finding.severity === "medium" ? 10 : 5;
  }

  // Having tests reduces risk
  if (factors.hasTests) {
    score = Math.max(0, score - 10);
  }

  return Math.min(100, score);
}

Los pesos son configurables. Los valores por defecto están diseñados para ser conservadores: un PR que toca código de autenticación o agrega nuevas dependencias caerá en el nivel medio o alto incluso si es pequeño. Ajustas los pesos basándote en tu propio perfil de riesgo después de observar la distribución de puntuaciones a través de tus primeras semanas de PRs generados por IA.

Adopción incremental

No necesitas desplegar las cinco acciones a la vez. La ruta de adopción recomendada:

Semana 1: despliega solo la detección. Etiqueta PRs generados por IA pero no tomes acción bloqueante. Observa cuántos PRs se detectan y verifica la precisión.
Semana 2: agrega verificaciones de políticas en modo de advertencia. Marca violaciones de políticas en comentarios del PR pero no bloquees la fusión.
Semana 3: agrega escaneo de seguridad. Nuevamente, reporta hallazgos sin bloquear.
Semana 4: habilita modo de bloqueo para violaciones de políticas y hallazgos de alta severidad.
Semana 5+: habilita puertas de revisión por niveles de riesgo. Ajusta umbrales basándote en datos observados.

Este despliegue gradual construye confianza y evita la fricción organizacional de desplegar un sistema de gobernanza bloqueante el primer día. Para cuando habilites el bloqueo, todos han visto el sistema en acción y entienden qué verifica y por qué.

Qué sigue

Si quieres implementar este marco de forma práctica, sigue el tutorial complementario: Bloquea pipelines de agentes de codificación con IA. Te guía a través de instalar ai-code-gate, configurar políticas para tu código y validar cada capa de gobernanza con PRs de prueba.

El panorama de gobernanza para código generado por IA está evolucionando rápidamente. Direcciones que esperamos ver madurar en los próximos 12 meses incluyen requisitos de cobertura de pruebas generadas por IA (los agentes deben producir pruebas que alcancen un umbral mínimo de cobertura para el código que escriben), disparadores de rollback automatizado (si el código generado por IA causa una anomalía en métricas de producción, revertir automáticamente la fusión) y ajuste de políticas específicas por modelo (diferentes perfiles de riesgo para diferentes modelos de IA basados en diferencias de calidad observadas).

La perspectiva fundamental es que los agentes de codificación con IA no van a desaparecer, y sus capacidades solo están aumentando. Las organizaciones que más se beneficiarán son aquellas que construyan infraestructura de gobernanza ahora, mientras el volumen de código generado por IA es lo suficientemente manejable para iterar sobre políticas y herramientas. Esperar hasta que los agentes de IA escriban la mayoría de tu código para empezar a pensar en gobernanza significa aplicar controles retroactivamente a un código donde no puedes distinguir con confianza el código escrito por IA del escrito por humanos.

Para más sobre los temas cubiertos en esta guía:

Agentes de codificación con IA en 2026: Cómo MCP y los modelos aumentados con herramientas están cambiando el desarrollo cubre las capacidades y arquitectura de los agentes de codificación con IA modernos.
Cómo proteger aplicaciones de IA agéntica: La guía práctica de 2026 proporciona un marco de seguridad más amplio para sistemas impulsados por IA.
Seguridad de cadena de suministro de software en la era de la IA aborda riesgos de dependencias y pipeline de compilación.
Endurece tu pipeline CI/CD con Sigstore, SLSA y SBOMs cubre técnicas complementarias de endurecimiento de CI/CD.

Obtén el AI Code Gate Pipeline →

Obtén la Lista de Verificación Gratuita de Gobernanza de Código IA →

Preguntas frecuentes

¿Cómo se detectan los pull requests generados por IA?

La detección usa múltiples señales combinadas: trailers Co-authored-by de commits de herramientas como GitHub Copilot y Claude Code, etiquetas de PR como ai-generated o copilot, cuentas de autor bot conocidas y convenciones de nombres de ramas como prefijos copilot/ o claude/. Combinar estas señales reduce los falsos negativos. El paso de detección se ejecuta primero en el pipeline y determina si se activan las verificaciones adicionales específicas de IA.

¿Qué se debería escanear en el código generado por IA?

El código generado por IA debería escanearse en cuatro categorías: secretos y credenciales (usando herramientas como Gitleaks), vulnerabilidades de dependencias y nombres de paquetes alucinados (usando npm audit, pip-audit o similares), hallazgos de análisis estático (usando Semgrep o herramientas SAST similares) y configuraciones incorrectas de infraestructura como código (para Terraform, CloudFormation o Dockerfiles). Los umbrales para código generado por IA deberían ser más estrictos que para código escrito por humanos porque el volumen y velocidad de la salida de IA amplifica el impacto de errores sistemáticos.

¿Cómo funcionan las puertas de revisión por niveles de riesgo?

Las puertas de revisión por niveles de riesgo asignan una puntuación de riesgo compuesta a cada pull request generado por IA basada en factores como el número de archivos cambiados, si se tocan rutas sensibles, hallazgos de escaneo de seguridad y violaciones de políticas. La puntuación se mapea a un nivel: los PRs de bajo riesgo pueden fusionarse automáticamente después de pasar todos los escaneos, los PRs de riesgo medio requieren una aprobación humana y los PRs de alto riesgo requieren dos aprobaciones incluyendo un revisor de seguridad. Los umbrales de nivel y pesos de puntuación son configurables en el archivo de políticas.

Asegurando flujos de trabajo de agentes de codificación con IA: Sandbox, permisos y revisión de código generado por IA en pipelines de producción