Crear tu Primer Agente IA en Producción: Los Pasos que Nadie Muestra

2 jul. 20268 min

Los tutoriales de agentes IA se detienen siempre en el mismo punto: el prototipo que funciona en un Jupyter notebook. Aquí cubro lo que viene después — crear un agente que corra en producción con usuarios reales.

Qué Es Realmente un Agente IA (en la Práctica)

Un agente IA es un bucle: el modelo recibe contexto, decide una acción, ejecuta la herramienta correspondiente, recupera el resultado, y repite hasta tener una respuesta final.

Arquitectura mínima:

async function runAgent(userQuery: string, tools: Tool[]): Promise<string> {
  const messages: Message[] = [{ role: 'user', content: userQuery }];

  for (let i = 0; i < MAX_STEPS; i++) {
    const response = await callClaude({ messages, tools });
    const step = parseAgentResponse(response);

    if (step.finalAnswer) return step.finalAnswer;
    if (!step.tool) throw new Error('Agent stuck: no tool, no answer');

    const result = await executeTool(step.tool, step.toolInput);
    messages.push(
      { role: 'assistant', content: response.content },
      { role: 'user', content: `Tool result: ${result}` }
    );
  }
  throw new Error(`Agent exceeded MAX_STEPS (${MAX_STEPS})`);
}

MAX_STEPS es innegociable. Sin esto, un agente puede hacer bucle indefinidamente.

Definir las Herramientas con Precisión

La calidad de las herramientas es lo que diferencia un agente útil de uno que alucina.

Cada herramienta necesita:

Un nombre explícito (search_database, no search)
Una descripción que indique cuándo usarla Y cuándo no
Un esquema JSON estricto para los parámetros

const searchTool = {
  name: "search_client_database",
  description: `Busca en la base de datos de clientes por nombre, NIF o email.
    Usa cuando: el usuario pregunta sobre un cliente específico.
    NO uses para: estadísticas generales — usa get_stats en su lugar.`,
  input_schema: {
    type: "object",
    properties: {
      query: { type: "string", description: "Nombre, NIF o email" },
      limit: { type: "number", description: "Máximo resultados, por defecto 5" }
    },
    required: ["query"]
  }
};

Tests Antes de Producción

Lo que testeo sistemáticamente:

Happy path: el agente completa la tarea en ≤ N pasos
Fallo de herramienta: una herramienta devuelve error — el agente debe degradarse bien
Bucle infinito: MAX_STEPS alcanzado — el agente debe salir limpiamente
Input malicioso: prompt injection, desbordamiento de contexto

Monitorización en Producción

Dos métricas críticas en tiempo real:

Número medio de pasos por sesión — si sube, una herramienta está rota o el prompt es ambiguo
Tasa de sesiones MAX_STEPS — si > 2%, hay un bug en la lógica del agente

Sin monitorización, descubres los problemas cuando el usuario se queja. Con ella, los ves antes.

Lo Que No Hacemos

Nunca desplegar sin suite de tests de regresión
Nunca superar 10 herramientas por agente (más allá, el modelo se pierde)
Nunca dejar que un agente modifique datos críticos sin confirmación humana

Stéphanie Caumont

Product Owner de IA · Saber más