Chatbot tradicional vs LLM: diferencias que realmente importan

Para seguir este post necesitas saber Python básico. Los ejemplos de código son cortos y están comentados, pero ayuda reconocer la sintaxis.

Si alguna vez has escrito “quiero hablar con una persona” en el chat de soporte de una web y el bot ha respondido “No he entendido. Elige una opción: 1. Pedidos 2. Devoluciones”, ya sabes de primera mano lo que es un chatbot tradicional. Esa rigidez no es un error de diseño. Es exactamente cómo funcionan.

Cómo funciona un chatbot tradicional

Un chatbot tradicional no es simplemente un diccionario de respuestas fijas. Por dentro usa un modelo clasificador: una IA entrenada para leer lo que escribe el usuario y decidir a qué categoría pertenece. Esas categorías se llaman intents o “temas” en español.

Por ejemplo, puedes tener estos intents:

consultar_saldo: el usuario quiere saber cuánto dinero tiene.
bloquear_tarjeta: el usuario quiere bloquear su tarjeta.

Cuando el usuario escribe algo, el clasificador no busca la frase exacta. Lo que hace es analizar el mensaje y preguntarse: ¿a cuál de los intents se parece más esto? Y en lugar de responder con un sí o un no, devuelve un porcentaje de confianza para cada uno. Algo como “esto tiene un 92% de pinta de ser bloquear_tarjeta y un 4% de consultar_saldo”. Si ese porcentaje supera el umbral que tu has definido, ejecuta la respuesta de ese intent. Si ninguno lo supera, el chatbot admite que no ha entendido.

1.00

# Esto es una simplificación del flujo real
# En producción, classify_intent() llama a un modelo clasificador entrenado

def procesar_mensaje(mensaje):
    intent, confianza = classify_intent(mensaje)  # modelo clasificador

    if confianza < 0.7:  # umbral de confianza
        return "No te he entendido. Elige: 1. Saldo  2. Tarjeta"

    respuestas = {
        "consultar_saldo": "Tu saldo actual es de 340€.",
        "bloquear_tarjeta": "Llama al 900 123 456 para bloquear tu tarjeta."
    }
    return respuestas[intent]

Además de reconocer temas, el chatbot también extrae datos específicos del mensaje. Si dices “bloquea mi tarjeta Visa”, el tema es “bloquear tarjeta” y el dato específico es “Visa”. El sistema sabe entonces cuál de tus tarjetas quieres bloquear.

Gracias al clasificador, el chatbot entiende “mi tarjeta no funciona” y lo mapea a bloquear_tarjeta aunque nadie le haya enseñado esa frase exacta. Lo que sí necesita es ejemplos de entrenamiento suficientes para que el modelo aprenda bien cada intent.

¿Cuándo funciona bien este enfoque? Cuando el usuario escribe exactamente lo que el sistema espera. Estas dos preguntas las gestiona sin problemas:

“¿Cuál es el horario de la tienda?” → intent horario, respuesta fija.
“Quiero hacer un pedido” → intent nuevo_pedido, abre el flujo de compra.

Pero si el usuario escribe “me han cobrado algo raro esta semana y no sé si es de la suscripción o de otro lado”, el chatbot no tiene un intent para eso. No puede razonar sobre la ambigüedad. Devuelve “no te he entendido” y la conversación termina ahí.

Cómo funciona un chatbot con LLM

Un LLM (Large Language Model, o “modelo de lenguaje grande”) es una inteligencia artificial que ha leído millones de textos. No busca respuestas en una lista predefinida, sino que entiende el significado de lo que escribes y genera una respuesta nueva.

La diferencia es como si compares un empleado que solo conoce 20 respuestas memorizadas, con otro que ha estudiado miles de documentos sobre el tema y puede razonar y responder cualquier pregunta que le hagas de forma diferente cada vez.

Para crear un chatbot con LLM, lo primero que haces es darle instrucciones escritas. Le dices qué rol tiene (por ejemplo, “eres el asistente de un banco”), cómo debe hablar y qué cosas no puede hacer (por ejemplo, “no inventes datos de clientes”). El modelo lee estas instrucciones antes de responder cualquier pregunta del usuario.

import anthropic

client = anthropic.Anthropic()  # Requiere ANTHROPIC_API_KEY como variable de entorno

# El system prompt define el rol y los límites del chatbot
SYSTEM_PROMPT = """Eres el asistente del Banco Ejemplo.
Nunca inventes saldos ni datos del cliente."""

def responder(pregunta):
    # Enviamos la pregunta al modelo junto con las instrucciones
    respuesta = client.messages.create(
        model="claude-opus-4-6",  # Para pruebas, claude-haiku-4-5-20251001 es más barato
        max_tokens=500,
        system=SYSTEM_PROMPT,
        messages=[{"role": "user", "content": pregunta}]
    )
    return respuesta.content[0].text  # El texto generado por el modelo

Si el chatbot maneja datos reales de usuarios, revisa los requisitos legales antes de enviarlos a un proveedor externo.

Ese chatbot responde “me han cobrado algo raro esta semana y no sé si es de la suscripción o de otro lado” sin problema. No hay ningún intent configurado para eso. El modelo entiende la pregunta y genera una respuesta útil.

Además, el modelo recuerda lo que pasó antes en la conversación. Si el usuario dijo “tengo dos tarjetas” y después pregunta “¿cuál debo cancelar?”, el modelo recuerda las dos tarjetas. Esto funciona porque el modelo tiene una “memoria” de la conversación. Aunque esta memoria tiene límites (no puede recordar conversaciones infinitamente largas).

El riesgo principal del LLM es la alucinación: el modelo puede generar una respuesta que suena correcta pero es inventada. Si le preguntas “¿cuánto saldo tengo?”, un LLM sin acceso a datos reales puede fabricar una cifra plausible. Por eso el system prompt del ejemplo incluye “nunca inventes saldos ni datos del cliente”. No elimina el riesgo del todo, pero lo reduce.

Cuándo usar cada uno

Chatbot tradicional: Úsalo cuando las preguntas siempre siguen el mismo patrón. Por ejemplo, un menú de soporte con opciones fijas: “¿Qué necesitas? 1. Ver saldo 2. Bloquear tarjeta 3. Horarios”.

Chatbot con LLM: Úsalo cuando los usuarios pueden preguntar de formas inesperadas. Por ejemplo, preguntas complejas o que mezclen varios temas.

1.00

Aspecto	Chatbot tradicional	Chatbot con LLM
Coste por conversación	Muy bajo	Depende del modelo y la longitud
Preguntas fuera del guión	Responde si se parece a un intent conocido, no si es algo completamente nuevo	Responde con flexibilidad
Respuestas predecibles	Sí, siempre la misma respuesta fija	No, varían según el contexto
Riesgo de inventar datos	No (respuestas hardcodeadas)	Sí, hay que controlarlo
Mantenimiento	Añadir y editar intents	Ajustar el system prompt y probar

Elige chatbot tradicional si:

Las respuestas son siempre iguales (estado de pedidos, horarios, preguntas frecuentes).
El usuario sigue un menú o pasos predefinidos.
Quieres ahorrar costes y máxima previsibilidad.

Elige chatbot con LLM si:

Los usuarios hacen preguntas variadas o complejas.
Un problema puede describirse de muchas formas distintas.
Necesitas flexibilidad en las respuestas.

Ejemplos:

Pregunta simple: “¿A qué hora cierra?” → Chatbot tradicional. Tiene una respuesta fija.
Pregunta compleja: “Compré un producto que no funciona bien. ¿Puedo devolverlo si solo tengo la mitad del embalaje?” → LLM. Es una situación específica que necesita análisis.

Patrón híbrido: También puedes combinar los dos. El chatbot intenta responder con intents. Si no puede, pasa la pregunta al LLM. Esto es común en producción porque ahorras costes: el LLM solo interviene cuando lo necesitas.

El inconveniente es que tienes que mantener dos sistemas en paralelo y sincronizar cuándo pasar de uno a otro.

Si quieres profundizar en cómo escribir instrucciones efectivas para el LLM, el post sobre prompt engineering para desarrolladores cubre los patrones que más se usan en proyectos reales.

Preguntas Frecuentes

¿Un chatbot con LLM siempre es mejor que uno tradicional?

No. Para flujos cerrados y repetibles, el chatbot tradicional es más controlable y más barato de operar. Añadir un LLM donde no hace falta solo suma coste y complejidad.

¿Puede el LLM inventarse respuestas?

Sí, y es el riesgo principal. Las alucinaciones ocurren cuando el modelo genera texto que suena plausible pero no corresponde a la realidad. La forma de mitigarlo es ser explícito en el system prompt sobre qué datos puede y no puede proporcionar el modelo. Si necesitas precisión real, tienes que conectar el chatbot a fuentes de datos externas en lugar de confiar en lo que el modelo recuerde de su entrenamiento.

¿Puedo usar los dos enfoques juntos?

Sí. El patrón más habitual es usar un clasificador de intents para las preguntas frecuentes y el LLM como fallback para todo lo demás. Consigues velocidad y coste bajo para lo predecible, y flexibilidad para lo que no.

¿Qué pasa si el usuario hace preguntas en varios idiomas?

El chatbot tradicional solo funciona bien en los idiomas para los que hayas definido frases de ejemplo en cada intent. El LLM entiende directamente múltiples idiomas sin configuración adicional, aunque conviene indicar en el system prompt en qué idioma debe responder el modelo.

Cómo funciona un chatbot tradicional

Cómo funciona un chatbot con LLM

Cuándo usar cada uno

Preguntas Frecuentes

¿Un chatbot con LLM siempre es mejor que uno tradicional?

¿Puede el LLM inventarse respuestas?

¿Puedo usar los dos enfoques juntos?

¿Qué pasa si el usuario hace preguntas en varios idiomas?

Articulos relacionados

Ventana de contexto y buenas prácticas

Temperatura en LLMs: qué es y qué valor usar según tu caso

Prompt Engineering para desarrolladores: los 5 patrones esenciales

Un concepto nuevo cada semana