Por qué se equivoca la IA — alucinaciones, límites y cómo cuidarte

TL;DR

La IA no miente deliberadamente, pero puede inventar datos, precios, estadísticas. Entender por qué pasó es el primer paso. Después aprenderás a verificar y a cuidarte. No es para asustarse, es para trabajar de verdad.

✦ Resumido con Claude al publicar

✦ Reescritura con IA

Leelo como…

Hace poco me pasó esto: un cliente me preguntó cuál era el presupuesto promedio que gastaban las PyMEs en software de gestión. Le pregunté a Claude. La respuesta fue tan específica, tan detallada, que parecía datos duros.

"El presupuesto promedio es USD $4.200 anuales, representando el 8-12% del gasto IT total."

Sonaba real. Me la iba a pasar al cliente directamente. Por suerte, en el último segundo pensé: "¿De dónde sacó eso?" Hice una búsqueda rápida. El número no aparecía en ningún lado.

Eso se llama alucinación en IA. Y es probablemente el concepto más importante que necesitás entender para trabajar con IA de verdad.

—

¿QUÉ ES UNA ALUCINACIÓN?

Una alucinación es cuando la IA **genera texto que parece correcto pero es inventado**. No miente adrede. Simplemente, su arquitectura la lleva a predecir tokens que encajan en el patrón, aunque los datos no existan.

¿Cómo funciona internamente?

La IA funciona por predicción estadística. Ve la frase "El presupuesto promedio de software en PyMEs es…" y el modelo predice cuál es la palabra más probable siguiente basada en patrones que vio durante el entrenamiento. Si vio muchas frases así terminadas con números, va a generar un número que suena plausible.

El problema: el modelo no accede a una base de datos de verdad. No busca en Google. No consulta un libro. Predice cuál es el siguiente token más probable. Y a veces, esa predicción es una alucinación.

—

¿EN QUÉ TEMAS ALUCINA MÁS?

Datos cuantificables = riesgo alto – Estadísticas ("El 73% de los consumidores prefieren…") – Precios ("El plan pro de X cuesta…") – Fechas y números ("En 2019, la inversión en IA fue…") – Referencias exactas ("El estudio de Smith et al. (2021)…")

Información técnica específica = riesgo moderado-alto – Dosis de medicinas – Leyes exactas ("La ley de protección de datos dice…") – Procedimientos técnicos muy específicos – Configuraciones exactas de software

Trabajo creativo y análisis = riesgo bajo – Escribir un email – Brainstorming de ideas – Estructurar un documento – Explicar un concepto – Revisar y mejorar un texto

Conversación general = riesgo bajo – Hablar de un tema – Dar perspectivas – Resumir información

Sin verificación / Con verificación: en los temas de riesgo alto, la diferencia entre un trabajo útil y un desastre es una búsqueda en Google.

—

CÓMO VERIFICAR SIN VOLVERSE LOCO

No es necesario que verifiques absolutamente todo. Es necesario que verifiques lo crítico.

Estrategia 1: Pedile que busque la fuente

“ "¿Cuánto cuesta un plan pro de Slack?" “

Mala respuesta de la IA: "USD $12.50 al mes"

Mejor pregunta: “ "¿Cuánto cuesta un plan pro de Slack? Buscá en Google y citá la fuente exacta." “

Mejor respuesta de la IA: "Según el sitio oficial de Slack (slack.com/pricing), el plan Pro es USD $12.50 por usuario al mes, facturado anualmente."

Eso es radicalmente más verificable. Podés ir a slack.com/pricing y confirmar en 10 segundos.

Estrategia 2: Verifica vos mismo lo crítico

Si la IA te da un número, una estadística, o una afirmación que es crítica para tu decisión, invertí 2 minutos en Google. Busca la fuente. ¿Aparece? Okay, probablemente sea real. ¿No aparece? No la uses.

Estrategia 3: Si es muy importante, pregunta a dos IAs

Le preguntas lo mismo a Claude y a ChatGPT. Si ambos dan el mismo número con la misma fuente, es probablemente real. Si dan números diferentes, sabes que tenés que verificar vos mismo.

Estrategia 4: Usa la IA para acotar el rango, no para la respuesta final

En lugar de preguntarle "¿Cuántos trabajadores remota hay en Argentina?", preguntale:

"¿Cuál es el rango probable de trabajadores remotos en Argentina? Dame un rango (100k-500k, 500k-1M, 1M-5M) y luego te muestro dónde verificar."

Esto reduce el riesgo. Un rango es más difícil de alucinar. Y luego vos verificas el rango con datos reales.

—

POR QUÉ ESTA PASANDO ESTO (Y NO ES CULPA DE NADIE)

La realidad técnica: los modelos de lenguaje funcionan con matemática estadística, no con búsqueda de información. No "saben" los datos. Predicen qué palabra viene después basada en patrones.

Es como si le pidieras a alguien que escriba una novela basada en patrones de literatura que leyó. Puede escribir algo que parece real, pero los detalles específicos pueden ser inventados.

Esto no es un error del modelo. Es arquitectura. Es cómo funcionan estas herramientas.

—

LA VERDAD INCÓMODA

Trabajar con IA significan:

Aprovechá lo que hace bien (escritura, análisis, estructuración, brainstorming)
Verificá lo crítico (datos, números, leyes, referencias)
Nunca confíes ciegamente en un número importante

Eso es todo.

¿Es complicado? No. Es responsabilidad. Como revisar dos veces un email antes de mandarlo, o como leer un acuerdo antes de firmarlo.

La IA que alucina no es una IA rota. Es una IA que requiere contexto humano para decisiones críticas. Y eso no es debilidad. Es exactamente cómo debería funcionar.

¿La solución? Usar la IA de forma inteligente. Confiar en ella para el trabajo creativo y de análisis. Verificar siempre lo crítico. Simple.

Cuando trabajás así, la IA es increíblemente potente sin riesgo.

Te pasó esto: le pediste a una IA un dato, una estadística, un número. Parecía totalmente convincente. Lo copiaste. Lo mandaste a tu jefe. Después resultó que estaba inventado.

Eso se llama alucinación. Y necesitás entender qué está pasando acá, porque la IA no está siendo mala. Es simplemente cómo funciona.

¿Por qué pasa?

Una IA como Claude o ChatGPT funciona prediciendo la siguiente palabra basada en todas las palabras anteriores. Es increíblemente buena en eso. Tan buena que a veces predice palabras que suenan real pero no son reales.

Imagináte un clima: la IA ve patrones sobre cómo se escriben textos, y a veces ese patrón la lleva a inventar un detalle que encaja perfectamente en la narrativa. Pero está inventado.

Ejemplos reales: - "¿Cuál es la población de Mendoza?" → La IA te da un número que parece real. Pero puede ser completamente inventado. - "¿Cuánto cuesta el plan pro de Slack?" → Te da un número bonito, pero puede ser un precio que no existe. - "Citá 3 estudios científicos sobre productividad" → Te da títulos que suenan reales, pero los estudios pueden no existir.

Sin verificación / Con verificación: la diferencia es que uno te quema y otro no.

¿Qué temas son peligrosos?

Números y estadísticas
Precios y costos
Leyes y regulaciones
Dosis o tratamientos médicos
Citas exactas o referencias bibliográficas
Datos históricos específicos

¿Qué temas son seguros?

Escribir un email o propuesta
Brainstorming de ideas
Explicar un concepto
Estructurar un documento
Revisar y mejorar texto

Para los temas seguros, la IA es excelente. Para los temas peligrosos, necesitás verificar.

¿Cómo verificas?

Opción 1: Pedile que busque en internet. "Buscá en Google cuál es la población de Mendoza y citá la fuente". Eso reduce el error muchísimo.

Opción 2: Verifica vos mismo. Toma el dato que te dio la IA, buscalo en Google, Wikipedia o la fuente oficial. Si aparece igual, es probablemente real.

Opción 3: Cruza con otra IA. Preguntale a ChatGPT o Gemini lo mismo que le preguntaste a Claude. Si los tres dicen el mismo número, probablemente esté bien.

La verdad incómoda: La IA es increíblemente útil. Pero requiere que vos verifiques lo crítico. No es robot que confíes ciegamente. Es herramienta que necesitás saber usar.

¿Significa que es peligrosa? No. Significa que es responsabilidad tuya verificar lo importante. Como leerías dos veces un email antes de mandarlo a un cliente importante.

Cuando aprendés a trabajar con estos límites, la IA deja de ser un riesgo y se convierte en el mejor ahorro de tiempo que tenés.

"El presupuesto promedio es USD $4.200 anuales, representando el 8-12% del gasto IT total."

Sonaba real. Me la iba a pasar al cliente directamente. Por suerte, en el último segundo pensé: "¿De dónde sacó eso?" Hice una búsqueda rápida. El número no aparecía en ningún lado.

Eso se llama alucinación en IA. Y es probablemente el concepto más importante que necesitás entender para trabajar con IA de verdad.

—

¿QUÉ ES UNA ALUCINACIÓN?

¿Cómo funciona internamente?

—

¿EN QUÉ TEMAS ALUCINA MÁS?

Trabajo creativo y análisis = riesgo bajo – Escribir un email – Brainstorming de ideas – Estructurar un documento – Explicar un concepto – Revisar y mejorar un texto

Conversación general = riesgo bajo – Hablar de un tema – Dar perspectivas – Resumir información

Sin verificación / Con verificación: en los temas de riesgo alto, la diferencia entre un trabajo útil y un desastre es una búsqueda en Google.

—

CÓMO VERIFICAR SIN VOLVERSE LOCO

No es necesario que verifiques absolutamente todo. Es necesario que verifiques lo crítico.

Estrategia 1: Pedile que busque la fuente

“ "¿Cuánto cuesta un plan pro de Slack?" “

Mala respuesta de la IA: "USD $12.50 al mes"

Mejor pregunta: “ "¿Cuánto cuesta un plan pro de Slack? Buscá en Google y citá la fuente exacta." “

Mejor respuesta de la IA: "Según el sitio oficial de Slack (slack.com/pricing), el plan Pro es USD $12.50 por usuario al mes, facturado anualmente."

Eso es radicalmente más verificable. Podés ir a slack.com/pricing y confirmar en 10 segundos.

Estrategia 2: Verifica vos mismo lo crítico

Estrategia 3: Si es muy importante, pregunta a dos IAs

Le preguntas lo mismo a Claude y a ChatGPT. Si ambos dan el mismo número con la misma fuente, es probablemente real. Si dan números diferentes, sabes que tenés que verificar vos mismo.

Estrategia 4: Usa la IA para acotar el rango, no para la respuesta final

En lugar de preguntarle "¿Cuántos trabajadores remota hay en Argentina?", preguntale:

"¿Cuál es el rango probable de trabajadores remotos en Argentina? Dame un rango (100k-500k, 500k-1M, 1M-5M) y luego te muestro dónde verificar."

Esto reduce el riesgo. Un rango es más difícil de alucinar. Y luego vos verificas el rango con datos reales.

—

POR QUÉ ESTA PASANDO ESTO (Y NO ES CULPA DE NADIE)

La realidad técnica: los modelos de lenguaje funcionan con matemática estadística, no con búsqueda de información. No "saben" los datos. Predicen qué palabra viene después basada en patrones.

Es como si le pidieras a alguien que escriba una novela basada en patrones de literatura que leyó. Puede escribir algo que parece real, pero los detalles específicos pueden ser inventados.

Esto no es un error del modelo. Es arquitectura. Es cómo funcionan estas herramientas.

—

LA VERDAD INCÓMODA

Trabajar con IA significan:

Aprovechá lo que hace bien (escritura, análisis, estructuración, brainstorming)
Verificá lo crítico (datos, números, leyes, referencias)
Nunca confíes ciegamente en un número importante

Eso es todo.

¿Es complicado? No. Es responsabilidad. Como revisar dos veces un email antes de mandarlo, o como leer un acuerdo antes de firmarlo.

La IA que alucina no es una IA rota. Es una IA que requiere contexto humano para decisiones críticas. Y eso no es debilidad. Es exactamente cómo debería funcionar.

¿La solución? Usar la IA de forma inteligente. Confiar en ella para el trabajo creativo y de análisis. Verificar siempre lo crítico. Simple.

Cuando trabajás así, la IA es increíblemente potente sin riesgo.

La alucinación en modelos de lenguaje es un fenómeno bien documentado que emerge de la arquitectura transformer y tiene raíces en cómo estos modelos operan: predicción estadística de tokens sin acceso a memoria externa o bases de datos verificables. Entender el mecanismo es crítico para construir workflows que mitigan el riesgo de forma estratégica.

---

MECANISMO SUBYACENTE

Los modelos generativos de lenguaje operan mediante predicción autorregulatoria: cada token se genera basado en la distribución de probabilidad sobre el siguiente token, condicionada en el contexto (tokens anteriores). La función de pérdida durante el entrenamiento optimiza para predicción de siguiente token, no para "corrección fáctica".

Esto genera una asimetría crítica:

El modelo es excelente en: - Capturar patrones sintácticos y semánticos - Generar texto estadísticamente plausible - Aproximar distribuciones de lenguaje

El modelo NO puede: - Acceder a bases de datos externas durante inference - Verificar afirmaciones contra hechos del mundo - Distinguir entre "patrón visto en training" vs. "hecho real"

Cuando el modelo ve la construcción "El estudio de [Autor] (20XX) mostró que [hallazgo]...", el patrón lingüístico es tan sólido que genera tokens que encajan en ese patrón. Esto produce una alucinación: un estudio que suena real pero no existe.

---

TIPOLOGÍA DE ALUCINACIONES

Tipo 1: Alucinación fáctica (high risk) - Generación de datos que parecen reales pero no existen - Ejemplos: estadísticas, precios, dates, nombres de personas, títulos de publicaciones - Severidad: CRÍTICA si se usan en decisiones

Tipo 2: Alucinación contextual (medium risk) - Información parcialmente correcta pero con detalles inventados - Ejemplos: "La ley X dice..." cuando la ley existe pero el detalle no - Severidad: ALTA si se usan en contextos regulatorios/legales

Tipo 3: Alucinación de referencia (medium-high risk) - Citas exactas que son incorrectas o fabricadas - Ejemplos: "Como Einstein dijo, 'X'" donde Einstein nunca lo dijo - Severidad: ALTA si credibilidad depende de la referencia

Tipo 4: Alucinación lógica (low risk) - Inferencias que parecen válidas pero usan premisas débiles - Ejemplos: "Dado que A es verdad, entonces B es verdad" donde la lógica tiene gaps - Severidad: MEDIA en análisis, BAJO en brainstorming

---

FACTORES QUE AMPLIFICAN ALUCINACIONES

Falta de fuentes en training data → Si el modelo no vio el dato durante training, va a alucinar
Ambigüedad en la pregunta → "¿Cuál es el presupuesto típico?" (típico de quién, cuándo, dónde?) amplia el espacio de posibles alucinaciones
Presión de "responder algo" → El modelo siempre genera tokens. Si no sabe, igual genera algo plausible
Distribución sesgada en training → Si el training data tenía patrones sesgados, el modelo reproduce sesgos como hechos

---

MITIGACIÓN ESTRATÉGICA

Nivel 1: Separación por criticidad

Zona Verde (bajo riesgo de alucinación): - Generación de contenido (emails, blog posts, documentos) - Análisis conceptual (explicaciones, breakdowns) - Ideación y brainstorming - Mejora de texto existente

→ Uso directo es apropiado

Zona Amarilla (riesgo moderado): - Síntesis de documentos técnicos - Explicación de procesos complejos - Análisis de datos proporcionados por el usuario

→ Requiere validación spot-check

Zona Roja (alto riesgo): - Datos cuantitativos sin fuente - Afirmaciones fácticas sobre números, precios, dates - Referencias bibliográficas exactas - Información regulatoria/legal

→ Requiere verificación exhaustiva

---

Nivel 2: Arquitectura de prompts que reduce alucinación

Técnica 1: Grounding en fuentes

``` MALO: "¿Cuántos empleados tiene Slack?"

MEJOR: "Busca en el sitio de Slack (slack.com) cuántos empleados tiene. Devuelveé: número + fuente exacta del sitio." ```

Por qué funciona: Le estás diciendo explícitamente dónde buscar.

Técnica 2: Desagregación de confianza

``` MALO: "Dame un resumen de las inversiones en IA en 2024"

MEJOR: "Dame un resumen de las inversiones en IA en 2024. Para cada dato: - Si es del documento que proporcioné, marcalo como [DOCUMENT] - Si es patrón general que probablemente sea correcto, marcalo como [LIKELY] - Si no sabés y estás generando, marcalo como [GENERATED]" ```

Por qué funciona: Fuerza la transparencia. Ves qué datos son verificables vs. alucinados.

Técnica 3: Límites explícitos de certeza

``` MALO: "¿Cuánto cuesta desarrollar una app?"

MEJOR: "¿Cuál es el rango típico de costos para desarrollar una app mobile? Dame: rango bajo / rango alto / variables que lo afectan. Explicitá tu confianza: alta (basada en datos) vs. baja (generalización)." ```

Por qué funciona: Un rango es más fácil de verificar que un número puntual. Explicitás la confianza.

---

Nivel 3: Verificación post-generación

Test 1: Búsqueda directa Toma el output crítico (número, cita, referencia) y búscalo en Google. Si no aparece, es probablemente alucinado.

Test 2: Contraposición con múltiples fuentes Si el dato es importante, búscalo en 2-3 fuentes independientes. Concordancia = confianza.

Test 3: Sensibilidad de mercado Si un precio o número te parece "raro" comparado con tu conocimiento del mercado, verifica. A veces la alucinación es detectable por implausibilidad.

Test 4: Formato de afirmación Las alucinaciones tienden a ser demasiado específicas (USD $4.237 en lugar de "$4-5K aproximadamente"). Eso es un signal.

---

IMPLICANCIAS OPERACIONALES

Para organismos que escalan IA:

Establecé capas de verificación por zona de riesgo (Verde/Amarilla/Roja)
Documentá qué es verificable y qué no en cada workflow
Entrená equipos en detección de alucinaciones plausibles (datos muy específicos, referencias sin contexto, estadísticas aisladas)
Usá IA en "draft" mode para Zona Roja, no en "source of truth" mode

---

OBSERVACIÓN FINAL

La alucinación no es error del modelo. Es propiedad matemática de cómo funcionan los transformers. Un modelo que "alucinaba" menos sería un modelo que generaba texto menos fluido.

La solución no es "esperar un modelo perfecto". Es arquitecturar workflows que asumen alucinación como parámetro del sistema y mitigan en consecuencia.

Cuando trabajás dentro de esos límites, la productividad que ganas es 10X sin sacrificar rigor. Ahí está el verdadero valor.

¿QUÉ ES UNA ALUCINACIÓN?

¿EN QUÉ TEMAS ALUCINA MÁS?

CÓMO VERIFICAR SIN VOLVERSE LOCO

POR QUÉ ESTA PASANDO ESTO (Y NO ES CULPA DE NADIE)

LA VERDAD INCÓMODA

¿Querés profundizar en algo del artículo?