Lección 4, Tema 3

En Progreso

← Anterior

1.2.3 Alucinaciones: el Talón de Aquiles de los LLMs

Progreso del Lección

0% Completado

Tema 1.2.3 · Módulo 1 — Fundamentos de IA

Alucinaciones: el Talón de Aquiles de los LLMs

Las alucinaciones ocurren cuando un LLM genera información que parece real, coherente y bien redactada, pero es factualmente incorrecta. No es que el modelo “mienta”: simplemente calcula la continuación más probable sin verificar la verdad.

Es el fenómeno más importante que debes entender como usuario profesional de IA. Quien no conoce las alucinaciones toma decisiones basadas en datos falsos presentados con total seguridad.

⚠️ Alerta crítica para usuarios profesionales

El modelo no sabe que no sabe.
Y eso lo hace más peligroso que si simplemente dijera “no sé”.

Un LLM que alucina no genera respuestas vacías o confusas. Genera respuestas completamente coherentes, bien escritas, con tono de autoridad — que son factualmente incorrectas. La confianza con la que responde es independiente de si la información es verdadera o falsa.

🔬

⚡ Dato de Impacto — Estudio Stanford 2023

Los LLMs producen información incorrecta en hasta el 27% de las respuestas médicas detalladas

Un estudio de la Universidad de Stanford analizó miles de respuestas de modelos de lenguaje en contextos médicos. Encontró que en preguntas de alta especificidad —dosis de medicamentos, interacciones farmacológicas, protocolos clínicos— los modelos erraban hasta en 1 de cada 4 respuestas, siempre con el mismo tono de confianza.

Esto no significa que los LLMs sean inútiles en medicina. Significa que nunca deben ser la fuente final en decisiones críticas sin verificación con fuentes primarias.

Respuestas médicas incorrectas (alta especificidad)hasta 27%

Alucinaciones en preguntas factuales generales~15%

Citas y referencias bibliográficas inventadashasta 40%

Reducción con grounding (NotebookLM, Perplexity)~80% menos

🧠 ¿Por qué alucinan los LLMs? Las 4 causas raíz

Analogía: Imagina a alguien que ha leído toda la biblioteca del mundo pero tiene que responder en tiempo real sin poder consultar nada. Cuando no sabe algo, su cerebro “completa el patrón” con lo que suena más probable según todo lo que leyó. Eso es exactamente lo que hace un LLM: maximiza la coherencia, no la veracidad.

🎯 Optimización de coherencia, no verdad

El modelo fue entrenado para predecir el siguiente token más probable, no para verificar si lo que dice es verdad. La coherencia lingüística y la veracidad factual son objetivos distintos — y el LLM solo optimiza el primero.

📅 Datos de entrenamiento incompletos

El corpus de entrenamiento no es perfecto ni completo. Algunos temas están subrepresentados (nichos técnicos, culturas minoritarias, idiomas pequeños). En esos vacíos, el modelo “rellena” con patrones de áreas relacionadas que sí conoce bien.

🔗 Correlaciones falsas aprendidas

Si en los datos de entrenamiento A aparece frecuentemente cerca de B, el modelo aprende esa asociación aunque no exista causalidad real. Puede confundir correlación estadística con relación factual.

🪞 “Sycophancy” — Querer complacer

El RLHF entrenó al modelo para generar respuestas que los humanos califican como “buenas”. A veces, los humanos prefieren respuestas confiadas y completas sobre respuestas honestas pero inciertas. El modelo aprendió que decir “no sé” obtiene peor calificación que inventar algo plausible.

🔬 Los 5 tipos de alucinación que debes reconocer

📚

Tipo 1: Citas y referencias inventadas

El más peligroso en contextos académicos y profesionales

❌ Alucinación real

“Según el estudio de García et al. (2021) publicado en Nature Medicine, el 73% de los pacientes…”

— Este estudio no existe. La revista, los autores y el porcentaje son inventados.

✅ Cómo detectarlo

Busca la cita en Google Scholar o PubMed antes de usarla. Si el DOI no existe o los autores no aparecen: es una alucinación. Pídele siempre que te dé el DOI exacto y verifícalo.

📅

Tipo 2: Fechas y datos históricos incorrectos

Mezcla eventos reales con fechas o detalles equivocados

❌ Alucinación real

“Apple fue fundada en 1977 por Steve Jobs y Bill Gates…”

— Apple fue fundada en 1976. Bill Gates co-fundó Microsoft, no Apple.

✅ Cómo detectarlo

Para datos históricos específicos —fechas exactas, fundadores, cifras— siempre verifica con Wikipedia o fuentes primarias. El modelo mezcla detalles de entidades similares.

🧑

Tipo 3: Personas reales con atributos falsos

Combina información real de una persona con detalles de otra

❌ Alucinación real

“Elon Musk publicó en 2019 un paper sobre física cuántica en colaboración con el MIT titulado…”

— Este paper no existe. El nombre y la persona son reales; el logro es inventado.

✅ Cómo detectarlo

Cualquier logro específico, publicación o declaración atribuida a una persona real necesita verificarse en fuentes directas. El modelo sabe quién es alguien pero puede inventar lo que hicieron.

⚖️

Tipo 4: Leyes, normas y regulaciones incorrectas

Especialmente peligroso en contextos legales, fiscales y laborales

❌ Alucinación real

“Según el Artículo 47 de la Ley Federal del Trabajo de México, los trabajadores tienen derecho a…”

— El artículo existe pero el contenido citado puede ser incorrecto o desactualizado.

✅ Cómo detectarlo

Nunca uses información legal, fiscal o normativa de un LLM sin verificar en el texto oficial de la ley. Pide siempre el artículo exacto y consúltalo en la fuente oficial del gobierno.

🔢

Tipo 5: Estadísticas y porcentajes inventados

El modelo “redondea” o inventa cifras que suenan creíbles

❌ Alucinación real

“El 68% de las empresas mexicanas adoptaron IA en 2023, según el INEGI…”

— Cifra inventada. El INEGI no publica ese dato específico. El porcentaje suena creíble pero no existe.

✅ Cómo detectarlo

Cualquier estadística con porcentaje exacto y fuente nombrada debe verificarse en el sitio oficial de esa fuente. Pídele al modelo que confirme el URL exacto del reporte — si no puede, es una alucinación.

🗑️ Regla GIGO: Garbage In, Garbage Out

❌ Prompts que provocan alucinaciones

Prompt vago

“Dame información sobre marketing”

Pide datos que el modelo no tiene

“¿Cuál fue la tasa de conversión de mi competidor en Q3 2024?”

Presiona al modelo a adivinar

“Dame el nombre exacto del CEO de esa empresa que te mencioné antes”

Pide citas sin verificación

“Dame 5 estudios científicos que prueben que X es verdad”

✅ Prompts que reducen alucinaciones

Prompt específico

“Dame 3 estrategias de marketing digital para una pyme B2B en México con presupuesto menor a $5,000 MXN mensuales”

Reconoce sus límites

“¿Tienes información verificable sobre X o debo buscarlo en otra fuente?”

Pide honestidad explícita

“Si no sabes la respuesta con certeza, dímelo claramente en lugar de estimarla”

Pide fuentes verificables

“Solo dame estudios si puedes confirmar el DOI o URL exacto”

🔍 Señales de alerta: cómo detectar una alucinación en tiempo real

🔢

Datos muy específicos sin fuente

Porcentajes exactos, fechas precisas o estadísticas detalladas presentadas sin citar de dónde vienen. Cuanto más específico, más sospechoso.

📖

Citas con formato perfecto

Un paper con autores, revista, año y volumen perfectamente formateado no garantiza que exista. El modelo aprendió el formato de las citas, no los contenidos reales.

🎯

Respuesta demasiado perfecta

Si la respuesta parece responder exactamente lo que querías con datos que encajan demasiado bien con tu hipótesis, desconfía. El modelo detecta lo que quieres escuchar.

🌍

Información muy local o reciente

Datos sobre mercados locales específicos, regulaciones de países pequeños o eventos recientes son áreas donde el entrenamiento es más escaso y las alucinaciones más frecuentes.

🔄

Inconsistencia entre preguntas

Pregunta lo mismo de dos maneras diferentes en la misma sesión. Si el modelo da datos contradictorios, ninguno de los dos puede ser confiable sin verificación externa.

🤷

Nunca dice “no sé”

Un modelo que siempre tiene respuesta para todo —sin nunca expresar incertidumbre— está alucinando en algún punto. La incertidumbre honesta es señal de confiabilidad.

🛡️ Protocolo anti-alucinaciones para uso profesional

Pide incertidumbre explícita desde el prompt

Incluye en tus instrucciones: “Si no estás seguro de algún dato, indícalo claramente con ‘[sin verificar]’ en lugar de presentarlo como hecho”. Esto activa un modo más honesto en el modelo.

Usa datos críticos solo como punto de partida

Trata toda información específica del LLM como una hipótesis a verificar, no como un hecho establecido. El modelo es excelente para darte la dirección correcta de búsqueda; la fuente primaria la confirmas tú.

Separa tareas creativas de tareas factuales

Para redacción, ideas, estructura, análisis de documentos que tú proporcionas: confía en el modelo. Para fechas, estadísticas, citas, leyes, nombres específicos: verifica siempre con fuente primaria.

Usa grounding para tareas críticas

Cuando los hechos importan: usa Perplexity (busca en internet en tiempo real), NotebookLM (solo responde con tus documentos) o ChatGPT con búsqueda activa. Estas herramientas anclan las respuestas a fuentes verificables.

Contrainterroga al modelo sobre sus propias respuestas

Después de una respuesta con datos específicos, pregunta: “¿Puedes confirmar la fuente exacta de cada estadística que mencionaste?” o “¿Qué tan seguro estás de estos datos?”. El modelo suele reconocer su incertidumbre cuando se le pregunta directamente.

⚖️ ¿Cuándo confiar en el modelo y cuándo verificar?

✅ Puedes confiar sin verificar

Redactar, editar y mejorar textos que tú revisarás
Generar ideas, lluvia de conceptos, estructuras
Analizar documentos que tú mismo le proporcionas
Explicar conceptos generales de tu industria
Escribir código (pero pruébalo antes de usar en producción)
Resumir textos que tú ya conoces y puedes validar
Crear plantillas, formatos y estructuras de documentos
Practicar idiomas o preparar presentaciones

❌ Siempre verifica con fuente primaria

Estadísticas, porcentajes y cifras específicas
Citas bibliográficas, autores y años de publicación
Artículos, papers o estudios científicos
Fechas históricas exactas de eventos específicos
Leyes, artículos, normas y regulaciones
Datos médicos, dosis o protocolos clínicos
Información financiera actualizada o cotizaciones
Declaraciones o logros atribuidos a personas reales

🛠️ Herramientas que reducen alucinaciones hasta en un 80%

🔍

Perplexity AI

Busca en internet antes de responder. Cada dato viene con su fuente citada y verificable. Ideal para información actual, noticias y estadísticas recientes.

📚

Google NotebookLM

Solo responde con base en los documentos que tú subes. Si el dato no está en tus archivos, no lo inventa. Cita el párrafo exacto de la fuente.

💬

ChatGPT + Búsqueda web

Con el plugin de búsqueda activo, ancla sus respuestas a resultados reales de internet. Reduce significativamente alucinaciones sobre hechos verificables.

🎓

Perplexity Modo Academic

Restringe las fuentes a publicaciones académicas revisadas por pares. Para investigación seria con citas verificables y DOI real.

⚖️

Caso real — Las alucinaciones en el mundo legal

Un abogado de Nueva York fue multado por presentar citas inventadas por ChatGPT ante un tribunal federal

En 2023, el abogado Steven Schwartz presentó un escrito legal citando seis casos judiciales que no existían. ChatGPT los había inventado con nombres de jueces, números de caso y extractos de sentencias perfectamente formateados. El juez lo descubrió al intentar buscar los casos.

El resultado: una multa de $5,000 dólares, vergüenza pública y un precedente legal sobre el uso de IA en contextos profesionales. Su defensa fue que no sabía que ChatGPT podía inventar cosas. Ahora tú sí lo sabes.

🎯 Lo que debes recordar de este tema

🌀

El modelo no miente

Predice lo más probable, no lo más verdadero. La coherencia y la veracidad son objetivos diferentes.

😰

La confianza no es señal de verdad

El modelo responde con el mismo tono seguro cuando acierta y cuando se equivoca. La seguridad no es verificación.

🗑️

GIGO — Calidad de entrada = calidad de salida

Prompts vagos o que piden datos que el modelo no puede tener producen más alucinaciones.

⚓

Grounding como solución

Perplexity y NotebookLM anclan las respuestas a fuentes reales. Úsalos cuando los hechos importan.

✅

Creatividad sí, hechos no

Confía en el modelo para crear, estructurar y editar. Verifica siempre estadísticas, citas, leyes y fechas.

🛡️

El protocolo te protege

Pide incertidumbre explícita, contrainterroga los datos y usa siempre fuentes primarias en decisiones críticas.

⚠️ DATO DE IMPACTO Un estudio de Stanford (2023) encontró que los LLMs producen información incorrecta en hasta el 27% de las respuestas médicas detalladas. Para tareas críticas: siempre verifica con fuentes primarias o usa herramientas ancladas como Perplexity o NotebookLM.

🎬 RECURSO MULTIMEDIA — Para insertar en WordPress
Video: «Breve explicación de los modelos extensos de lenguaje (LLM)» (3Blue1Brown) https://www.youtube.com/watch?v=LPZh9BOjkQs
Video: «TODOS los TIPOS de Inteligencias Artificiales en 5 minutos» (TICnoticos) https://www.youtube.com/watch?v=sw8LN2UaNbI

Inteligencia Artificial y Automatización Nivel 1

Bienvenida

Participantes 669

1.2.3 Alucinaciones: el Talón de Aquiles de los LLMs

Alucinaciones: el Talón de Aquiles de los LLMs

El modelo no sabe que no sabe.Y eso lo hace más peligroso que si simplemente dijera “no sé”.

Los LLMs producen información incorrecta en hasta el 27% de las respuestas médicas detalladas

🎯 Optimización de coherencia, no verdad

📅 Datos de entrenamiento incompletos

🔗 Correlaciones falsas aprendidas

🪞 “Sycophancy” — Querer complacer

Tipo 1: Citas y referencias inventadas

❌ Alucinación real

✅ Cómo detectarlo

Tipo 2: Fechas y datos históricos incorrectos

❌ Alucinación real

✅ Cómo detectarlo

Tipo 3: Personas reales con atributos falsos

❌ Alucinación real

✅ Cómo detectarlo

Tipo 4: Leyes, normas y regulaciones incorrectas

❌ Alucinación real

✅ Cómo detectarlo

Tipo 5: Estadísticas y porcentajes inventados

❌ Alucinación real

✅ Cómo detectarlo

❌ Prompts que provocan alucinaciones

✅ Prompts que reducen alucinaciones

Datos muy específicos sin fuente

Citas con formato perfecto

Respuesta demasiado perfecta

Información muy local o reciente

Inconsistencia entre preguntas

Nunca dice “no sé”

Pide incertidumbre explícita desde el prompt

Usa datos críticos solo como punto de partida

Separa tareas creativas de tareas factuales

Usa grounding para tareas críticas

Contrainterroga al modelo sobre sus propias respuestas

✅ Puedes confiar sin verificar

❌ Siempre verifica con fuente primaria

Perplexity AI

Google NotebookLM

ChatGPT + Búsqueda web

Perplexity Modo Academic

Un abogado de Nueva York fue multado por presentar citas inventadas por ChatGPT ante un tribunal federal

🎯 Lo que debes recordar de este tema

El modelo no miente

La confianza no es señal de verdad

GIGO — Calidad de entrada = calidad de salida

Grounding como solución

Creatividad sí, hechos no

El protocolo te protege

El modelo no sabe que no sabe.
Y eso lo hace más peligroso que si simplemente dijera “no sé”.