Volver a Programa

Inteligencia Artificial y Automatización Nivel 1

0% Completado
0/0 Pasos
  1. Bienvenida

    Bienvenida al Nivel 1 IA Generativa y Productividad Automatizada
    2 Temas
  2. Módulo 1: Fundamentos de Inteligencia Artificial
    Introducción al Módulo 1: Tu punto de partida en la IA
    2 Temas
  3. 1.1 Conocer y dominar los mejores chatbots del momento
    4 Temas
  4. 1.2 Generar contenido escrito y documentos de calidad
    4 Temas
  5. 1.3 Hacer investigación profunda en minutos
    2 Temas
  6. 1.4 Navegar como experto en cada plataforma
    1 Tema
  7. 1.5 Crear prompts efectivos que te den exactamente lo que necesitas
    2 Temas
  8. 1.6 Generar ideas y soluciones para cualquier desafío de tu negocio
    2 Temas
  9. Cuestionario: Fundamentos de Inteligencia Artificial
    1 Cuestionario
  10. Módulo 2: Creación de Contenido Audiovisual con IA
    Introducción al Modulo 2: Crea contenido profesional sin agencia ni camarógrafo
    1 Tema
  11. 2.1 Crear imágenes profesionales para tu trabajo o negocio
    5 Temas
  12. 2.2 Generar videos promocionales sin cámara ni experiencia en edición
    3 Temas
  13. 2.3 Producir audio y locuciones en diferentes voces e idiomas
    3 Temas
  14. 2.4 Diseñar presentaciones impactantes que compitan con agencias creativas
    2 Temas
  15. 2.5 Crear contenido para redes sociales de forma consistente y atractiva
  16. 2.6 Transformar texto en material visual llamativo y profesional
    2 Temas
  17. Cuestionario: Módulo 2 - Creación Audiovisual con IA
    1 Cuestionario
  18. Módulo 3: Agentes de IA como Usuario
    Introducción al Modulo 3: De usuario a orquestador de agentes
    1 Tema
  19. 3.1 Qué es un agente de IA y cómo se diferencia de un chatbot tradicional: entiende el concepto antes de usarlos
  20. 3.2 GPTs de ChatGPT o Gems de Gemini: crea tu propio asistente especializado en minutos usando la interfaz de OpenA
  21. 3.3 Agentes para crear interfaces y aplicaciones: usa Lovable, v0 y Bolt para generar páginas web y apps con sólo describirlas
  22. 3.4 Navegadores con IA: delega búsquedas y tareas web a Operator de OpenAI y los agentes de Perplexity
    8 Temas
  23. 3.5 Asistentes de código para no programadores: usa Cursor y GitHub Copilot para modificar código aunque no sepas programar
  24. 3.6 Identificar qué tareas de tu trabajo puedes delegar hoy a agentes que ya existen en el mercado
    3 Temas
  25. Cuestionario: Módulo 3 - Agentes de IA como Usuario
    1 Cuestionario
  26. Módulo 4: Automatización Básica
    Introducción al Módulo 4: De ejecutor de tareas a arquitecto de sistemas
    1 Tema
  27. 4.1 Qué es la automatización y cómo identificar procesos en tu día a día que puedes automatizar sin conocimientos técnicos
    3 Temas
  28. 4.2 Introducción a plataformas no-code: conoce Make, Zapier y n8n, sus diferencias y cual elegir según tu caso
    1 Tema
  29. 4.3 Crear tu primer flujo automatizado: conecta dos aplicaciones paso a paso y ponlo a funcionar en minutos
    2 Temas
  30. 4.4 Automatizaciones simples para el día a día: respuestas automáticas de email, notificaciones, respaldos de archivos y sincronización de datos
    4 Temas
  31. 4.5 Templates y flujos prediseñados: aprovecha automatizaciones ya creadas y adáptalas a tu negocio sin empezar de cero
    4 Temas
  32. Cuestionario: Módulo 4 - Automatización Básica
    1 Cuestionario
  33. Módulo 5:· Vibe Coding Básico y Análisis de Datos
    Introducción al Módulo 5: Cuando el lenguaje natural se convierte en software
    1 Tema
  34. 5.1 Qué es vibe coding: el nuevo paradigma de programar describiendo lo que quieres en lenguaje natural
  35. 5.2 Crear dashboards básicos con prompts: visualiza tus datos de ventas, clientes o métricas sin saber Excel avanzado ni programación
  36. 5.3 Generar aplicaciones simples con Lovable, v0 y Bolt: desde landing pages hasta herramientas internas básicas para tu negocio
  37. 5.4 Conectar fuentes de datos y visualizarlas: importa información de Google Sheets, bases de datos o APIs y convierte en gráficas útiles
    3 Temas
  38. 5.5 Análisis de datos conversacional: sube archivos a ChatGPT o Claude y hazles preguntas sobre tendencias, patrones y oportunidades
  39. 5.6 Límites del vibe coding: entiende que puedes lograr con estas herramientas y cuando necesitas desarrollo profesional o el Nivel 2
  40. Cuestionario: Módulo 5 - Vibe Coding y Análisis de Datos
    1 Cuestionario
Progreso del Lección
0% Completado
1.2.2 Tokenización y Ventana de Contexto
Tema 1.2.2 · Módulo 1 — Fundamentos de IA

Tokenización y Ventana de Contexto

Los LLMs no leen palabras: leen tokens —fragmentos de texto que pueden ser palabras completas, partes de palabras o incluso signos de puntuación. Todo lo que entra en una conversación —tu pregunta, el historial y las instrucciones del sistema— ocupa espacio en la ventana de contexto.

Cuando esa ventana se llena, el modelo «olvida» lo más antiguo. Entender este mecanismo cambia radicalmente cómo estructuras tus conversaciones con la IA.

El modelo nunca “lee” tu texto.
Lo convierte en números y procesa vectores matemáticos.

Detrás de cada conversación con ChatGPT o Claude hay un proceso invisible: tu texto se fragmenta en tokens, cada token se convierte en un ID numérico, ese ID se transforma en un vector de cientos de dimensiones, y solo entonces el modelo puede procesarlo. Todo ocurre en milisegundos.

⚙️ El proceso completo: De tu texto al modelo — 3 pasos
Fase 1

Frase en Texto

Tu mensaje llega como texto plano. El tokenizador lo separa en palabras y fragmentos.

La inteli gencia artific ial es increíble
Fase 2

División en Tokens → IDs

Cada token se asocia a un número único en el vocabulario del modelo (50,000+ tokens).

2324 57388 11205 1215 518 323 24323
Fase 3

Vectores → Procesamiento

Cada ID se convierte en un vector de 768–4096 dimensiones. Ahí vive el “significado” matemático.

[0.23, -0.87, 1.42…] [1.05, 0.33, -0.61…] [0.78, -1.20, 0.94…]
🔍 Cómo tokeniza el modelo — Ejemplos reales

Regla clave: Las palabras largas o poco comunes se dividen en subpalabras. Las palabras cortas y comunes suelen ser un solo token. El español consume más tokens que el inglés porque sus palabras son más largas — esto afecta directamente el costo y la velocidad.

📝 Frase simple en español
La#2324
intel#57388
igencia#11205
artific#1215
ial#518
es#323
increíble#24323
7 tokens

⚠️ “Inteligencia” se divide en 2 tokens. “Artificial” en 2. Así el modelo maneja palabras poco comunes en su vocabulario.

🇬🇧 La misma frase en inglés (referencia)
Artificial#3116
intelligence#4454
is#318
incredible#6909
4 tokens

✅ La misma idea en inglés: solo 4 tokens. En español necesitamos 7. El español cuesta ~30-40% más tokens por la misma cantidad de contenido.

💻 Código fuente (muy eficiente)
def#4299
calcular#2871
(#7
x#87
):#1058
5 tokens

🔑 El código consume tokens de forma diferente: los operadores y puntuación son tokens propios. Por eso los modelos de código se entrenan con vocabularios especiales.

🔢 Números y fechas (sorpresa)
2024#7342
#12
11#1157
#12
30#966
5 tokens

⚠️ Los números grandes se tokenizan dígito a dígito o en grupos pequeños. Esto explica por qué los LLMs cometen errores en aritmética: ¡procesan los números como texto fragmentado, no como valores!

🪟 La Ventana de Contexto — La “memoria de trabajo” del modelo

Analogía: Imagina que el modelo es un chef que trabaja en una mesa de cocina con tamaño fijo. Todo lo que necesita para preparar el platillo debe caber en esa mesa: la receta (instrucciones del sistema), los ingredientes que ya usó (historial) y la orden actual (tu pregunta). Cuando la mesa se llena, tiene que quitar algo para poner lo nuevo. Lo que quita es lo más viejo.

¿Qué ocupa espacio en la ventana?

⚙️

System Prompt

Las instrucciones del sistema (tu rol, reglas, contexto de empresa). Siempre ocupan espacio desde el inicio.

💬

Historial de mensajes

Todos los mensajes anteriores de la conversación, tanto los tuyos como las respuestas del modelo.

✍️

Tu pregunta actual

El mensaje que acabas de escribir, incluyendo cualquier archivo, imagen o documento que adjuntes.

📄

Documentos adjuntos

PDFs, imágenes, código o textos que subes al chat. Un PDF de 50 páginas puede consumir 25,000+ tokens.

📊 Visualización de la ventana de contexto en uso real
Conversación de 30 minutos — Claude (200K tokens) ~68% usado
SYS
HISTORIAL
TU PREGUNTA
LIBRE
System prompt (~16K tokens)
Historial (~90K tokens)
Prompt actual (~30K tokens)
Espacio libre (~64K tokens)

Ventana de contexto por modelo

GPT-4o
128K tokens

≈ 300 páginas de texto

Claude 3.5
200K tokens

≈ 500 páginas · El mejor para documentos largos

DeepSeek R1
128K tokens

≈ 300 páginas de texto

Gemini 1.5 Pro
1M tokens

≈ 2,500 páginas · Para proyectos de código completos

Gemini 1.5 Flash
2M tokens

≈ 5,000 páginas · Mayor ventana disponible hoy

Concepto clave: Grounding (Anclaje)

Técnica que conecta la IA a fuentes externas reales —internet, documentos, bases de datos— para reducir errores y alucinaciones. En lugar de depender solo de lo que “aprendió” durante el entrenamiento, el modelo puede consultar información actual y verificable en tiempo real.

🔍 Grounding con búsqueda web

Perplexity, Gemini y ChatGPT con búsqueda activa: el modelo busca en internet antes de responder. Ideal para información actual, noticias y datos que cambian frecuentemente.

📄 Grounding con documentos propios

NotebookLM lo lleva al extremo: solo responde con base en los documentos que tú subes. Si la información no está en tus archivos, no la inventa. Ideal para contratos, manuales y reportes internos.

🗄️ Grounding con bases de datos

Conectar el modelo a tu CRM, ERP o base de datos interna mediante APIs. El modelo consulta datos reales y actualizados de tu empresa para responder con precisión.

🧠 RAG — Retrieval Augmented Generation

Técnica avanzada donde un sistema busca los fragmentos más relevantes de una base de conocimiento y los inyecta en el contexto del modelo antes de generar la respuesta.

💡 5 consejos para gestionar tokens y contexto como experto
1

Pon lo más importante al principio Y al final

Los LLMs tienen una tendencia conocida como “sesgo posicional”: prestan más atención al inicio y al final del contexto. Si tienes instrucciones críticas, repítelas al final del prompt además de al inicio.

2

Inicia conversación nueva cuando cambies de tema

Una conversación larga acumula tokens. Si cambias de proyecto o tema, empieza un chat nuevo. El historial irrelevante no ayuda al modelo —lo distrae y consume espacio de contexto valioso.

3

Pide resúmenes para “comprimir” conversaciones largas

Cuando sientas que la conversación es larga, pide al modelo: “Resume los acuerdos y conclusiones de esta conversación en un párrafo”. Copia ese resumen y pégalo en un chat nuevo como contexto inicial. Liberas tokens sin perder información.

4

Sé selectivo con lo que adjuntas

Un PDF de 100 páginas puede consumir 50,000+ tokens de tu ventana de contexto. Si solo necesitas una sección, copia y pega solo esa parte. Usa NotebookLM para documentos extensos que necesitas consultar frecuentemente.

5

Usa “contexto maestro” para sesiones de trabajo

Crea un bloque de texto con todo lo que el modelo necesita saber sobre ti o tu empresa: nombre, industria, tono de comunicación, proyectos activos. Pégalo al inicio de cada sesión importante en lugar de explicarlo cada vez.

📐
Dato que cambia la perspectiva

La ventana de contexto de Gemini 1.5 Flash podría contener toda la saga de Harry Potter… 3 veces

La saga completa de Harry Potter tiene aproximadamente 1,084,170 palabras. Con 2 millones de tokens, Gemini 1.5 Flash podría procesar simultáneamente esas 7 novelas unas 3 veces completas en un solo contexto.

Para referencia: GPT-3 (2020) tenía solo 4,096 tokens de contexto. En 4 años, la ventana de contexto creció 500 veces. Esto no es un detalle técnico menor: es lo que hace posible analizar contratos completos, bases de código enteras o transcripciones de reuniones en un solo prompt.

🎯 Lo que debes recordar de este tema

🔤

Token ≠ palabra

Los tokens son fragmentos variables. El español consume más tokens que el inglés para el mismo contenido.

🔢

Todo es matemática

Tu texto → tokens → IDs numéricos → vectores de alta dimensión. El modelo nunca procesa letras.

🪟

La ventana tiene límite

Todo en la conversación ocupa espacio. Cuando se llena, el modelo olvida lo más antiguo.

Grounding reduce errores

Conectar el modelo a fuentes reales (web, documentos, BD) elimina alucinaciones sobre hechos verificables.

💸

Los tokens tienen costo

En APIs de producción se paga por token. Gestionar el contexto eficientemente reduce costos significativamente.

🧮

Por eso falla en matemáticas

Los números se tokenizan como texto. El modelo predice dígitos, no calcula. Por eso necesita Code Interpreter.