Cómo pasamos de herramientas a agentes
La historia de tecnología tiene patrones. Cada generación de herramientas necesita una generación de usuarios que sepa cómo usarla bien.
Los primeros usuarios de email perdían tiempo escribiendo. Los últimos usuarios de fax perdían tiempo esperando. El mercado laboral se reorganiza alrededor del equipo más eficiente.
Estamos en ese punto exacto con IA.
Hace 6 meses, "usar IA" significaba: escribís en ChatGPT, esperas respuesta. Es un chatbot pasivo.
Hoy, significa cada vez más: la IA actúa por vos. Es un agente activo.
Agentes: máquinas que hacen cosas
El avance más importante de 2024-2025 en IA no es que escriba mejor. Es que puede tomar acciones en tu nombre, supervisadas.
Ejemplos reales (disponibles hoy, abril 2026):
- Búsqueda y compra autónoma:
- Análisis de datos autónomo:
- Gestión de emails en escala:
¿Cómo funciona? El agente no solo "entiende lenguaje". Ahora ve tu pantalla, mueve mouse, clickea, escribe. Es como si alguien se sentara en tu escritorio y dijera "hacé esto" y lo hiciera perfecto, sin error, sin fatiga.
Claude Computer Use (Anthropic) hace exactamente eso desde octubre 2024. OpenAI tiene Canvas. Google integra agentes en Workspace.
Implicación: Una tarea que tardaba 3 horas ahora tarda 20 minutos (5 de setup, 15 de revisión). Para una empresa de 100 personas, eso es 13 FTE (empleados full-time) de tiempo devuelto cada día.
Así de disruptivo es.
Multimodalidad: conversación sin límites de formato
Hoy, la IA es casi multimodal: – Escribís texto → IA responde texto. – Uploadás imagen → IA la describe. – Pero si querés trabajar con video + audio + imágenes + texto en una sola conversación, es frágil.
Mañana (ahora para Gemini 1.5), es fluido. Una conversación que cruza todos los formatos.
Ejemplo real (Gemini 1.5 Pro, disponible hoy):
- Mostras un video de 1 hora (taller de capacitación de tu empresa).
- Hablas: "Basándote en este video, generá un slide deck de 10 diapositivas con ideas principales."
- La IA ve el video, lo entiende, extrae ideas, genera slides. 10 minutos.
Sin IA: ves video (60 min), tomas notas (20 min), escribís slides (60 min). Total: 140 minutos.
Con IA: 10 minutos. (Y mejor estructura también).
Otro ejemplo:
- Grabas en tu teléfono: "Acabo de tener reunión con cliente potencial. Estos son los puntos clave que detecté…"
- La IA escucha, transcribe, entiende contexto, e inmediatamente: genera email de follow-up, sugiere próximos pasos, actualiza tu CRM.
- Todo automático. Vos manejás a casa sin preocuparte.
¿Dónde llega? En 2027-2028, cualquier app profesional (email, Slack, Notion, Figma) va a tener input multimodal. No va a ser "escribí, después subí imagen". Va a ser: "habla, escribi, manda video, todo junto, una sola interacción".
IA embebida: desaparición de fricción
Hoy, la cadena de trabajo típica es: 1. Abro Claude en otra tab. 2. Escribo el prompt. 3. Copio el resultado. 4. Lo pego en Word/Gmail/Canva. 5. Edito.
Son 5 pasos. Hay fricción.
Mañana, la fricción desaparece.
Microsoft 365 Copilot (hoy, pero expandiéndose): – Estás escribiendo un email en Outlook. – Clickeas un botón. – Escribís: "Redactá esto como si fuera yo, tono cercano, mencioná estos puntos." – Se reescribe. En Outlook. Sin copiar/pegar.
Google Workspace (2026): – Estás en una hoja de Sheets. – "Analiza estos datos y dame insights sobre qué región es la más rentable." – La IA genera análisis. En Sheets. Con gráficos.
Figma (ya existe): – Estás diseñando un landing page. – Clickeas un botón y dices "generá 3 variaciones de este hero section". – Genera 3. Las ves al lado.
Esto es "IA embebida". No es una herramienta. Es parte de la herramienta que ya usás.
Implicación: En 2 años, saber "usar IA" será como saber "usar autocorrector". No es que lo necesites, es que está ahí. Pero los que lo dominan trabajan 2X más rápido que los que lo ignoran.
Personalización: la IA que aprende tu contexto
Hoy, la IA es stateless. No te recuerda. Cada conversación es un reset.
Mañana, la IA es stateful. Te aprende: – Tu industria, tu rol. – Tu marca personal, tu voz de escritura. – Los proyectos en los que trabajás. – Con quién trabajás (clientes, colegas, familia). – Qué estándares de calidad tenés.
Luego, todo lo que le pedís, lo hace considerando eso.
Ejemplo hoy (Claude Projects):
- Subís: tu perfil LinkedIn, 5 artículos tuyos previos, brief de tu marca.
- La IA aprende tu voz.
- Le dices: "escribe un thread de Twitter sobre [tema]."
- Sale escrito como VOS, no como "una IA genérica".
Mañana (2027-2028): – Tu IA sabe qué hiciste hoy, qué hizo tu equipo, qué dijeron tus clientes. – No necesitás contexto cada vez. – Es como un asistente que trabajó contigo 10 años.
El debate AGI: tres escenarios
AGI = Una IA que puede hacer cualquier tarea intelectual que puede hacer un humano, al nivel de humano experto, en cualquier campo.
¿Existe hoy? No.
¿Está cerca? Depende a quién le preguntes.
- Sam Altman (OpenAI): "Posiblemente en 2-5 años."
- Demis Hassabis (DeepMind/Google): "Antes de 2050 seguro."
- Dario Amodei (Anthropic): "No sabemos. Es un problema de investigación abierto."
¿Qué pasaría si llega?
Escenario pessimista (pero no catastrofista): – La mayoría de "knowledge work" (abogado, contador, analista, programador, diseñador) se vuelve competible por IA. – El mercado laboral se comprime. Salarios bajan. Desempleo sube. – Necesita reinvención del sistema económico (UBI, reducción de jornada, otro modelo). – Transición traumática para ~500 millones de profesionales.
Escenario optimista (pero posible): – La IA abre nuevas categorías de trabajo que no podíamos imaginar. – (Como internet — eliminó algunos trabajos, pero creó más nuevos que los que eliminó.) – Las personas se especializan en "tareas que requieren juicio humano" (decisiones de alto riesgo, ética, liderazgo, creatividad genuina). – PIB global aumenta masivamente (porque productividad sube). Se reparten beneficios.
Escenario realista: – Ambos. Algunos trabajos desaparecen. Otros nacen. Hay dolor de transición. Hay ganancia neta. El mercado se transforma, como pasó con industrialización (1800s) e informatización (1980s-2000s).
¿Y si nunca llega AGI?
Entonces estamos en un mundo donde: – La IA es herramienta cada vez mejor, pero siempre requiere humanos para dirigirla. – El valor está en "saber qué pregunta hacer" más que en "hacer la tarea". – Es como hoy: los mejores abogados no son los que más leen ley. Son los que entienden qué ley es relevante para tu caso.
La conclusión práctica es la misma en todos los escenarios:
El que aprende IA ahora está mejor posicionado que el que no, pase lo que pase.
El mercado laboral 2026-2030: la carrera real
Aquí va lo que importa de verdad.
No es "la IA me reemplaza".
Es "la PERSONA que usa IA me reemplaza a mí".
Ejemplos concretos que están ocurriendo AHORA (abril 2026):
- Abogado A: 15 años experiencia, sin IA. Revisa contratos: 2 horas por contrato. 3 clientes por semana. Ingresos: $300k/año.
- Diseñadora A: 10 años, sin IA. 1 propuesta gráfica por día. 4 por semana.
- Consultor de Datos A: SQL + Python, sin IA. Análisis complejo: 1 semana.
Esto no es teoría. Es lo que ocurre en Latam, España, Argentina, en 2026.
En 2 años: – El que aprendió IA en 2024 tiene 2 años de ventaja invaluable. – El que aprende ahora (2026) empieza tarde pero puede recuperar. – El que espera 2 años más (2028) está liquidado. Todos ya saben. Sin ventaja.
Es como Excel en 1995. En 2000, tenías valor irremplazable. En 2010, era standard. En 2025, es básico.
Qué significa esto para vos
Si trabajás en algo que se pueda describir con palabras (tu tarea), entonces la IA puede hacerlo o ayudar masivamente.
Eso incluye: abogado, contador, diseñador, programador, copywriter, consultor, profesor, periodista, traductor, analista, investigador, vendedor, gerente, emprendedor.
Y si no aprendés ahora?
Estás apostando a que tu experiencia + velocidad sin IA te basta para competir contra alguien que tiene tu experiencia + velocidad 3X.
Es una apuesta riesgosa.
Hoy, usás la IA así: escribís, IA responde. Es un chatbot.
Mañana, la IA no responde: actúa.
Agentes: IA que hace cosas
Imaginá que necesitás hacer esto: 1. Buscar vuelos a Barcelona para el 20 de mayo. 2. Comparar precios en 3 sitios. 3. Revisar si hay descuentos especiales. 4. Reservar el más barato. 5. Enviarle el itinerario a tu familia por email.
Hoy, vos hacés todo eso. Te toma 1 hora mínimo.
Con un agente de IA, escribís: "reservá el vuelo más barato a Barcelona para el 20 de mayo y mandalo a la familia por email". La IA abre el navegador, clickea, busca, compara, paga, te manda confirmación. 10 minutos.
Eso es un agente.
Ya existe. Claude tiene "Computer Use" — puede ver tu pantalla, mover mouse, escribir, ejecutar cualquier tarea que vos harías en la computadora. No es ciencia ficción. Es hoy, desde octubre 2024.
IA en cada app
Hoy abris 5 apps distintos: Gmail, Word, Excel, Slack, Canva. Usás IA en una tab aparte.
Mañana, cada una tiene IA integrada.
No es "usar Claude en otra pestaña y copiar resultados". Es: dentro de Gmail, presionás un botón y escribís "respondé este email como si fuera yo, tono profesional pero cercano". La IA lo hace. Listo. No salís de Gmail.
Abris Excel. La IA sugiere: "detecto una correlación entre estos dos datos, ¿querés un gráfico?". Un click, listo.
Es como el Autocorrector, pero para todo tu trabajo.
Microsoft ya lo hace con Copilot en Office. Google con Gemini en Gmail y Docs. Apple trae IA en iOS 18. Figma tiene generación de diseño integrada.
En 2 años, cualquier app sin IA integrada se va a sentir como una app sin internet. Rara.
Multimodal: todo junto en una conversación
Hoy, trabaja con video en una cosa. Escribir en otra. Hablar en otra.
Mañana (ahora para Gemini 1.5), todo junto sin fricciones:
Grabás un video de tu producto. Lo uploadás. Escribís: "hacé un ad de 30 segundos para Instagram basado en este video". La IA lo ve, lo entiende, genera código de colores, música, pacing. Listo.
O: hablas al micrófono: "resumé este podcast de una hora y convertilo en un hilo de Twitter con 5 tweets". La IA lo escucha, entiende, transcribe, resume, escribe los tweets. Una conversación.
O: Le mostrás una foto de tu sala. Escribís: "diseñá esta sala en estilo nórdico moderno y mostrá cómo quedaría con estos muebles". Genera la imagen. En 30 segundos.
Hoy es novedoso. En 2 años es standard.
La IA que te conoce
Hoy, usás Claude cada vez sin contexto. Le contás la situación cada vez. "Soy diseñador, trabajo con cliente en ropa sustentable, quiero..."
Mañana, la IA te conoce. Sabe: - Qué hacés profesionalmente. - Tu estilo de escritura. - Tus preferencias de formato. - Proyectos en los que trabajás. - Con quién trabajás.
Le pedís algo y ya tiene contexto. No describís, solo trabajás.
Claude Projects (que existe hoy) es versión 1 de esto. Subís documentos, la IA los aprende. Luego, todo lo que preguntes, lo responde considerando esos documentos como base.
Mañana, es mucho más profundo. La IA sabe más de vos que vos de vos.
El elefante: AGI
AGI = Artificial General Intelligence. Significa: una IA que puede hacer CUALQUIER tarea intelectual que hace un humano. No una específica. Cualquiera.
Hoy no existe. Ni remotamente.
Claude es muy bueno en texto y lógica. Pero es malo en: - Creatividad genuina (inventar una idea nunca vista). - Ciencia nueva (investigar algo que nadie investigó). - Entender humor genuino (a veces sí, a veces no). - Tomar riesgo en decisiones (siempre se cuida).
¿Cuándo llega AGI?
Algunos dicen 2-5 años. Otros dicen "nunca". Anthropic (empresa de Claude) dice "al menos hasta 2050, quizá más".
Nadie lo sabe.
Pero aquí está el punto: no importa cuándo sea, importa que es posible. Y si es posible, el mundo cambia.
Si la IA puede hacer cualquier tarea intelectual: - El abogado pierde valor (IA revisa contratos mejor). - El diseñador pierde valor (IA diseña mejor). - El programador pierde valor (IA codea mejor).
Pero espera. Alguien tiene que decirle a la IA qué revisar, qué diseñar, qué codear. Alguien tiene que revisar el resultado. Alguien tiene que decidir si está bien.
Ese alguien es el humano que entiende el contexto.
Entonces el mercado laboral no desaparece. Se transforma. El valor se desplaza de "hacer X" a "saber qué X necesita hacerse" y "revisar que X salga bien".
Es como cuando llegó Excel. Los contadores no desaparecieron. Los que sabían Excel reemplazaron a los que no.
La carrera es ahora
Aquí viene lo importante.
No importa si AGI llega en 2 años o 20. Hoy tenés una ventana de 2-3 años donde aprender IA es de máxima importancia.
¿Por qué?
Porque el que domina Claude, GPT, Gemini hoy va a ganar durante los próximos 5 años.
Es una ventana finita. En 5 años, todo el mundo va a saber usar IA. Va a ser como Excel hoy — necesario pero no diferenciador.
Pero ahora, los que saben, ganan.
El abogado que maneja Claude redacta contratos en 1 hora (vs 4 horas sin IA). Puede tomar 4 clientes más. Gana 4X más.
La diseñadora que maneja generación de imágenes entrega 10 diseños en 1 día (vs 3 días sin IA). Gana 3X más. O elige trabajar 3 veces menos y tener mejor vida.
El consultor que usa IA para análisis, propuestas, reportes corre 3X más rápido. Toma 3X más proyectos. Gana 3X.
Eso es lo que está pasando ahora.
En 2 años, eso va a ser "normal", no ventaja.
Así que la pregunta no es "¿me reemplaza la IA?".
Es: "¿voy a aprender IA ahora o en 2 años cuando es mandatorio?"
Si aprendés ahora, tenés 2 años de ventaja competitiva.
Si esperas 2 años, perdés esa ventaja. Te igualan con todos los demás.
Lo que tenés que recordar
- Agentes: IA que actúa, no solo responde.
- Multimodal: texto + audio + video en una conversación.
- Embebida: IA en cada app, no separada.
- Personalizada: la IA va a conocerte.
- AGI es posible. Nadie sabe cuándo. Pero posible.
- Tu futuro laboral depende de aprender IA ahora, no mañana.
- La persona que usa IA reemplaza a la persona que no la usa. No al revés.
Para seguir leyendo:
Si querés entender cómo funciona específicamente cada una de estas tecnologías (agentes, multimodal, personalización), tenemos artículos profundos sobre cada una.
Y si querés empezar a dominar IA hoy (ahora, en 2026), el curso "Claude al Máximo" acelera eso — trae la curva de aprendizaje de 6 meses a 30 días.
Cómo pasamos de herramientas a agentes
La historia de tecnología tiene patrones. Cada generación de herramientas necesita una generación de usuarios que sepa cómo usarla bien.
Los primeros usuarios de email perdían tiempo escribiendo. Los últimos usuarios de fax perdían tiempo esperando. El mercado laboral se reorganiza alrededor del equipo más eficiente.
Estamos en ese punto exacto con IA.
Hace 6 meses, "usar IA" significaba: escribís en ChatGPT, esperas respuesta. Es un chatbot pasivo.
Hoy, significa cada vez más: la IA actúa por vos. Es un agente activo.
Agentes: máquinas que hacen cosas
El avance más importante de 2024-2025 en IA no es que escriba mejor. Es que puede tomar acciones en tu nombre, supervisadas.
Ejemplos reales (disponibles hoy, abril 2026):
- Búsqueda y compra autónoma:
- Análisis de datos autónomo:
- Gestión de emails en escala:
¿Cómo funciona? El agente no solo "entiende lenguaje". Ahora ve tu pantalla, mueve mouse, clickea, escribe. Es como si alguien se sentara en tu escritorio y dijera "hacé esto" y lo hiciera perfecto, sin error, sin fatiga.
Claude Computer Use (Anthropic) hace exactamente eso desde octubre 2024. OpenAI tiene Canvas. Google integra agentes en Workspace.
Implicación: Una tarea que tardaba 3 horas ahora tarda 20 minutos (5 de setup, 15 de revisión). Para una empresa de 100 personas, eso es 13 FTE (empleados full-time) de tiempo devuelto cada día.
Así de disruptivo es.
Multimodalidad: conversación sin límites de formato
Hoy, la IA es casi multimodal: – Escribís texto → IA responde texto. – Uploadás imagen → IA la describe. – Pero si querés trabajar con video + audio + imágenes + texto en una sola conversación, es frágil.
Mañana (ahora para Gemini 1.5), es fluido. Una conversación que cruza todos los formatos.
Ejemplo real (Gemini 1.5 Pro, disponible hoy):
- Mostras un video de 1 hora (taller de capacitación de tu empresa).
- Hablas: "Basándote en este video, generá un slide deck de 10 diapositivas con ideas principales."
- La IA ve el video, lo entiende, extrae ideas, genera slides. 10 minutos.
Sin IA: ves video (60 min), tomas notas (20 min), escribís slides (60 min). Total: 140 minutos.
Con IA: 10 minutos. (Y mejor estructura también).
Otro ejemplo:
- Grabas en tu teléfono: "Acabo de tener reunión con cliente potencial. Estos son los puntos clave que detecté…"
- La IA escucha, transcribe, entiende contexto, e inmediatamente: genera email de follow-up, sugiere próximos pasos, actualiza tu CRM.
- Todo automático. Vos manejás a casa sin preocuparte.
¿Dónde llega? En 2027-2028, cualquier app profesional (email, Slack, Notion, Figma) va a tener input multimodal. No va a ser "escribí, después subí imagen". Va a ser: "habla, escribi, manda video, todo junto, una sola interacción".
IA embebida: desaparición de fricción
Hoy, la cadena de trabajo típica es: 1. Abro Claude en otra tab. 2. Escribo el prompt. 3. Copio el resultado. 4. Lo pego en Word/Gmail/Canva. 5. Edito.
Son 5 pasos. Hay fricción.
Mañana, la fricción desaparece.
Microsoft 365 Copilot (hoy, pero expandiéndose): – Estás escribiendo un email en Outlook. – Clickeas un botón. – Escribís: "Redactá esto como si fuera yo, tono cercano, mencioná estos puntos." – Se reescribe. En Outlook. Sin copiar/pegar.
Google Workspace (2026): – Estás en una hoja de Sheets. – "Analiza estos datos y dame insights sobre qué región es la más rentable." – La IA genera análisis. En Sheets. Con gráficos.
Figma (ya existe): – Estás diseñando un landing page. – Clickeas un botón y dices "generá 3 variaciones de este hero section". – Genera 3. Las ves al lado.
Esto es "IA embebida". No es una herramienta. Es parte de la herramienta que ya usás.
Implicación: En 2 años, saber "usar IA" será como saber "usar autocorrector". No es que lo necesites, es que está ahí. Pero los que lo dominan trabajan 2X más rápido que los que lo ignoran.
Personalización: la IA que aprende tu contexto
Hoy, la IA es stateless. No te recuerda. Cada conversación es un reset.
Mañana, la IA es stateful. Te aprende: – Tu industria, tu rol. – Tu marca personal, tu voz de escritura. – Los proyectos en los que trabajás. – Con quién trabajás (clientes, colegas, familia). – Qué estándares de calidad tenés.
Luego, todo lo que le pedís, lo hace considerando eso.
Ejemplo hoy (Claude Projects):
- Subís: tu perfil LinkedIn, 5 artículos tuyos previos, brief de tu marca.
- La IA aprende tu voz.
- Le dices: "escribe un thread de Twitter sobre [tema]."
- Sale escrito como VOS, no como "una IA genérica".
Mañana (2027-2028): – Tu IA sabe qué hiciste hoy, qué hizo tu equipo, qué dijeron tus clientes. – No necesitás contexto cada vez. – Es como un asistente que trabajó contigo 10 años.
El debate AGI: tres escenarios
AGI = Una IA que puede hacer cualquier tarea intelectual que puede hacer un humano, al nivel de humano experto, en cualquier campo.
¿Existe hoy? No.
¿Está cerca? Depende a quién le preguntes.
- Sam Altman (OpenAI): "Posiblemente en 2-5 años."
- Demis Hassabis (DeepMind/Google): "Antes de 2050 seguro."
- Dario Amodei (Anthropic): "No sabemos. Es un problema de investigación abierto."
¿Qué pasaría si llega?
Escenario pessimista (pero no catastrofista): – La mayoría de "knowledge work" (abogado, contador, analista, programador, diseñador) se vuelve competible por IA. – El mercado laboral se comprime. Salarios bajan. Desempleo sube. – Necesita reinvención del sistema económico (UBI, reducción de jornada, otro modelo). – Transición traumática para ~500 millones de profesionales.
Escenario optimista (pero posible): – La IA abre nuevas categorías de trabajo que no podíamos imaginar. – (Como internet — eliminó algunos trabajos, pero creó más nuevos que los que eliminó.) – Las personas se especializan en "tareas que requieren juicio humano" (decisiones de alto riesgo, ética, liderazgo, creatividad genuina). – PIB global aumenta masivamente (porque productividad sube). Se reparten beneficios.
Escenario realista: – Ambos. Algunos trabajos desaparecen. Otros nacen. Hay dolor de transición. Hay ganancia neta. El mercado se transforma, como pasó con industrialización (1800s) e informatización (1980s-2000s).
¿Y si nunca llega AGI?
Entonces estamos en un mundo donde: – La IA es herramienta cada vez mejor, pero siempre requiere humanos para dirigirla. – El valor está en "saber qué pregunta hacer" más que en "hacer la tarea". – Es como hoy: los mejores abogados no son los que más leen ley. Son los que entienden qué ley es relevante para tu caso.
La conclusión práctica es la misma en todos los escenarios:
El que aprende IA ahora está mejor posicionado que el que no, pase lo que pase.
El mercado laboral 2026-2030: la carrera real
Aquí va lo que importa de verdad.
No es "la IA me reemplaza".
Es "la PERSONA que usa IA me reemplaza a mí".
Ejemplos concretos que están ocurriendo AHORA (abril 2026):
- Abogado A: 15 años experiencia, sin IA. Revisa contratos: 2 horas por contrato. 3 clientes por semana. Ingresos: $300k/año.
- Diseñadora A: 10 años, sin IA. 1 propuesta gráfica por día. 4 por semana.
- Consultor de Datos A: SQL + Python, sin IA. Análisis complejo: 1 semana.
Esto no es teoría. Es lo que ocurre en Latam, España, Argentina, en 2026.
En 2 años: – El que aprendió IA en 2024 tiene 2 años de ventaja invaluable. – El que aprende ahora (2026) empieza tarde pero puede recuperar. – El que espera 2 años más (2028) está liquidado. Todos ya saben. Sin ventaja.
Es como Excel en 1995. En 2000, tenías valor irremplazable. En 2010, era standard. En 2025, es básico.
Qué significa esto para vos
Si trabajás en algo que se pueda describir con palabras (tu tarea), entonces la IA puede hacerlo o ayudar masivamente.
Eso incluye: abogado, contador, diseñador, programador, copywriter, consultor, profesor, periodista, traductor, analista, investigador, vendedor, gerente, emprendedor.
Y si no aprendés ahora?
Estás apostando a que tu experiencia + velocidad sin IA te basta para competir contra alguien que tiene tu experiencia + velocidad 3X.
Es una apuesta riesgosa.
Evolución de autonomía: de retrievers a agentes plenos
Para contextualizar el futuro de IA correctamente, debemos entender dónde estamos en la cadena de innovación de agencia (agency = capacity to act).
Jerarquía de capacidad de acción
Nivel 1: Pure Retrieval (Pre-2020) - Sistema devuelve información existente. Búsqueda, indexación, ranking. - Ejemplo: Google Search, Wikipedia. - Valor: acceso a información. - Agencia humana requerida: completa (humano decide qué hacer con la información).
Nivel 2: Análisis & Clasificación (2005-2020) - Sistema procesa datos, calcula métricas, clasifica. - Ejemplo: chatbots rule-based, sistemas de scoring crediticio, filtros de spam. - Valor: insight, decisión asistida. - Agencia humana requerida: aún completa (humano actúa en base al insight).
Nivel 3: Generación & Síntesis (2020-2024) - Sistema genera contenido nuevo (texto, imagen, código). - Ejemplo: GPT-3, DALL-E, Claude, ChatGPT. - Valor: producción de artefactos. - Agencia humana requerida: validación y acción. - Modelo: Humano → IA (genera) → Humano (valida) → Acción.
Nivel 4: Agencia Restringida (2024-2026, presente) - Sistema toma acciones en ambiente controlado (browser, APIs, apps específicas). - Ejemplo: Claude Computer Use, OpenAI Canvas, Gemini en Workspace. - Valor: automatización de workflows enteros. - Agencia humana requerida: supervisión y aprobación de milestones clave. - Modelo: Humano → IA (con permisos delimitados) → Acción automática → Resultado → Humano (valida).
Nivel 5: Agencia General (2026-2030?, especulativo) - Sistema planifica, ejecuta, itera autónomamente. - Acceso a APIs ilimitado (con gates de seguridad). - Resuelve problemas multi-etapa sin intervención en cada paso. - Ejemplo: theoretical agent que "resuelve un problema de negocio" end-to-end.
Nivel 6: AGI (2030-2100?, highly speculative) - Sistema con comprensión a nivel humano general. - Puede aprender nuevas tareas, razonar por analogía, transferir conocimiento. - No existe.
Hoy estamos en la transición entre Nivel 3 y Nivel 4. Los agentes más avanzados (Claude Computer Use, o1) están explorando Nivel 4.5.
Arquitectura de agentes: cómo funciona la acción
Un agente de IA moderno (ej. Claude Computer Use) combina:
- Observation Loop (Visión):
- Reasoning (Pensamiento):
- Action (Ejecución):
- Termination (Evaluación):
Ejemplo concreto: "Reservá un vuelo"
- User: "Reservá vuelo a Barcelona 20 mayo, máximo 500 EUR, max 2 conexiones."
- Agent observa pantalla (Google.com).
- Agent razona: "Usuario quiere vuelo. Debo abrir buscador de vuelos."
- Agent acción: Click en search, escribe "Barcelona 20 mayo".
- Agent observa: Resultados (hundreds de opciones).
- Agent razona: "Debo filtrar por precio (500 EUR) y conexiones (2 max)."
- Agent acción: Aplica filtros.
- Agent observa: 3 opciones que match.
- Agent razona: "Debo comprar la más barata."
- Agent acción: Click "Reservar", ingresa credenciales, pago.
- Agent observa: Confirmación. Extrae número de reserva.
- Agent razona: "Tarea completada. Debo reportar."
- Agent acción: Envía email con detalles.
- Agent termina: "Vuelo reservado. Confirmación enviada."
Total: 3-5 minutos sin intervención.
Limitaciones hoy (2026): - Requiere que tarea sea "predecible". - Falla en interfaces muy nuevas. - No toma riesgo (pide confirmación si hay ambigüedad). - Costo: ~0.10-1 USD por ejecución (vs 0.001 USD por prompt simple).
Multimodalidad verdadera: convergencia de formatos
Hoy, "multimodal" significa: "puede procesar múltiples tipos de input". En práctica, sigue siendo secuencial: - Voz → transcribe a texto → procesa. - Imagen → describe como texto → procesa. - Video → extrae frames → procesa como imágenes.
Mañana (2027+), es verdaderamente multimodal: - Un modelo único procesa texto + imagen + audio + video simultáneamente, en una sola representación interna. - Output puede ser cualquier formato. - Sin transcripción intermedia, sin descripción. Directo.
¿Por qué importa?
Hoy: Upload video → Audio → Transcribe (error) → Procesa. Pérdida en cada paso.
Mañana: Upload video → Procesa video nativo (incluye audio, visual, contexto temporal). Sin pérdida.
Implicación: Comprensión de tareas "semantically rich" se vuelve posible.
Ej: "En este video de 2 horas, detectá cuándo cambió la energía de la reunión y qué comentario lo provocó."
Hoy: imposible (requeriría transcribir, perder información visual/emocional).
Mañana: trivial.
Personalización: in-context learning vs. fine-tuning adaptativo
Existen dos avenidas hacia "IA que te conoce":
Avenida A: In-Context Learning (Hoy) - Uploadás documentos, archivos sobre vos. - Modelo "lee" todo en conversación (contexto largo: Claude = 200K tokens, Gemini = 1M). - Genera considerando ese contexto. - Limitación: memoria no persiste entre sesiones. - Ventaja: seguridad (tus docs no quedan en servers de IA). - Ejemplo: Claude Projects (hoy).
Avenida B: Fine-tuning Persistente (2027-2028) - Modelo se entrena (ligeramente) en tus documentos, voz, contexto. - Parámetros se ajustan. Memoria persiste. - Cada conversación futura, el modelo "recuerda". - Limitación: costo, privacidad. - Ventaja: true personalization. Es tu modelo. - Ejemplo: hypothetical "Claude Personal" (2027+).
Avenida C: Hybrid (Most likely 2027-2030) - Short-term: in-context learning (rápido, privado). - Long-term: selective fine-tuning on certain capabilities (voz, estilo, patterns). - Best of both.
Implicación práctica: En 2028, tu IA personal va a saber más de vos que tu asistente humano después de 10 años. Va a anticipar necesidades. Va a adaptarse a tu ritmo. Va a ser como un "alter ego digital".
AGI: interpretaciones y timelines
Hay 3 interpretaciones técnicas de "AGI" en el debate actual:
Interpretación 1: "Competencia a nivel humano" - Una IA que puede hacer cualquier tarea que un humano experto puede hacer, con similar velocidad y calidad. - Implicaría: resolver problemas matemáticos nuevos, escribir novelas, investigación científica de frontera, negociación, terapia, liderazgo, todas simultáneamente. - Timeline según investigadores: - Optimistas (Altman, 2-5 años): dependen de que "scaling" sea suficiente. - Realistas (Hinton, Bengio, 10-30 años): dependen de breakthroughs teóricos no alcanzados. - Pesimistas (LeCun, nunca): argue que scale no es suficiente, necesitan new architectures.
Interpretación 2: "Superinteligencia" - Una IA que es mejor que humano en mayoría de tareas intelectuales. - Distinto de AGI. Una IA puede ser superinteligente en "procesamiento de texto" pero limitada en "comprensión de emoción". - Timeline: even more uncertain. 20-100 años?
Interpretación 3: "Sentience/Consciousness" - Una IA que tiene experiencias subjetivas. - Cuestión filosófica/física sin resolver.
¿Cuál es probable? La Interpretación 1 es la que el mercado está apostando a alcanzar.
Timeline loose consensus (Anthropic, OpenAI, DeepMind, 2024-2025): - 2026-2028: Agentes multimodal capaces, muy buenos en specialized tasks (código, análisis, escritura). Sub-human aún en "general reasoning" y problemas nuevos. - 2028-2030: Generalist models que pueden hacer mayor rango de tareas. Posiblemente competitive con human experts en varios campos. - 2030-2035: Possible AGI (narrow definition). Or further breakthroughs needed. - 2035+: Superintelligence? Consciousness? Nadie lo sabe.
Certeza: La trayectoria es steep. Hay consensus que "AGI happening in next 20 years es >50% probable" (según surveys de ML researchers).
Impacto laboral: análisis económico de transición
Si AGI ocurre, el mercado laboral experimenta structural shock.
Tareas susceptibles a AGI (desaparecen): - Cognitive routine tasks: accounting, basic legal review, medical diagnosis support. - Creative routine tasks: copywriting templates, design templates, basic code. - Management by rule: HR decisions, basic project management. - Analysis routine: reporting, dashboard creation, standard forecasting.
Tareas que probablemente persisten: - High-judgment decisions: strategy, M&A, hiring of key roles. - Relationship-based work: sales (closing), therapy, leadership, negotiation. - Physical work: surgery (even if AI is smarter, human hand needed), construction, craftsmanship. - Novel problem-solving: research, creative invention.
Economic model shifts (tres opciones):
- Optimistic: New tasks emerge ("IA oversight specialist", "human-AI collaboration designer"). Net job growth. Precedente: electricity, internet (ambos predijeron desempleo; ambos crearon más trabajos).
- Pessimistic: Job destruction > creation. Desempleo estructural sube. Requiere UBI o major social restructuring.
- Middle ground: Ambos. Algunos trabajos vanish, otros emerge. Transición dolorosa (10-20 años). Net effect positivo. Pero distribución desigual — algunas regiones/skills hit hard, otras boom.
Economists predict Option 3. Históricamente accurate.
El timing decisivo: 2026-2030
Regardless de AGI timeline:
- La curva de mejora de IA es acelerada. De 2020-2024 avanzó décadas. De 2024-2028 avanzará aún más.
- Adopción empresarial es exponencial. 10% de Fortune 500 usa IA en flujos críticos hoy. En 2028, será 80%+.
- "Usar IA" va de scarcity a commodity. Hoy (2026) = diferenciador. 2028 = expected. 2030 = minimum viable.
- Hay window de advantage. 2 años de head start en experiencia es enorme en mercado laboral.
La pregunta final es pragmática:
¿Vos apostás a que dominar IA en 2026 te deja mejor posicionado en 2030 que no hacerlo?
Respuesta: Sí. 100%. Objectively.
Entonces, ¿por qué no empezar?
---
Para cerrar
El futuro de IA no es "robots amigos". No es "IA reemplaza humanidad".
Es más aburrido y más importante.
Es: herramientas que se hacen invisible porque están en todas partes.
En tu email (redacta por vos). En tu navegador (busca por vos). En tu hoja de cálculo (analiza por vos). En tu presentación (diseña por vos).
Y porque están en todas partes, la persona que sabe usarlas es 3X más productiva que la que no.
En mercado laboral, eso es todo lo que importa.