Tenía esto guardado desde hace unas semanas. Me lo dejé en borradores porque pensé: igual es pasarse. Pero ya está bien de comerse las palabras.
La nueva versión de Gemini (sí, esa de hace nada) me reafirmó en algo que llevo diciendo un par de años y que cada vez suena menos loco: estamos yendo directos hacia un mundo donde vas a poder crear cualquier cosa con lenguaje natural. Con palabras. Y punto.
Por 5$ puedes comprarte un donut en el aeropuerto, dos cafés aguados en una máquina de hospital, un imán de nevera con forma de flamenco… o apoyar este proyecto y sentirte como Warren Buffett pero con menos traje y más sentido común.
Pero no cualquier cosa tipo "hazme un logo con un perrito en acuarela". No. Cualquier cosa. Como en: "hazme un videojuego", "crea una escena de cine y cámbiame la cámara en tiempo real", o "hazme un 8x upscale de esta imagen inventándote los píxeles para que parezca sacada de una reflex".
Y lo más heavy: cuando necesites una herramienta, la IA la va a crear en el momento. No la vas a abrir. No la vas a instalar. No la vas a buscar en Product Hunt. Va a aparecer para ti, para lo que estás haciendo, para cómo piensas tú.
¿Tiene sentido una app como WhatsApp? ¿Photoshop? ¿Un e-commerce?
Dentro de poco no. Porque no vamos a interactuar con productos. Vamos a interactuar con una única interfaz, una especie de asistente líquido que se adapta a nosotros en tiempo real. Que ya sabe qué necesitas y cómo lo necesitas. Y eso cambia absolutamente todo.
Si tienes una tienda, no vas a tener que hacer una web con fotos y precios. Solo dejar que tu stock esté disponible para hablar con los modelos del futuro. Así de simple. Y así de bestia.
Y no, no es ciencia ficción. Esto se veía venir desde DALL·E 2 y ChatGPT. Pero con lo último de Gemini, el mensaje es clarísimo: las herramientas verticales que conocíamos tienen fecha de caducidad. Y no hablo de dentro de 10 años. Hablo de ahora.
¿Quién sobrevive en este panorama?
Muy poca gente.
Porque esto no va de tener el mejor modelo hoy. Va de poder seguir entrenando modelos competitivos durante años. ¿Tienes acceso a GPUs, a los datos, a los researchers que valen su peso en oro? Genial. Si no, suerte en la próxima vida.
Y mientras tanto, los demás, ¿qué hacemos?
Nos preparamos. Nos adaptamos. Entendemos que esto no es una mejora de productividad. Es un cambio de paradigma. Del tamaño de Internet. O más.
Porque lo que se viene no es una curva. Es un reset. Y quien siga pensando en interfaces como si estuviésemos en 2015, está en la parte equivocada de la historia.
Así que eso. Tenía que decirlo. Ya está dicho.
Súper interesante!
Esto es algo que también he venido pensando hace tiempo, cuando vi un demo de Google en que un bot hace una llamada para reservar una cita en la peluquería. ¡En el 2018! (aquí puedes verla https://www.youtube.com/watch?v=dcG9bLhLYhU).
Luego me entró la duda... qué pasaría cuando la "llamada" ya no sea entre un robot y un humano sino entre 2 robots, ¿qué tanto sirve el lenguaje natural ahi? ¿no funcionaría mejor una API como en los viejos tiempos?
La gran pregunta es dónde queda la sociedad en todo esto. Parece que estamos mirando un timeline que va a 3x y del que tenemos poco poder de decisión. O corres o corres.
Me encanta este momento, pero está fuera de control.