En el dinámico mundo de la inteligencia artificial, nos encontramos ante una pregunta fundamental: ¿cuánto importan realmente los modelos de base? Aunque pueda parecer trivial, este interrogante ha surgido en múltiples diálogos con startups de inteligencia artificial, las cuales muestran una creciente comodidad hacia negocios previamente considerados meras “interfaces de GPT”, es decir, empresas que construyen interfaces sobre modelos de inteligencia artificial existentes, como ChatGPT. Actualmente, los equipos de startups están enfocados en personalizar modelos de IA para tareas específicas y en el diseño de interfaces, visualizando el modelo de base como una mercancía intercambiable según sea necesario. Este enfoque fue claramente evidente en la reciente conferencia de Boxworks, donde la atención estuvo centrada en el software orientado al usuario construido sobre modelos de IA.
Este cambio de enfoque se debe en parte a que los beneficios de escalado derivados del pre-entrenamiento —el proceso inicial de formación de modelos de IA con grandes conjuntos de datos— han comenzado a disminuir. Esto no significa que el progreso de la IA se haya detenido, pero los primeros beneficios de los extensos modelos fundacionales han alcanzado rendimientos decrecientes. Por lo tanto, si se busca mejorar una herramienta de codificación de IA, es más efectivo trabajar en el ajuste fino y el diseño de la interfaz que gastar miles de millones en tiempo de servidor para el pre-entrenamiento. La trayectoria de Claude Code de Anthropic demuestra que las empresas de modelos fundacionales están bien equipadas en estos otros campos, aunque su ventaja no es tan duradera como antes.
En resumen, el paisaje competitivo de la inteligencia artificial está cambiando, lo que debilita las ventajas de los laboratorios de IA más grandes. En lugar de una carrera por una inteligencia general poderosa que pueda igualar o superar las capacidades humanas en todas las tareas cognitivas, el futuro inmediato parece ser una explosión de negocios discretos: desarrollo de software, gestión de datos empresariales, generación de imágenes, entre otros. Aparte de la ventaja de ser pionero, no está claro que construir un modelo de base proporcione alguna ventaja en estos negocios. Peor aún, la abundancia de alternativas de código abierto significa que los modelos fundacionales pueden perder su poder de precios si no prosperan en la capa de aplicación, convirtiendo a empresas como OpenAI y Anthropic en proveedores de backend en un negocio de bajo margen, como se expresó en una analogía mencionada por un fundador.
El impacto de este cambio sería significativo para el negocio de la IA. Durante el auge contemporáneo, el éxito de la IA ha estado inextricablemente ligado a las empresas que desarrollan modelos fundacionales, específicamente OpenAI, Anthropic y Google. Creer en el futuro de la IA implicaba aceptar que su impacto transformador catapultaría a estas compañías hacia un estatus de importancia generacional. Durante años, el desarrollo de modelos fundacionales ha sido el único negocio que ha existido en este ámbito, y su rápido avance hizo que su liderazgo pareciera insuperable.
Sin embargo, la realidad ha comenzado a complicar esta narrativa. Numerous servicios de IA de terceros están prosperando, pero muchos utilizan modelos de base de manera intercambiable. Para las startups, ya no importa si su producto se basa en GPT-5, Claude, o Gemini; esperan poder cambiar de modelo a mitad del ciclo de lanzamiento sin que los usuarios finales noten la diferencia. A pesar de que los modelos fundacionales continúan evolucionando, resulta poco plausible que alguna empresa mantenga una ventaja suficiente para dominar la industria.
Indicadores recientes sugieren que no existe una ventaja clara por ser el primero en el mercado. Como señaló el capitalista de riesgo Martin Casado de a16z, OpenAI fue el primero en lanzar un modelo de codificación, así como modelos generativos para imágenes y videos, pero ha perdido el liderazgo en todas estas áreas ante competidores. “No parece haber un refugio inherente en la tecnología de IA,” concluyó Casado.
No obstante, no se debe subestimar a las empresas que desarrollan modelos fundacionales. Siguen contando con numerosas ventajas duraderas, como el reconocimiento de marca, infraestructura robusta y reservas de capital sin precedentes. El negocio de OpenAI con consumidores podría resultar más complejo de replicar que su negocio de codificación, y podrían surgir otras ventajas a medida que el sector madura. Con el ritmo acelerado del desarrollo de la IA, el actual interés en el post-entrenamiento podría revertirse en los próximos seis meses. Lo más incierto es que la carrera hacia la inteligencia general podría resultar en avances significativos en campos como la farmacología o la ciencia de materiales, redefiniendo lo que hace valiosos a los modelos de IA.
Mientras tanto, la estrategia de construir modelos fundacionales cada vez más grandes parece menos atractiva que hace un año —y los gastos multimillonarios de Meta están comenzando a verse como una apuesta arriesgada.
Gracias por leer Columna Digital, puedes seguirnos en Facebook, Twitter, Instagram o visitar nuestra página oficial. No olvides comentar sobre este articulo directamente en la parte inferior de esta página, tu comentario es muy importante para nuestra área de redacción y nuestros lectores.


