Elon Musk Advierte: Hemos Agotado los Datos Reales para Entrenar la IA

Fuente: Tech Crunch - 08 de enero 104 vistas
Elon Musk ha afirmado que se ha agotado prácticamente la totalidad de los datos del mundo real para entrenar modelos de inteligencia artificial (IA). Durante una conversación en vivo, Musk mencionó que este agotamiento ocurrió el año pasado, coincidiendo con lo que otros expertos en IA, como Ilya Sutskever, han señalado sobre haber alcanzado un "pico de datos". Musk sugirió que el futuro del entrenamiento de IA dependerá del uso de datos sintéticos, generados por los propios modelos de IA, como una forma de complementar los datos reales. Esta técnica ya está siendo utilizada por grandes empresas tecnológicas como Microsoft, Meta y OpenAI, que han incorporado datos sintéticos en sus modelos más destacados.
Por ejemplo, Microsoft ha abierto su modelo Phi-4, entrenado con datos sintéticos y reales, mientras que Google y Anthropic también han utilizado esta metodología para sus sistemas avanzados. Aunque el uso de datos sintéticos puede resultar más económico —como lo demuestra el modelo Palmyra X 004 de Writer, desarrollado por solo $700,000— existen desventajas. Investigaciones indican que los datos sintéticos pueden llevar a un "colapso del modelo", reduciendo su creatividad y aumentando sesgos en sus resultados. Esto plantea un desafío significativo si los datos utilizados para entrenar estos modelos contienen limitaciones inherentes.