05/12/2025 Noticias de Economía, Comercio y Negocios en El Salvador.

Internet no basta para entrenar IA: ¿Solución en datos falsos?

En 2011, Marc Andreessen, cuya firma de capital de riesgo Andreessen Horowitz ha invertido desde entonces en algunas de las mayores empresas emergentes de inteligencia artificial, escribió que “el software se está comiendo al mundo”. Más de una década después, eso es exactamente lo que está haciendo.

La inteligencia artificial, en particular los grandes modelos de lenguaje que la impulsan, es un consumidor voraz de datos. Pero esos datos son finitos y se están agotando. Las empresas han extraído todo de sus entrañas en sus esfuerzos por entrenar a IA cada vez más poderosas: transcripciones y subtítulos de videos de YouTube, publicaciones públicas en Facebook e Instagram, libros y artículos de noticias con derechos de autor, a veces sin permiso , a veces con acuerdos de licencia . ChatGPT de OpenAI, el chatbot que ayudó a popularizar la IA, ya ha sido entrenado en toda la Internet pública , aproximadamente 300 mil millones de palabras, incluidas todas las de Wikipedia y Reddit. En algún momento, no quedará nada.

Los investigadores lo llaman “chocar contra el muro de los datos” y dicen que es probable que suceda tan pronto como en 2026 .

Eso hace que la creación de más datos de entrenamiento de IA sea una pregunta de mil millones de dólares, una que un grupo emergente de empresas emergentes está buscando nuevas formas de responder.

UNA POSIBILIDAD: CREAR DATOS ARTIFICIALES

Así es como Gretel, una startup de cinco años de antigüedad, aborda el problema de los datos de la IA. Crea lo que se conoce como “datos sintéticos”: datos generados por IA que imitan de cerca la información factual, pero que en realidad no son reales. Durante años, la startup, que ahora está valuada en 350 millones de dólares, ha proporcionado datos sintéticos a empresas que trabajan con información personal identificable que necesita ser protegida por razones de privacidad (por ejemplo, datos de pacientes). Pero ahora su director ejecutivo, Ali Golshan, ve una oportunidad de proporcionar a las empresas de IA, que carecen de datos, datos falsos creados desde cero, que pueden usar para entrenar sus modelos de IA.

“Los datos sintéticos fueron una gran opción”, dijo Golshan, ex analista de inteligencia, sobre el problema del muro de datos. “Resolvió dos caras de la misma moneda. Se podía hacer que los datos fueran de alta calidad y seguros”.

Este enfoque de “IA alimenta a IA” ya ha sido adoptado por Anthropic , Meta , Microsoft y Google , que han utilizado datos sintéticos de alguna manera para entrenar sus modelos. El mes pasado, Gretel anunció que pondría sus datos sintéticos a disposición de los clientes que utilicen Databricks, una plataforma de análisis de datos, para construir modelos de IA.

Compartir artículo:
Banner
Related Posts

Empresas griegas interesadas en ampliar operaciones en El Salvador

07/06/2024

07/06/2024

Un comunicado del Ministerio de Relaciones Exteriores reveló que un grupo de empresas griegas está interesado en ampliar sus operaciones...

Movistar El Salvador y Fundación Renacer se unen para crear esperanza

04/01/2024

04/01/2024

Movistar El Salvador reafirmó su compromiso con la sostenibilidad y la inclusión en El Salvador al asociarse con la Fundación...

Ministerio de Agricultura lanza plataforma para capacitar a productores

21/01/2023

21/01/2023

El Gobierno salvadoreño está cambiando la realidad de los productores salvadoreños; por ello, a través del Ministerio de Agricultura y...

Los imperios deportivos: una estrategia ganadora para crear riqueza generacional

25/01/2024

25/01/2024

La propiedad de equipos deportivos ha sido durante mucho tiempo un objetivo de los ultrarricos, pero expandirlo hasta convertirlo en...

Gobierno acercara servicios a salvadoreños residentes en Washington, Maryland y Virginia

18/04/2023

18/04/2023

El Gobierno del Presidente Nayib Bukele continúa trabajando para llevar los servicios públicos de diferentes instituciones estatales a salvadoreños residentes...

CEPA presenta nuevo sistema de radioayuda para Aeropuerto Internacional

02/12/2023

02/12/2023

La Comisión Ejecutiva Portuaria Autónoma (CEPA) presentó este jueves un nuevo sistema de radioayuda para los vuelos operados en el...

Zapatos bajo presión: gigantes del calzado piden a Trump frenar aranceles

06/05/2025

06/05/2025

Un grupo de 76 empresas líderes de la industria del calzado en Estados Unidos, entre ellas Nike, Adidas, Skechers y...

CAF y autoridades salvadoreñas impulsan diálogo estratégico con empresarios rumbo al Foro Económico 2026

25/09/2025

25/09/2025

El presidente ejecutivo de CAF –banco de desarrollo de América Latina–, Sergio Díaz-Granados, sostuvo una reunión estratégica con la ministra...

BCIE impulsa desarrollo de mipymes con la firma de convenios de asistencia técnica

11/09/2023

11/09/2023

Con el objetivo de mejorar los servicios empresariales y de fortalecer las capacidades técnicas de las micro, pequeñas y medianas...

El Salvador en riesgo económico bajo un segundo mandato de Trump

12/07/2024

12/07/2024

El Salvador es uno de los países más expuestos a potenciales cambios en la política económica si Donald Trump gana...

El BID aprobará un plan para incluir la biodiversidad en sus proyectos

13/12/2022

13/12/2022

El Banco Interamericano de Desarrollo (BID) aprobará un plan en el primer trimestre de 2023 para incluir la protección de la biodiversidad...

Bajo crecimiento en la nube de Microsoft Indica retraso en beneficios de IA

31/07/2024

31/07/2024

Microsoft pronosticó un crecimiento trimestral de su plataforma en la nube Azure por debajo de las estimaciones y dijo que...

Tres restaurantes latinoamericanos entre los 10 mejores

06/06/2024

06/06/2024

Es la lista alternativa a la de Michelin. En ‘The World’s 50 Best Restaurants’, tres restaurantes latinoamericanos se han situado...

Apple lanzará nueva app para juegos en todos sus dispositivos

27/05/2025

27/05/2025

Apple Inc. está planeando una aplicación dedicada a los videojuegos para sus dispositivos, con el objetivo de convencer a los...

Twitter recorta personal que supervisa la moderación de contenidos

07/01/2023

07/01/2023

Twitter Inc llevó a cabo nuevos recortes de personal en el equipo de confianza y seguridad encargado de la moderación...