20/01/2026 Noticias de Economía, Comercio y Negocios en El Salvador.

Internet no basta para entrenar IA: ¿Solución en datos falsos?

En 2011, Marc Andreessen, cuya firma de capital de riesgo Andreessen Horowitz ha invertido desde entonces en algunas de las mayores empresas emergentes de inteligencia artificial, escribió que “el software se está comiendo al mundo”. Más de una década después, eso es exactamente lo que está haciendo.

La inteligencia artificial, en particular los grandes modelos de lenguaje que la impulsan, es un consumidor voraz de datos. Pero esos datos son finitos y se están agotando. Las empresas han extraído todo de sus entrañas en sus esfuerzos por entrenar a IA cada vez más poderosas: transcripciones y subtítulos de videos de YouTube, publicaciones públicas en Facebook e Instagram, libros y artículos de noticias con derechos de autor, a veces sin permiso , a veces con acuerdos de licencia . ChatGPT de OpenAI, el chatbot que ayudó a popularizar la IA, ya ha sido entrenado en toda la Internet pública , aproximadamente 300 mil millones de palabras, incluidas todas las de Wikipedia y Reddit. En algún momento, no quedará nada.

Los investigadores lo llaman “chocar contra el muro de los datos” y dicen que es probable que suceda tan pronto como en 2026 .

Eso hace que la creación de más datos de entrenamiento de IA sea una pregunta de mil millones de dólares, una que un grupo emergente de empresas emergentes está buscando nuevas formas de responder.

UNA POSIBILIDAD: CREAR DATOS ARTIFICIALES

Así es como Gretel, una startup de cinco años de antigüedad, aborda el problema de los datos de la IA. Crea lo que se conoce como “datos sintéticos”: datos generados por IA que imitan de cerca la información factual, pero que en realidad no son reales. Durante años, la startup, que ahora está valuada en 350 millones de dólares, ha proporcionado datos sintéticos a empresas que trabajan con información personal identificable que necesita ser protegida por razones de privacidad (por ejemplo, datos de pacientes). Pero ahora su director ejecutivo, Ali Golshan, ve una oportunidad de proporcionar a las empresas de IA, que carecen de datos, datos falsos creados desde cero, que pueden usar para entrenar sus modelos de IA.

“Los datos sintéticos fueron una gran opción”, dijo Golshan, ex analista de inteligencia, sobre el problema del muro de datos. “Resolvió dos caras de la misma moneda. Se podía hacer que los datos fueran de alta calidad y seguros”.

Este enfoque de “IA alimenta a IA” ya ha sido adoptado por Anthropic , Meta , Microsoft y Google , que han utilizado datos sintéticos de alguna manera para entrenar sus modelos. El mes pasado, Gretel anunció que pondría sus datos sintéticos a disposición de los clientes que utilicen Databricks, una plataforma de análisis de datos, para construir modelos de IA.

Compartir artículo:
Banner
Related Posts

El taxi volador estará en el mercado en 2025

16/11/2023

16/11/2023

El taxi volador ha tardado mucho en convertirse en una realidad, pero estará «en el mercado en 2025», primero en...

Dos pares de zapatillas de Jordan recaudan casi 300.000 dólares en una subasta

08/12/2022

08/12/2022

Dos pares de zapatillas usadas en 1985 por Michael Jordan recaudaron este jueves casi 300.000 dólares en una subasta por...

Netflix invertirá 1.000 millones de dólares en producciones en México

21/02/2025

21/02/2025

El codirector ejecutivo de Netflix, Ted Sarandos, anunció el jueves una inversión de 1.000 millones de dólares en México en...

¿Cómo contrarrestar los picos de la demanda de energía para contener los costos energéticos?

09/05/2023

09/05/2023

Blog:  Roberto Castaldini, A medida que el problema de equilibrar la demanda y el suministro de electricidad se vuelve más...

Fundación Suriano Siu beneficia con becas a jóvenes salvadoreños

04/03/2023

04/03/2023

La Fundación Suriano Siu (FSS) llevó a cabo su tercera entrega de becas, con las que beneficia a más de...

Habilitan 40 estaciones de chequeo en aeropuerto

05/12/2022

05/12/2022

La Comisión Ejecutiva Portuaria Autónoma (CEPA) remodelará el área de registro de pasajeros para agilizar la movilidad de los viajeros...

Defensoría del Consumidor verifica precios en La Tiendona

24/12/2023

24/12/2023

Las autoridades de la Defensoría del Consumidor informaron sobre la verificación de precios en las verduras y hortalizas en el...

El Salvador, anfitrión de la feria centroamérica Travel Market 2024 «Tejiendo Conexiones»

29/02/2024

29/02/2024

El Salvador se prepara para recibir la destacada feria Centroamérica Travel Market 2024 «Tejiendo Conexiones», que reunirá a los tour...

El Salvador logra recaudación récord en aduanas

05/07/2023

05/07/2023

La Dirección General de Aduanas de El Salvador (DGA) anunció que el país ha logrado una recaudación histórica de más...

6 estrategias para impulsar el compromiso en cooperativas

12/01/2024

12/01/2024

Uno de los aspectos más destacados de Panamá es su gente y el gran Canal de Panamá: una vía de...

34% de los CEO en Centroamérica creen que habrá una recesión económica en los próximos 12 meses

31/10/2022

31/10/2022

Los principales CEO de empresas no se creen la idea de que la economía estadounidense podría tener un aterrizaje suave...

Latinoamérica acelera la construcción de centros de datos ante el avance del 5G

08/12/2025

08/12/2025

Brasil, México, Chile, Colombia y Argentina lideran una expansión acelerada de infraestructura digital en Latinoamérica, impulsada por el despliegue del...

Desastres naturales costaron a El Salvador 16% del PIB en 20 años

10/07/2024

10/07/2024

Un reciente estudio de la Fundación para el Desarrollo de Centroamérica (Fudecen) ha puesto de manifiesto el alto costo que...

Javier Milei enfrenta su primera denuncia penal por presunta estafa con criptomonedas

17/02/2025

17/02/2025

El presidente de Argentina, Javier Milei, se encuentra en el centro de una investigación judicial tras una denuncia presentada por...

iPhone graba videos en 3D para gafas de realidad virtual

11/12/2023

11/12/2023

En Apple Vision Pro, los videos espaciales se podrán reproducir en una ventana (como la de un computador) o expandirse...

error: Content is protected !!