La inteligencia artificial (IA) está transformando vidas y negocios a una escala sin precedentes. Sin embargo, ¿cómo será ese futuro? El impacto de la IA no solo depende de su capacidad para innovar, sino también de los datos que la sustentan. Este artículo se inspira en las reflexiones de The AI Forecast, un espacio semanal patrocinado por Cloudera y presentado por Paul Muller, que explora la intersección entre IA, datos y arquitectura empresarial.
Recientemente, Wang, analista principal y presidente de Constellation Research, compartió ideas fundamentales sobre los retos de los datos en la era de la IA. Estas conclusiones arrojan luz sobre las barreras actuales y el camino hacia un uso más efectivo de los modelos de lenguaje grande (LLM).
La precisión de los LLM: una herramienta poderosa con límites actuales
En el panorama actual, los modelos de lenguaje grande alcanzan una precisión promedio del 85%. Este porcentaje puede parecer impresionante, pero su impacto varía drásticamente según el contexto:
- En experiencia del cliente, un 85% puede traducirse en errores menores, como dirigir una llamada a la persona equivocada o incluir un artículo extra en un pedido.
- En la cadena de suministro, este mismo porcentaje puede detener operaciones completas.
- En finanzas, la falta de precisión podría resultar en errores graves que lleven incluso a consecuencias legales.
La verdadera revolución en los LLM vendrá con mejoras marginales pero críticas. Pasar del 85% al 95% requiere una inversión significativa en datos de mayor calidad y precisión contextual. Y llegar al 100% es aún más desafiante, ya que implica capturar datos más complejos y específicos, desde metadatos contextuales hasta señales biológicas como el ritmo cardíaco o incluso la transpiración.
El obstáculo principal: los datos disponibles
La calidad de los LLM está directamente relacionada con la disponibilidad de datos. Según Wang, estamos entrando en una “era oscura de los datos”, marcada por un acceso limitado a nueva información:
- Agotamiento de datos públicos: Gran parte de la información accesible en Internet ya ha sido procesada. Lo que queda es escaso y, en muchos casos, de calidad cuestionable.
- Reticencia a compartir: Desde 2022, organizaciones e individuos han comenzado a acaparar información por temor a su uso indebido, reduciendo aún más la riqueza de datos disponibles.
Esto crea un ecosistema en el que los datos realmente valiosos son cada vez más inaccesibles, afectando no solo a los LLM, sino a la evolución misma de la IA.
Un cambio en las cadenas de valor: los datos como activos estratégicos
En este contexto de escasez, Wang anticipa un cambio significativo en cómo las empresas valoran los datos:
- Colaboración en cadenas de valor: Las empresas empezarán a compartir información estratégicamente, no entre competidores directos, sino a lo largo de cadenas de valor naturales. Por ejemplo, un minorista, un fabricante y un distribuidor podrían colaborar para optimizar la oferta, la demanda y los precios.
- Mercados de datos: La información se convertirá en una mercancía valiosa, con empresas pujando por acceso a insights clave. Esta dinámica impulsará la consolidación de colectivos de datos y fomentará mercados regulados para la compra y venta de información.
El futuro de la IA en la era de los datos oscuros
La era oscura de los datos representa tanto un desafío como una oportunidad. Las empresas que encuentren formas innovadoras de generar, capturar y utilizar datos tendrán una ventaja competitiva significativa. Además, el desarrollo de cadenas de valor colaborativas y mercados de datos estructurados podría redefinir el panorama económico global.
Sin embargo, este progreso requiere un enfoque estratégico en la arquitectura de datos, políticas de privacidad y la ética de la inteligencia artificial. Si logramos superar estas barreras, la promesa de la IA no será solo transformar vidas y negocios, sino también redefinir la relación entre datos y sociedad.