Bienvenidos a AboutData.blog de Gold Light Data, donde exploramos lo último en Big Data, IA, ML, Analítica de Negocios e Inteligencia de Negocios. Únete a nosotros para mantenerte informado y empoderado en el dinámico mundo de la tecnología de datos.

Operaciones de aprendizaje automático simplificadas

Hoy, nos complace compartir que BigML Ops ahora está disponible para los usuarios de BigML, incluidos los suscriptores de MLaaS en BigML.com y en despliegue privado. Permítenos brindarte un poco de información sobre cómo llegamos aquí antes de describir las características excepcionales que BigML Ops trae al mercado.

Supervisión de operaciones de BigML

Un poco de historia

Desde el inicio de BigML en 2011, los modelos de BigML han sido automática e inmediatamente operativos tras la creación, y las predicciones generadas con esos modelos han sido completamente rastreables hasta los modelos, evaluaciones, conjuntos de datos y fuentes de datos asociados en aras de la total transparencia y reproducibilidad. BigML te permite hacer predicciones inmediatamente a partir de tus modelos tan pronto como los crees. Se puede acceder a los modelos y las predicciones como recursos REST separados y se pueden consumir utilizando muchas bibliotecas. De hecho, en BigML, cada entidad de modelado es un recurso REST y esa es una elección de diseño clave que diferencia a la plataforma de la competencia. Ofrece un nivel de flexibilidad que nadie ofrece cuando se trata de construir y consumir modelos.

Estos recursos REST pueden ser consumidos por una multitud de aplicaciones inteligentes con las que puede elegir integrarse. Esto es literalmente tan libre de fricciones como puede ser la puesta en funcionamiento del modelo. Aunque este aparentemente es un concepto trivial, a lo largo de los años, tuvimos que explicarlo muchas veces porque la mayoría de los modeladores estaban acostumbrados a herramientas estadísticas tradicionales donde este nivel de usabilidad ha sido prácticamente impensable o han aprendido Machine Learning con herramientas de código abierto como scikit-learn donde las preocupaciones de operacionalización del mundo real nunca fueron parte del diseño original.

La última década ha sido testigo de una multitud de profesionales con diferentes antecedentes que se apresuraron a la ciencia de datos, ya que se anunciaba continuamente como el trabajo más sexy del siglo 21. Poco después de comenzar, muchos descubrieron por las malas que las dos partes más críticas de poner a trabajar la ciencia de datos están lejos de ser esfuerzos atractivos: la preparación de datos y las operaciones de modelos. ¡Pero alguien todavía tiene que hacer el trabajo sucio! La mayoría de las veces esas tareas cruciales terminaron siendo abordadas manualmente mientras que, al mismo tiempo, irónicamente, la “parte científica” de la construcción de modelos estaba siendo completamente automatizada por herramientas de aprendizaje automático de próxima generación.

En consecuencia, a pesar de que el aprendizaje automático se ha puesto de moda y ha comenzado a recibir una gran atención en las reuniones de la junta directiva corporativa desde hace un tiempo, muchas empresas todavía están atrapadas en la primera o segunda marcha cuando se trata de obtener retornos significativos de sus inversiones. Las empresas que inician sus viajes de aprendizaje automático con suposiciones incorrectas luchan por impulsar la producción de modelos predictivos individuales construidos sobre una mezcla de herramientas y bibliotecas de código abierto. Aquellos que logran hacerlo, pronto se dan cuenta de que este enfoque de ML Ops frágil y basado en código adhesivo no logra escalar a muchos más casos de uso y modelos, mientras acumula más y más deuda técnica con el tiempo.

Para abordar esta brecha, ha aparecido una nueva generación de herramientas y servicios bajo la categoría general de ML Ops. Sin embargo, en lugar de centrarse en solucionar el problema de diseño original antes mencionado, terminaron agregando otra capa de complejidad a la plomería empresarial. Lo hicieron por:

  • Centrarse en poner en funcionamiento modelos individuales, lo que hace que sea muy difícil implementar flujos de trabajo de aprendizaje automático sofisticados que requieran múltiples modelos y los recursos de los que dependen.

  • Fallar en la integración completa con las herramientas utilizadas para construir dichos modelos, de modo que todas las tareas posteriores, como el monitoreo y el reentrenamiento, se desconecten y dificulten cerrar el ciclo de aprendizaje con retroalimentación oportuna sobre los resultados comerciales.

  • Lo que dificulta la resolución de problemas de producción debido a la trazabilidad y reproducibilidad subóptimas, ya que los equipos de DevOps y los ingenieros de ML tienen que saltar de una herramienta a otra para armar la imagen completa.

Ingresa a BigML Ops

Hoy, en respuesta a los desafíos anteriores, abrimos las puertas a todos nuestros suscriptores para que prueben BigML Ops. Los usuarios de BigML ahora podrán definir una aplicación, incluir todos sus flujos de trabajo de BigML y los recursos asociados, contener todo e implementar sus contenedores en entornos de producción con notable facilidad. BigML Ops se enfoca en operacionalizar sistemáticamente flujos de trabajo completos con reproducibilidad y trazabilidad integradas. Esencialmente, se han codificado años de lecciones aprendidas para ayudar a los clientes empresariales en BigML Ops para que cualquier organización pueda operar miles de modelos simultáneos de aprendizaje automático en la manera de las mejores prácticas. Vale la pena destacar las siguientes características, ya que distinguen a BigML Ops del resto:

  • Al más puro estilo BigML, los contenedores habilitados para BigML Ops proporcionan puntos finales para cada uno de los modelos individuales que puedan contener.

  • Además, cada modelo es emparejado automáticamente con un detector de anomalías que rastrea el rendimiento de ese modelo y activa eventos siempre y cuando se alcancen ciertos umbrales.

  • Finalmente, estas capacidades se proporcionan en una interfaz de usuario fácil e intuitiva que te permitirá crear y operar cientos de aplicaciones simultáneas de aprendizaje automático sin problemas.

En resumen, BigML Ops automatiza todo el ciclo de vida de Machine Learning para que puedas concentrarte en resolver tus problemas comerciales en lugar de crear y mantener tu propia infraestructura de ML Ops. BigML Ops ahorra tiempo con la automatización integral y aumenta la productividad basada en datos al permitir casos de uso más predictivos en producción sin tener que agregar personal adicional de DevOps. Gracias a su diseño en contenedores, BigML Ops incorpora un proceso integral de desarrollo, implementación y gestión del ciclo de vida de Machine Learning para permitir aplicaciones ML reproducibles, comprobables y evolutivas para empresas a escala.

Tags :

Author: Iván Torres
Author: Iván Torres

Iván Torres actualmente cuenta con una Maestría en Ciencias en Analítica de Negocios e Inteligencia Artificial Aplicada, otorgada por la Universidad de Charleston (West Virginia, USA), también es profesor de Ingeniería y Maestría en la Universidad TecMilenio, y ha contribuido en diferentes proyectos tecnológicos como analista, consultor y líder para empresas de ámbito internacional acumulando más de 15 años de experiencia en los campos de desarrollo de Software, Big Data, analítica de negocio e I.A. Editor de About Data Blog.

Deja un comentario

Categories

Related Post