deployr KNOWLEDGE TRANSFER

Data Quality: Estrategias y Herramientas para Mejorar la Calidad de tus Datos

Inscribite sin cargo

El webinar quedará grabado, por lo que si no podés presenciarlo en vivo inscribite igual para recibir el replay.

La base de todo proyecto exitoso de ML

Los datos constituyen la materia prima fundamental en cualquier proyecto de Machine Learning.

Aunque contemos con algoritmos poderosos, técnicas innovadoras y el vasto poder computacional de la nube, nada de ello será efectivo si no podemos asegurar la calidad de la fuente de nuestros datos.

Cuando un data scientist comienza su labor, su primer paso es analizar los datos para comprender a fondo el problema que desea resolver. Es común que durante este proceso se detecten una serie de errores e inconsistencias que pueden afectar directamente los resultados de su trabajo.

La confianza es clave y puede verse seriamente comprometida en un proyecto frente a datos nulos, faltantes, erróneos o desactualizados

Afortunadamente, hoy en día los developers cuentan con una amplia gama de herramientas –como PyDeequ, Great Expectations y otras– que les permite subsanar este tipo de problemas de una manera sencilla y escalable.

Implementando Data Quality

Prevenir es Curar 🔍

La implementación de modelos de Machine Learning requiere no sólo velar por la calidad del modelo, sino también por la calidad de los datos.

En este webinar, Fernando Loor, Data Developer de deployr, compartirá los puntos más importantes de esta área tan crítica, para que puedas replicar estos preceptos en el contexto de tus proyectos:

⚠️  Este webinar está diseñado para desarrolladores , ya que compartiremos herramientas técnicas destinadas a la creación de código escalable y replicable para la validación de datos a lo largo de las distintas etapas de un proceso de datos.

deployr knowledge transfer

Data Quality: Estrategias y Herramientas para Mejorar la Calidad de tus Datos

A cargo de:

Fernando Loor

Fernando Loor

Data Developer

📋 Temario

  • Concepto de Data Quality
  • Impacto de la mala calidad de datos
  • Causas del data downtime
  • Dimensiones de la Calidad de Datos
  • Métricas de calidad de datos
  • Mejora y Mantenimiento de la Calidad de Datos
  • Principales características de las herramientas de DQ
  • Herramientas open source de DQ
  • PyDeequ y Great Expectations

Espacio abierto para preguntas y discusión con los participantes.

© 2024 deployr. Todos los derechos reservados.
enfoques deployr

Foundations

Para construir una torre, primero hay que colocar los cimientos más sólidos.

Para aquellas empresas que necesitan diseñar y consolidar una arquitectura de datos.

Lo más importante es que tu organización pueda apropiarse de los datos y que éstos estén a tu disposición, y no al revés.

deployr foundations se centra en la construcción de un data lake / data warehouse y en la capacitación en su uso y explotación mediante herramientas de BI.