deployr knowledge transfer

Pandas vs. Polars: Cómo elegir la mejor librería para trabajar con tus datos

A cargo de:

Fabricio Loor

Fabricio Loor

Data Engineer

En esta segunda edición de los Deployr Knowledge Transfer, Fabricio Loor, Data Engineer en deployr, hizo un benchmark técnico con más de 10 operaciones sobre el mismo dataset para analizar el desempeño de Polars y de Pandas.

📋 Temario

Introducción al mundo del data wrangling, un proceso esencial en el tratamiento de datos.

Exploraremos las características fundamentales de Pandas que lo convierten en una herramienta indispensable para el análisis de datos en Python.

Descubrirás las principales características de Polars, una librería de manipulación de datos inspirada en Pandas pero diseñada para manejar eficientemente grandes volúmenes de datos, y cómo se compara con su contraparte.

Realizaremos un análisis detallado y un benchmark técnico utilizando datos de Spotify.

Veremos ejemplos prácticos basados en nuestra experiencia en deployr trabajando con Pandas y Polars en proyectos para diferentes clientes.

Aprendé cómo incorporar estas herramientas a tu práctica, trabajes en Python o SQL.

  • Carga de datos (Load, batch, dump)
  • Operaciones sobre columnas (select, filter, add, concat, sort, group by)
  • Transformaciones (imputaciones, to dict)
  • Descriptores (describe, summarize)
Resumen las principales conclusiones del webinar, destacando las diferencias clave entre Pandas y Polars, las mejores prácticas para trabajar con cada una y cómo elegir la opción más adecuada para tus necesidades específicas de análisis de datos.

Disfruta del replay

¿Tenés ganas de seguir los experimentos, o de incorporar Polars a un proyecto tuyo? Te compartimos el código del benchmark para que puedas arrancar a toda marcha.

No te pierdas el próximo DKT

Suscribite a nuestra lista de difusión y recibí en tu correo las próximas fechas de nuestros webinars e iniciativas pensadas para ayudarte a llevar hacia adelante y hacia el futuro los proyectos de datos de tu organización.

© 2024 deployr. Todos los derechos reservados.
enfoques deployr

Foundations

Para construir una torre, primero hay que colocar los cimientos más sólidos.

Para aquellas empresas que necesitan diseñar y consolidar una arquitectura de datos.

Lo más importante es que tu organización pueda apropiarse de los datos y que éstos estén a tu disposición, y no al revés.

deployr foundations se centra en la construcción de un data lake / data warehouse y en la capacitación en su uso y explotación mediante herramientas de BI.