deployr knowledge transfer
Pandas vs. Polars: Cómo elegir la mejor librería para trabajar con tus datos
A cargo de:

Fabricio Loor
Data Engineer
En esta segunda edición de los Deployr Knowledge Transfer, Fabricio Loor, Data Engineer en deployr, hizo un benchmark técnico con más de 10 operaciones sobre el mismo dataset para analizar el desempeño de Polars y de Pandas.
📋 Temario
Introducción: Data wrangling en un proceso de datos
Introducción al mundo del data wrangling, un proceso esencial en el tratamiento de datos.
Pandas: Principales características
Exploraremos las características fundamentales de Pandas que lo convierten en una herramienta indispensable para el análisis de datos en Python.
Polars: Principales características
Descubrirás las principales características de Polars, una librería de manipulación de datos inspirada en Pandas pero diseñada para manejar eficientemente grandes volúmenes de datos, y cómo se compara con su contraparte.
Comparativa de alto nivel
Realizaremos un análisis detallado y un benchmark técnico utilizando datos de Spotify.
Casos de uso
Veremos ejemplos prácticos basados en nuestra experiencia en deployr trabajando con Pandas y Polars en proyectos para diferentes clientes.
Cómo abordarlos desde Python y SQL
Aprendé cómo incorporar estas herramientas a tu práctica, trabajes en Python o SQL.
Benchmark técnico
- Carga de datos (Load, batch, dump)
- Operaciones sobre columnas (select, filter, add, concat, sort, group by)
- Transformaciones (imputaciones, to dict)
- Descriptores (describe, summarize)
Conclusiones
Resumen las principales conclusiones del webinar, destacando las diferencias clave entre Pandas y Polars, las mejores prácticas para trabajar con cada una y cómo elegir la opción más adecuada para tus necesidades específicas de análisis de datos.