AWS, Tutoriales

Cómo Aplicar Feature Selection en tu proyecto de Ciencia de Datos

Hola amigxs 🤗

Hoy vamos a hablar sobre feature selection, una técnica de feature engineering que se utiliza para seleccionar las características más relevantes para un modelo de machine learning.

Antes de entrar en detalles, es importante aclarar que el feature engineering es el proceso de preparar los datos para el modelado. Esto incluye la selección, creación y transformación de las características que utilizaremos en nuestro modelo. La feature selection, por su parte, se refiere específicamente a la selección de características.

¿Por qué es importante la feature selection?

Bueno, a veces tenemos muchas características disponibles para un problema dado, pero no todas son necesarias o relevantes para el modelo.

Utilizar todas las características disponibles puede hacer que el modelo sea menos preciso o incluso más lento al ejecutarse.

Además, utilizar características irrelevantes o redundantes puede afectar negativamente el rendimiento del modelo.

¿Cómo podemos seleccionar las características más relevantes para nuestro modelo?

Hay varias técnicas que podemos utilizar, y la elección de la técnica depende del conjunto de datos y del tipo de modelo que estemos construyendo.

Algunas técnicas comunes incluyen:

Filtrado

Esta técnica se basa en medidas estadísticas para seleccionar las características más relevantes. Por ejemplo, podríamos utilizar la correlación de Pearson para seleccionar las características más correlacionadas con la variable objetivo.

Aquí te dejo un ejemplo de cómo podríamos utilizar la correlación de Pearson en Python:

Captura de pantalla que muestra un ejemplo de cómo utilizar la correlación de Pearson en Python

Wrapper

Esta técnica utiliza el modelo de machine learning como un “envoltorio” para seleccionar las características. Por ejemplo, podríamos utilizar un modelo de regresión lineal y ir eliminando características una a una, eval.

Aquí te dejo un ejemplo de cómo podríamos utilizar la técnica de wrapper en Python:

Captura de pantalla que muestra un ejemplo de cómo utilizar la técnica de wrapper en Python

Embedded

Esta técnica incluye la selección de características como parte del proceso de entrenamiento del modelo. Por ejemplo, algunos algoritmos de árboles de decisión incluyen una función de selección de características automática.

Un ejemplo de cómo podríamos utilizar la técnica de embedded en Python es el siguiente:

Captura de pantalla que muestra un ejemplo de cómo utilizar la técnica de embedded en Python

Espero que hayas podido entender cómo funcionan las diferentes técnicas de feature selection y cómo podríamos utilizarlas en Python.

Recuerda que la feature selection es una tarea clave en el proceso de modelado de machine learning, ya que nos ayuda a mejorar la precisión y el rendimiento de nuestros modelos al eliminar características irrelevantes o redundantes.

Para terminar, quiero dejarte con una reflexión final: A veces nos tentamos a utilizar todas las características disponibles pensando que más es mejor. Sin embargo, como hemos visto, utilizar características irrelevantes o redundantes puede afectar negativamente el rendimiento del modelo.

Por eso, la feature selection es clave para construir modelos más precisos y robustos. Así que no olvidemos dedicar tiempo y esfuerzo a esta tarea durante el proceso de modelado.

¡Ojala que hayas disfrutado este artículo sobre feature selection!

Si tienes alguna duda o quieres compartir algún ejemplo de cómo has utilizado esta técnica en tu trabajo como Data Scientist, no dudes en dejar un comentario. ¡Hasta la próxima! 🤗

📌 Tags:

Feature Selection, Python

¡Compartilo! 🚀

Darío Abadie

También te puede interesar 👇

DBT en acción: construí la capa de marts que conecta tus datos con el negocio

Valentín Chab

Cómo usar contenedores custom en SageMaker para inferencia con LightGBM (guía paso a paso)

Fernando Loor

Imagen destacada para el artículo sobre vibe coding con IA: programar asistido por inteligencia artificial, con creatividad y control

Vibe coding con IA: 10 buenas prácticas para codear rápido (sin perder el control)

Darío Abadie

Compartimos lo que aprendemos descubrimos enseñamos creamos

Ningún desarrollo científico está completo hasta que no se comparte con la comunidad. En nuestro blog vas a encontrar algunas técnicas, aprendizajes y prácticas útiles para desarrollar tu potencial y el de tu organización.

👉 Categorías

AWS, Tutoriales

📌 Temáticas

Feature Selection, Python

☕ Últimos posts

▶️ Dale Play

En nuestro canal de YouTube encontrá nuestros webinars, clases y tutoriales.

CURSO: BUENAS PRÁCTICAS DE DESARROLLO 💻

Cómo Aplicar Feature Selection en tu proyecto de Ciencia de Datos

¿Por qué es importante la feature selection?

¿Cómo podemos seleccionar las características más relevantes para nuestro modelo?

Filtrado

Wrapper

Embedded

Recuerda que la feature selection es una tarea clave en el proceso de modelado de machine learning, ya que nos ayuda a mejorar la precisión y el rendimiento de nuestros modelos al eliminar características irrelevantes o redundantes.

📌 Tags:

¡Compartilo! 🚀

Darío Abadie

También te puede interesar 👇

DBT en acción: construí la capa de marts que conecta tus datos con el negocio

Cómo usar contenedores custom en SageMaker para inferencia con LightGBM (guía paso a paso)

Vibe coding con IA: 10 buenas prácticas para codear rápido (sin perder el control)

Compartimos lo que aprendemos descubrimos enseñamos creamos

👉 Categorías

📌 Temáticas

☕ Últimos posts

DBT en acción: construí la capa de marts que conecta tus datos con el negocio

Cómo usar contenedores custom en SageMaker para inferencia con LightGBM (guía paso a paso)

Vibe coding con IA: 10 buenas prácticas para codear rápido (sin perder el control)

▶️ Dale Play

Compartimos lo que sabemos

Llevamos adelante y hacia el futuro tus proyectos de datos 🚀

© 2025 deployr | Todos los derechos reservados

Del laboratorio a la implementación

Contactanos

Podemos ayudarte a que tus modelos de machine learning lleven a tu organización a un nuevo nivel. Completá el formulario y a la brevedad te contactaremos.

Si preferís enviarnos un correo hacelo a info@deployr.ai

enfoques deployr

Foundations

Para construir una torre, primero hay que colocar los cimientos más sólidos.

Lo más importante es que tu organización pueda apropiarse de los datos y que éstos estén a tu disposición, y no al revés.