Skip to content

d4nnABR/TelecomX-Challenge-ALURA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

Análisis del Churn de Clientes en Telecom X 📉

Introducción

Este proyecto se enfoca en el análisis del abandono de clientes (Churn) en Telecom X, una empresa de telecomunicaciones que ofrece servicios de telefonía, internet y streaming.

El objetivo es identificar las causas subyacentes de la fuga de clientes y proponer estrategias para mitigarla.

El análisis se divide en varias etapas clave:

  • Extracción de datos: Obtención y estructuración de la información.
  • Limpieza y transformación: Preparación de los datos para el análisis.
  • Análisis exploratorio (EDA): Descripción y visualización de las variables.
  • Análisis del Churn: Identificación de los factores que influyen en el abandono.

El resultado de este trabajo servirá como base para el desarrollo de futuros modelos predictivos que ayuden a la empresa a retener a sus clientes de manera proactiva.


1. Extracción y Conversión a DataFrame 📥➡️📊

El análisis se inicia con la extracción de datos de un archivo JSON anidado desde la siguiente URL:
TelecomX_Data.json

El archivo se procesó utilizando Pandas en Python para normalizar la estructura y convertirla en un DataFrame tabular, un formato ideal para el análisis de datos.


2. Transformación y Limpieza de Datos 🧹✨

En esta etapa, se llevó a cabo un riguroso proceso de ETL (Extracción, Transformación, Carga) para asegurar la calidad y consistencia de los datos.

Acciones de Limpieza y Transformación:

  • Renombrado de Columnas: Las columnas se renombraron al español para una mayor claridad.
    Ejemplo: customer_genderGenero.

  • Manejo de Valores Nulos y Vacíos:

    • Se encontraron valores NaN en la columna Cargo_total.
    • Valores vacíos ('') en Abandono_cliente.
    • Ambos se imputaron con la mediana de sus respectivas columnas.
  • Creación de Nueva Columna: Se generó la columna Cuentas_diarias para un análisis más granular.

  • Conversión de Tipos de Datos: Columnas numéricas en formato object se convirtieron a float o int.

  • Codificación de Variables Categóricas:

    • Variables binarias (Sí/No, Male/Female) → 1 / 0.
    • Variables multiclase (Tipo_de_contrato, Metodo_de_pago) → valores numéricos.
  • Validación: No quedaron filas duplicadas y los tipos de datos fueron correctos.


3. Análisis Exploratorio de Datos (EDA) 🔍📈

El EDA permitió describir las principales características de los clientes y sus servicios.

Descripción de Columnas Numéricas:

  • Se analizó la distribución de Antiguedad_meses, Cargo_mensual y Cargo_total.
  • Resultado: la mayoría de clientes son nuevos y tienen cargos relativamente bajos.

Descripción de Columnas Categóricas:

Columna Valores (%)
Genero Male = 50.6%, Female = 49.4%
Tipo_de_contrato Mes a Mes = 55.1%, Anual = 20.9%, Bianual = 24.0%
Metodo_de_pago Electronic check = 33.6%, Mailed Check = 22.9%, Credit Card = 21.9%, Bank Transfer = 21.6%
Servicio_internet Fibra Óptica = 44.0%, DSL = 34.2%, Sin Servicio = 21.8%

4. Visualización y Análisis del Churn 💔📊

Tasa General de Abandono

  • El 25.7% de los clientes abandonaron el servicio.
  • Esta cifra subraya la urgencia de identificar y mitigar las causas del churn.

Matriz de Correlación (Pearson)

  • Antiguedad_meses → correlación negativa -0.34.
  • Tipo_de_contrato → correlación negativa -0.39 (contratos largos reducen el abandono).
  • Servicio_internet → correlación positiva 0.31 (fibra óptica relacionada con mayor abandono).

Variables Clave

  • Antigüedad vs. Abandono: 53% de abandono en clientes con 0–4 meses.
  • Contrato Mes a Mes → mayor tasa de churn.
  • Fibra Óptica sin servicios adicionales → mayor abandono.
  • Método de Pago: Cheque Electrónico asociado con más abandono.

5. Caracterización del Cliente Propenso al Abandono

El perfil más riesgoso:

  • Antigüedad: 0 a 9 meses (47.9% de los que abandonan).
  • Contratar Fibra Óptica.
  • No contratar servicios adicionales.
  • Tener contrato Mes a Mes.
  • Pagar con Cheque Electrónico.

6. Recomendaciones para Mitigar el Churn 💡

  • Incentivar contratos de larga duración (descuentos y promociones).
  • Crear paquetes de servicios adicionales (seguridad, soporte, respaldo).
  • Mejorar calidad de Fibra Óptica (resolver problemas técnicos).
  • Optimizar métodos de pago (impulsar tarjeta y transferencia bancaria).
  • Programas de retención para clientes nuevos (seguimiento en primeros meses).

7. Próximos Pasos: Modelos Predictivos 🤖

El DataFrame limpio y listo para su uso se encuentra en este repositorio.

La siguiente fase será la creación de modelos predictivos de Machine Learning, que permitirán:

  • Identificar clientes en riesgo de abandono.
  • Aplicar estrategias proactivas de retención.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors