¿Qué es Churn Analytics y cómo lo utilizan eficazmente las empresas de telecomunicaciones en sus actividades diarias? Aprende de la experta en la industria Sakshi Gujral, quien te guiará a través de todos los detalles esenciales y te ofrecerá algunos consejos para mejorar los resultados del análisis de abandono cuando se aplica de forma práctica.
Sakshi Gujral trabaja actualmente como científica de datos en Concentrix y está cursando su doctorado en IIIT-Delhi. Es becaria GATE y calificadora UGC-NET, y exalumna de la Organización de Desarrollo de Investigación de Defensa. Sakshi cuenta con 5 años de experiencia en industrias como TCS y Genpact, resolviendo problemas de ciencia de datos en los dominios de finanzas, atención médica y telecomunicaciones. Ha realizado investigaciones en campos como el aprendizaje automático, el procesamiento del lenguaje natural y el Internet de las cosas.
Tabla de contenido
- Churn Analytics en las industrias de telecomunicaciones
- ¿Qué es Churn Analytics?
- Uso de ciencia de datos y análisis para evaluar la tasa de abandono
- Análisis exploratorio de datos exhaustivo
- Descripción del conjunto de datos
- Cuaderno práctico de Python
- Conclusión
Churn Analytics en las Industrias de Telecomunicaciones
La retención de clientes es importante para que las empresas analicen su crecimiento y estrategias de trabajo efectivas. Sakshi discutirá los factores que constituyen la degradación del negocio debido a la rotación, especialmente en Telcos.
¿Qué es Churn Analytics?
Para entenderlo de forma sencilla, imaginemos a un niño llamado Rahul que solía comprar comestibles en tiendas minoristas. Hoy en día, Rahul realiza sus compras en tiendas en línea. Por lo tanto, Rahul representa el “abandono” de las tiendas minoristas. Cuando un cliente de la empresa X deja de utilizar sus servicios para cambiar a otra empresa proveedora Y, dicho cliente se considera un caso de “abandono” para la empresa X. Las razones para esto pueden incluir mejores beneficios, opciones más atractivas, servicios de atención al cliente de mayor calidad, entre otros. Churn Analytics ayuda a identificar estos factores.
Cuando una empresa enfrenta tasas altas de abandono, sus ingresos disminuyen y, por ende, también su valor en el mercado. Esto puede resultar en despidos y en una pérdida de valor de marca. Es crucial abordar la tasa de abandono para mejorar la estrategia comercial antes de enfrentar una posible quiebra.
En los últimos años, se ha notado que millones de personas se cambiaron a alguna compañía de telecomunicaciones en particular porque proporcionaba datos y servicios de llamadas gratuitos. Debido a la sencilla aplicación en línea y la entrega a domicilio de la tarjeta SIM, las personas suelen transferir su proveedor de servicios para obtener mejores experiencias.
Por lo tanto, es necesario cuidar la tasa de abandono para mejorar la estrategia comercial antes de quebrar.
Algunas industrias donde el análisis de abandono tiene un gran impacto incluyen las telecomunicaciones, la industria del juego, tiendas locales, restaurantes, bancos y centros comerciales.
Uso de ciencia de datos y análisis para evaluar la tasa de abandono
Ahora entenderemos este problema desde una perspectiva de ciencia de datos y análisis.
- Adquisición y comprensión del conjunto de datos: Primero, necesitamos los datos completos en un formato digitalizado que contenga todas las características, lo que ayudará a analizar la rotación. Para ello, utilizaremos el código python con un conjunto de datos estándar, que nos ayudará a obtener una visión general de cómo deberían verse los fragmentos de datos, especialmente para el sector de las telecomunicaciones.
- Datos en enriquecimiento y preparación: En escenarios en tiempo real, siempre reciben los datos en una forma muy desordenada. Entonces, primero, debemos enriquecerlo y prepararlo para que podamos entenderlo fácilmente.
- Análisis exploratorio de datos: Análisis significa encontrar las tendencias ocultas dentro de los datos.
- Manejo del desequilibrio en el conjunto de datos: A menudo, vemos un desequilibrio en el conjunto de datos; puede ocurrir debido a la naturaleza sesgada de una clase o grupo de clientes en particular.
- Realización de Modelado: Usaremos el aprendizaje automático y el modelado de aprendizaje profundo para una mejor comprensión.
- Evaluación y análisis de resultados: Al final, evaluaremos nuestros hallazgos de los procesos anteriores.
Descripción del conjunto de datos: El conjunto de datos que utilizaremos en este proyecto es el “Conjunto de datos IBM Telco Churn”. Tiene 33 (variables independientes) que indican las características de los clientes de una empresa Ficticia de Telecomunicaciones. La columna churn (variable de respuesta) indica si el cliente se fue en los últimos meses. La clase ‘NO’ indica los clientes que no han dejado la empresa en los últimos meses. La clase ‘SI’ indicó los clientes que abandonaron la empresa en los últimos meses.
A continuación se muestra el notebook de Python que Sakshi ha preparado para el proyecto de hoy. Aquí está Telco Churn excel; puedes ver 33 columnas.
A continuación se muestra la imagen de todas las columnas por nombre. Los entenderemos por separado. Todos estos diferentes parámetros nos ayudarán a entender el churn.
Ahora, la columna de destino para nosotros es la “etiqueta de abandono”, como se muestra en la captura de pantalla a continuación. Es SI o NO, como se describió antes.
En el siguiente gráfico circular, podemos ver claramente que el conjunto de datos está sesgado hacia “SI”. Entonces, es importante manejar el desequilibrio de clases aquí. Estamos recibiendo ayuda de SMOTE. SMOTE es una ‘técnica de sobremuestreo de minorías sintéticas’ que ayuda a manejar conjuntos de datos desequilibrados. Entonces, a partir de los conjuntos de datos originales, hemos generado algunas muestras más.
Análisis exploratorio de datos exhaustivo
En el notebook de Python, las tendencias ocultas que ya están en los datos ayudarán a tomar la decisión de qué tipo de modelo de aprendizaje automático debemos aplicar en una etapa posterior.
A continuación se muestran los puntos que vamos a ver en este proyecto.
Ahora, comenzaremos a enriquecer los datos para aplicar modelos de aprendizaje automático. Hemos aplicado una combinación de columnas categóricas y flotantes; necesitamos hacerlos en un formato tal que nuestros algoritmos de aprendizaje automático puedan procesarlos rápidamente. Después del preprocesamiento, extrajimos algunos datos estadísticos como la media y la desviación estándar. En las últimas 2 columnas, se puede ver ‘CLTV’ (clientes que retienen por más tiempo) y ‘motivo de abandono’ (Churn_Reason), que son muy importantes. Entonces, en estos datos de texto, se aplicó MP para encontrar las tendencias que hacen que los clientes se trasladen a otra empresa. También podemos analizar los datos de los datos de otras empresas y diseñar nuestro producto para que los clientes no se vayan en el futuro.
A continuación se muestra la correlación; se puede ver claramente que las variables altamente correlacionadas están cerca de 1. Por ejemplo, los “Cargos totales” (TotalCharges) son 0.93, lo que indica que si los cargos por servicio son económicos, los clientes permanecerán durante un período más prolongado.
Con el siguiente código, estudiaremos la distribución, que es muy importante en cualquier problema de aprendizaje automático. Nos ayuda a decidir qué algoritmo vamos a utilizar de antemano.
Ahora, necesitamos segregar los valores médicos y categóricos. A continuación, se puede ver claramente la parte agitada en términos de distribución de género. Podemos concluir que la agitación en términos de género no tiene mucha diferencia.
En el cuadro a continuación, podemos ver que los clientes que han tomado planes por más períodos de tiempo muestran más retención. Para ellos, la tasa de abandono es mucho menor.
A continuación se muestra un gráfico interesante que muestra que a medida que aumenta la antigüedad, disminuye la posibilidad de abandono.
A través de todos estos gráficos, estamos tratando de averiguar qué factores son responsables de más tasas de abandono y cuáles no. Para que podamos trabajar en las lagunas para disminuir nuestra agitación; por ejemplo, podemos decirle a las compañías de telecomunicaciones que proporcionen planes más extendidos con descuentos para que la tasa de rotación disminuya.
Para la última columna, ‘Razón de abandono’, colocaremos todos los textos de los clientes en forma de nubes de palabras para las que hemos aplicado alguna parte de NLP. Se puede ver todas las razones que contribuyen a la rotación.
El gráfico muestra la relación entre la puntuación de abandono con el código postal, latitud, longitud, permanencia, etc.
Resultados: La siguiente gráfica muestra la distribución de las etiquetas 0 y 1 en los datos de prueba.
Conclusión
Al aplicar análisis y comprender sus implicaciones, las empresas de telecomunicaciones pueden trabajar para mejorar sus planes y reducir el abandono. Este método también puede ser útil en otros sectores como hoteles, tiendas y centros comerciales.
Reflexiones finales
- El medio de pago mediante cheque electrónico presenta las tasas más altas de abandono.
- Los clientes con contratos mensuales son más propensos al abandono, ya que pueden cambiar de proveedor sin penalizaciones.
- Los clientes que no tienen confianza en la tecnología en línea son más propensos a abandonar.
- Las personas que no son de la tercera edad son las más propensas a abandonar los servicios.