1. Contexto do Projeto
A Insight Academy, uma plataforma digital de educação (EdTech), enfrentava um paradoxo perigoso. Embora a empresa registrasse um alto volume de vendas e possuísse uma base consolidada de 45.815 alunos, a diretoria percebia um baixo engajamento crônico e dificuldades em extrair Lifetime Value (LTV).
O problema residia na forma genérica como a base era analisada. A crença gerencial no "aluno médio" mascara o comportamento real: faturamento inicial alto gera uma falsa sensação de Sucesso do Cliente. Faltava inteligência de dados para cruzar níveis de fricção financeira (PIX vs. Cartão de Crédito) com taxas de adoção da plataforma.
2. Objetivos do Projeto
- Descobrir Personas Matemáticas: Utilizar algoritmos não supervisionados para agrupar clientes por comportamento real, não por achismos de marketing.
- Mitigar Risco de Churn: Identificar e mensurar financeiramente os clientes inativos, classificando o nível de urgência.
- Direcionar Ações de CS (Customer Success): Criar uma ferramenta tática diária para que a equipe saiba exatamente quem contatar e quando, de forma automatizada e bilíngue.
3. Dados e Modelagem de Machine Learning
O pipeline analítico começou com uma auditoria de 27 variáveis transacionais e comportamentais. Utilizando Python e a biblioteca Scikit-Learn, realizei a Engenharia de Features, selecionando 5 indicadores críticos.
A etapa fundamental foi a aplicação do StandardScaler. Como algoritmos de distância espacial são sensíveis a variáveis de tamanhos diferentes, foi imperativo nivelar o peso de cada métrica (para que 400 "Dias Inativos" não esmagassem o peso de 12 "Parcelas"). Em seguida, o modelo K-Means foi processado. O número ideal de perfis (K=4) foi comprovado matematicamente pelo Método do Cotovelo (Elbow Method) e validado pelo Silhouette Score.
Com os clusters gerados, migramos para o Power BI utilizando um Star Schema: uma tabela Fato (f_Clientes) conectada a tabelas Dimensão (d_Clusters, d_Pagamento), permitindo flexibilidade analítica e performance.
4. Visão Geral do Dashboard
O painel foi desenhado com foco executivo (Dark Mode com efeito glassmorphism) e é estruturado em 6 páginas bilíngues (Português/Inglês) navegáveis via menu dinâmico:
- Metodologia e Stack (Pg 3): Documenta o rigor científico, apresentando o gráfico de validação matemática (Elbow Method) e a esteira de dados.
- Visão Executiva (Pg 4): Foco no C-Level. Cartões com Total de Alunos (45.815), Média de Acessos, e gráficos 100% empilhados cruzando Cluster vs. Meio de Pagamento.
- Central de CS (Pg 5): O painel tático operacional. Gráfico de dispersão (Engajamento vs. Inatividade) e uma Matriz com formatação condicional vermelha para destacar instantaneamente clientes com mais de 90 dias inativos.
5. Insights de Negócio
O algoritmo revelou 4 personas exatas: Compradores de Impulso (46,7%), Assinantes Fantasmas (40,5%), Usuários PIX Parcelado (8,5%) e Embaixadores (4,2%).
A análise evidenciou que os Usuários de PIX Parcelado apresentam engajamento ligeiramente superior aos usuários de Cartão de Crédito. A ausência do limite comprometido do cartão cria uma jornada psicológica de compra mais leve, sutilmente refletida na retenção de acesso.
6. Perspectiva Contábil
Do ponto de vista financeiro, focamos na distinção entre faturamento presente e receita futura.
Identificamos 9.626 assinantes recorrentes com risco crítico (>90 dias sem acessar). Isso cria um "Passivo Oculto": a DRE atual é inflada por mensalidades automáticas no cartão de crédito, mas a inatividade garante que haverá um abandono em massa no ciclo de renovação, exigindo forte ajuste em provisões de caixa futuro.
7. Perspectiva Jurídica, Risco e Compliance
Sob a ótica de compliance e risco regulatório do consumidor, um alto volume de "Assinantes Fantasmas" gera passivo em potencial para chargebacks ou disputas judiciais alegando falta de prestação de serviço ou cobrança indevida, mesmo com contratos firmados.
Nota Analítica Legal: Embora este dashboard não seja um parecer jurídico, ele serve como sistema de alerta precoce. A matriz de operação na Página 5 permite que a empresa realize ações proativas de rescisão ou win-back, reduzindo a exposição da marca no PROCON ou judicializações. Os dados foram tratados respeitando estritamente a LGPD.
8. Motor Analítico Bilíngue em DAX
Para garantir fluidez na troca de idiomas (PT/EN) sem duplicar visuais ou forçar cálculos pesados de performance, construí Parâmetros de Campo no Power BI. Abaixo, um exemplo de como estruturei as métricas de Risco (Passivo Oculto) atreladas à seleção de idioma:
// Cálculo parametrizado do Passivo Oculto garantindo adaptação bilíngue e precisão contábil
Titulo_Card_Passivo =
VAR IdiomaSelecionado = SELECTEDVALUE('Idioma_Cluster'[Idioma_Cluster]; "🇧🇷 Português")
RETURN
IF(
IdiomaSelecionado = "🇺🇸 English";
"Hidden Liability (Students)";
"Passivo Oculto (Alunos)"
)
Passivo Oculto (Alunos) =
CALCULATE(
[Total de Alunos];
'f_Clientes'[Recorrente] = 1;
'f_Clientes'[Dias sem Acessar] >= 90;
'd_Clusters'[Cluster_ID] = 1 // Refere-se especificamente ao grupo Assinantes Fantasmas
)
9. Resultados e Próximos Passos
A estruturação do painel mudou a cultura de CS da empresa. Em vez de ligações aleatórias baseadas em volume, a equipe agora foca as energias nos primeiros 15 dias do cluster "Compradores de Impulso", impedindo matematicamente a sua migração para a área de inatividade crítica.
Deploy do Modelo: O próximo passo tecnológico do projeto é a produtização do modelo (Deploy via API). O objetivo é acoplar o algoritmo K-Means diretamente ao CRM, classificando os alunos instantaneamente durante o onboarding e disparando esteiras automatizadas de retenção.
10. Conclusão
A execução deste estudo de caso comprova que projetos de dados de alto nível vão muito além de dashboards esteticamente agradáveis. Ao fundir Machine Learning, regras de negócios financeiras (previsão de DRE), e design analítico de UI/UX, entregamos uma ferramenta de governança em tempo real que protege a saúde do caixa da empresa e mitiga riscos de escala.