3.1. Contexto do Projeto
A Cash Insurance é uma operadora de planos de saúde (Business Case da FNAT) que enfrentava uma crise grave de desequilíbrio atuarial e asfixia de fluxo de caixa. O modelo de precificação padrão estava engessado em tabelas estáticas que não refletiam o risco real do segurado.
Esse modelo gerou um cenário de subsídio cruzado financeiro. Na prática, clientes mais jovens e saudáveis (o motor de lucratividade da carteira) estavam pagando prêmios desproporcionalmente altos para cobrir o déficit gerado por grupos de alto risco, cujos custos assistenciais ultrapassavam a receita arrecadada. Antes deste dashboard, a diretoria operava às cegas através de planilhas desconexas, observando a margem derreter sem conseguir isolar os "ralos" financeiros.
3.2. Objetivos do Projeto
O projeto visava construir um pipeline de inteligência analítica para estancar a perda de margem, focado em:
- Objetivo Principal: Eliminar o desequilíbrio contábil recalibrando os prêmios, com a meta inegociável de garantir exatos 75% de Sinistralidade Alvo em todos os segmentos.
- Centralização Preditiva: Utilizar Inteligência Artificial para agrupar matematicamente os perfis de risco da base ativa.
- Visibilidade Executiva: Traduzir algoritmos estatísticos em uma Demonstração do Resultado do Exercício (DRE) gerencial automatizada via Power BI.
3.3. Dados e Modelagem
Os dados foram extraídos do ERP de faturamento e dos relatórios de custos assistenciais (sinistros). O processo ocorreu em granularidade de contrato/beneficiário, cobrindo o período de 12 meses de utilização.
Utilizamos Python para rodar o algoritmo não supervisionado K-Means, clusterizando a carteira com base nas variáveis Idade, IMC e Custo Assistencial. Após o Elbow Method, definimos 4 clusters ótimos. A base enriquecida foi armazenada em um banco relacional PostgreSQL.
from sklearn.cluster import KMeans
Mapeando o Risco Atuarial
Definindo 4 clusters de acordo com a análise do Método do Cotovelo
kmeans = KMeans(n_clusters=4, random_state=42)
df['Cluster_Risco'] = kmeans.fit_predict(df[['Idade', 'IMC', 'Custo_Assistencial']])
Lógica financeira do reequilíbrio contábil
O Novo Prêmio deve garantir exatamente a rentabilidade exigida pela diretoria
meta_sinistralidade = 0.75
df['Novo_Premio_Calculado'] = df['Custo_Assistencial'] / meta_sinistralidade
No Power BI, foi construído um modelo Star Schema. Medidas DAX avançadas foram desenvolvidas para processar o recálculo dinâmico da DRE (calculando Receita Projetada = SUMX(Tabela, [Novo_Premio_Calculado]) e Sinistralidade = DIVIDE([Total Custos], [Receita Projetada])).
3.4. Visão Geral do Dashboard
O painel foi desenhado focado na tomada de decisão do C-Level, dividido em duas visões fundamentais:
- Visão de Risco e Dispersão: Um gráfico de Nuvem de Pontos (Dispersão) que cruza Idade e Custo Assistencial, ilustrando visualmente os 4 clusters criados pelo K-Means. Ao lado, um gráfico de Colunas tira a prova entre a Sinistralidade Atual vs. Projetada.
- P&L e Matrizes Financeiras: Uma página dedicada à DRE Gerencial. Duas matrizes comparam as linhas de Receita, Custo e Margem Operacional lado a lado (Cenário Antigo vs. Cenário com IA).
3.5. Insights de Negócio
A análise algorítmica revelou que o Cluster 1 (composto majoritariamente por segurados mais velhos e com alto IMC) operava com uma sinistralidade acima de 120%, sangrando o caixa da empresa. Os Clusters 2 e 3 (jovens saudáveis) possuíam sinistralidade de 40%, indicando que a empresa estava superfaturando para reter esse grupo e arriscando perdê-los para a concorrência. O risco identificado era o colapso do portfólio se a base saudável optasse por churn (cancelamento).
3.6. Perspectiva Contábil e Financeira
Em projetos de dados avançados, o modelo estatístico só se prova eficaz se gerar resultado no caixa. O desenvolvimento da Demonstração do Resultado do Exercício (DRE) Gerencial parametrizada em DAX foi crucial.
A DRE Projetada comprovou a tese: ao aplicar os novos prêmios, o prejuízo operacional no Cluster de risco foi eliminado, e a Sinistralidade Operacional cravou os exatos 75,00% em 100% dos perfis de segurados. O modelo ajudou a contabilidade gerencial a sair de uma lógica de "apagamento de incêndio" para uma previsibilidade de receita e provisões exatas.
3.7. Perspectiva Jurídica, Governança e Compliance
A precificação em saúde atrai forte escrutínio regulatório da ANS e do Estatuto do Idoso. O uso de Inteligência Artificial para reajustes exige governança ética para não gerar discriminação algorítmica abusiva.
Nota: As análises e segmentações propostas neste case são interpretações analíticas de business intelligence e apoio à gestão corporativa. Elas NÃO constituem parecer jurídico formal.
O projeto atuou em conformidade com a LGPD, garantindo que todo o processamento de dados do K-Means ocorresse de forma estritamente anonimizada, blindando a companhia contra riscos de autuação por vazamento de dados sensíveis de saúde (PHI).
3.8. Qualidade dos Dados e Limitações
Embora o banco de dados ofereça granularidade perfeita por CPF anonimizado, a principal limitação analítica do modelo K-Means é a sua natureza de aprendizado não supervisionado focado no presente (uma fotografia estática). Ele segmenta perfeitamente os custos que já ocorreram, mas requer rotinas de re-treinamento e novas cargas via PostgreSQL para acomodar inflação médica (VCMH) ou o envelhecimento natural da base ativa ao longo dos próximos anos.
3.9. Resultados e Impacto Executivo
- Nivelamento da Margem: Erradicação completa do déficit operacional nas faixas de risco alto, garantindo previsibilidade de lucro líquido (target 75%).
- Otimização de Retenção: O recálculo inteligente reduziu o peso dos prêmios cobrados da carteira jovem, evitando o churn e blindando a base contra a concorrência.
- Automação Gerencial: A consolidação via Views no PostgreSQL e integração ODBC com Power BI reduziu severamente as horas manuais gastas pela controladoria fechando planilhas no fim do mês.
3.10. Tech Stack do Projeto
A arquitetura técnica deste projeto combinou robustez em engenharia e visualização:
- Power BI: Modelagem Star Schema, Data Storytelling, Formatação Condicional executiva.
- Linguagem DAX: Cálculos de inteligência financeira e DRE parametrizada.
- Python (Scikit-Learn, Pandas): Scripting para limpeza de dados e clusterização preditiva via algoritmo K-Means.
- SQL & PostgreSQL: Criação de Views matemáticas para recálculo de prêmio no servidor.
- ODBC: Integração de dados direta entre banco relacional e camada semântica.
3.11. Aprendizados e Próximos Passos
Sob a ótica estratégica, o principal aprendizado foi validar como regras matemáticas complexas só ganham adesão da diretoria quando traduzidas para o idioma contábil. No aspecto técnico, o próximo passo evolutivo para a Cash Insurance será integrar modelos supervisionados (ex: Random Forest) capazes de prever a probabilidade exata de um novo contrato se tornar deficitário antes mesmo de emitir a apólice, blindando a "porta de entrada" da operadora.
3.12. Conclusão
A Cash Insurance exemplifica a verdadeira essência do Analytics avançado. O valor de um Analista de Dados Sênior transcende a simples criação de gráficos bonitos; exige malícia financeira, precisão contábil e percepção de riscos jurídicos corporativos.
Ao integrar Python, PostgreSQL e Power BI, saímos de um cenário de colapso de margem por subsídios cruzados cegos para um ecossistema sustentável, justo e previsível. Este case coroa a intersecção perfeita entre ciência de dados e inteligência de negócios.