IA Financeira

Regressão Logística x Redes Neurais: O que o Bacen realmente aprova?

Para ciência de dados de crédito no Brasil, a escolha técnica entre modelos implica lidar com a auditoria do Bacen; descubra por que a 'explicabilidade' da Regressão Logística ainda vence a precisão das Redes Neurais na hora de justificar a recusa.

Lucas Ferreira
Lucas FerreiraEspecialista em Pagamentos e Bancos Digitais
Imagem editorial ilustrando Regressão Logística x Redes Neurais: O que o Bacen realmente aprova?

Em 2026, a pressão sobre os times de ciência de dados de bancos e fintechs deixou de ser puramente métrica. Não basta mais alcançar um AUC de 0,92 no score de crédito. O que eu vejo no mercado hoje é um cenário onde o melhor modelo, matematicamente falando, pode ser o pior negócio legal e regulatório se você não conseguir explicar o porquê da recusa para o departamento de Compliance e, eventualmente, para o Banco Central.

O auditor do Bacen não quer ver apenas a performance preditiva. Ele quer causalidade e transparência. O foco deste artigo é cortar o hype do "Deep Learning aplicado a tudo" e olhar friamente para o trade-off entre poder de fogo das Redes Neurais e a obediência regulatória da Regressão Logística.

O peso da transparência regulatória na concessão de crédito

A Resolução CMN nº 4.749 e as atualizações normativas subsequentes endureceram a obrigação de fornecer informações claras ao consumidor sobre a decisão de crédito. O problema não é apenas negar o crédito, é fundamentar essa negativa de forma inteligível para o cliente final.

Quando um modelo de Black Box, como uma Rede Neural profunda, nega um empréstimo, a saída nativa é uma probabilidade (ex: 78% de risco de default). O regulador, porém, exige que você aponte quais variáveis determinaram isso. Se o seu algoritmo considera que a interação entre "horário da transação" e "frequência de uso de GPS" elevou o risco, mas você não traduz isso em português claro para o cliente, você está em terreno perigoso.

O custo de uma autuação por falta de transparência ou por discriminação indevida em 2026 gira facilmente em torno de R$ 250.000,00 por infração, sem contar o dano reputacional. O Data Scientist que escolhe o modelo precisa ter essa cifra na cabeça tanto quanto o Loss Function.

Detalhe fotográfico relacionado a Regressão Logística x Redes Neurais: O que o Bacen realmente aprova?

Regressão Logística: O padrão ouro chato que os auditores amam

A Regressão Logística é o "velho confiável". Ela é linear, baseada em odds e, mais importante, os coeficientes dela são diretamente interpretáveis.

Se eu digo ao auditor que a variável "renda mensal" tem um coeficiente positivo de 0,5, ele entende imediatamente: maior renda aumenta a chance de aprovação. Se a "quantidade de atrasos nos últimos 12 meses" tem um coeficiente negativo de -1,2, a lógica é cristalina. A soma desses pesos gera a probabilidade final. Não há magia. Há matemática escolar aplicada a risco.

Essa clareza facilita enormemente a governança. Em uma auditoria, você pode apresentar uma tabela de variáveis e seus respectivos pesos (os betas) e provar que não há discriminação racial ou de gênero, simplesmente mostrando que essas variáveis nem sequer entraram no modelo, ou que seus pesos são estatisticamente insignificantes.

O maior ganho aqui não é precisão, mas defensabilidade. Em 2026, vi casos de fintechs que tiveram que reverter modelos de Machine Learning avançado para regressões simples porque o time jurídico conseguia defender a regressão em 5 minutos e precisava de 3 meses para preparar um laudo sobre LIME ou SHAP para a rede neural.

O dilema das Redes Neurais: performance inexplicável

Não há dúvida de que Redes Neurais (especialmente Deep Learning) e modelos baseados em árvores (como XGBoost ou LightGBM) esmagam a Regressão Logística em termos de capacidade preditiva. Elas capturam interações não lineares complexas que uma função linear jamais veria.

Onde a regressão vê "idade = 30", a rede neural pode ver padrões de comportamento de compra que só aparecem em usuários de 28 a 32 anos que moram em capitais e compram online às terças-feiras. Isso resulta em menos falso negativo (negar crédito para quem pagaria) e menos falso positivo (aprovar quem vai dar calote).

O problema é a opacidade. As redes neurais operam como uma "caixa preta". Mesmo usando técnicas de Explicabilidade (XAI) como SHAP values, você está gerando uma explicação aproximada e pós-hoc. Você não está explicando como o modelo decidiu, mas sim estimando o impacto das variáveis na decisão final.

Para um auditor rigoroso, "estimar" o motivo da recusa é muito diferente de "ter" o motivo da recusa embutido na lógica do modelo. Se o cliente questiona o banco ("Por que negaram meu crédito?"), e você usa uma resposta baseada em SHAP, existe uma margem de erro técnico que advogados especializados em direito do consumidor exploram avidamente. Entenda como a suposta neutralidade da IA pode esconder vieses perigosos nesse contexto.

Quando a complexidade compensa o risco

Existe, porém, um cenário onde as Redes Neurais valem a pena dor de cabeça regulatória: produtos de baixo ticket, alto volume e aprovação instantânea (como o pré-aprovado de limite no cartão de crédito ou empréstimos consignados automatizados).

Nesses casos, o ganho de margem ao reduzir a inadimplência em 0,5% pode representar milhões de reais por ano. Se a instituição possui um time de governança de modelos robusto — algo raro, que exige cientistas dedicados exclusivamente a documentar e validar a XAI — é possível manter redes neurais em produção.

Mas para a maior parte dos bancos médios e fintechs em escala de crescimento, tentar manter um modelo de Deep Learning para score de crédito principal é como caçar pardal com canhão. O recoil (recoil regulatório) é forte demais para o alvo.

Além disso, lembre-se da manutenção. Uma Regressão Logística é fácil de retreinar e monitorar. O desvio de performance (drift) é visível através da estabilidade dos coeficientes. Em uma rede neural, o drift é uma mudança sutil nos pesos de milhares de neurônios. Monitorar isso em tempo real exige uma arquitetura de dados MLOps cara e complexa.

A recomendação técnica para 2026

Eu sou pragmático. Se você me perguntar hoje qual modelo implementar para uma policy de crédito principal que precisa ser auditada pelo Bacen no próximo trimestre, a resposta é Regressão Logística.

A não ser que você tenha uma lacuna de performance insuportável (ex: sua regressão está com 30% de inadimplência e o negócio vai quebrar), o custo-benefício da complexidade neural é negativo. O "bom o suficiente" da regressão logística, que geralmente fica na casa dos 75-80% de AUC em conjuntos de dados limpos, paga o custo da sua governança.

A Rede Neural deve ficar restrita a camadas analíticas internas ou decisões que não exigem justificativa individual formal para o cliente final. Use a rede neural para feature engineering (criar novas variáveis para a regressão) ou para detecção de fraude, onde a explicabilidade é menos regulada que a concessão de crédito.

Construir um modelo que o diretor de Risco não consegue assinar embaixo é inútil. Comece pela simplicidade. Se a Regressão Logística não segurar o risco, aí sim partimos para modelos Ensemble com parâmetros de poda rigorosos, nunca uma rede neural aberta sem wrapper explicativo robusto.

Se você decidir caminhar para modelos mais complexos, é vital ter um processo de feedback loop de dados contínuo para garantir que seu modelo não degrade. Sem isso, a eficiência inicial do modelo cai rapidamente, e a opacidade permanece.

O passo seguinte para sua arquitetura

Não abandone as redes neurais, mas não as coloque na linha de frente de batalha regulatória. Minha sugestão é manter uma arquitetura híbrida: use Redes Neurais para enriquecer sua base de dados, criando features derivadas superiores (ex: probabilidade de fraude calculada pela rede entra como variável na regressão de crédito). Dessa forma, você ganha o poder preditivo da inteligência artificial avançada e mantém a tranquilidade jurídica da linearidade.

Na próxima revisão do seu modelo de score, teste a hipótese de substituir a Random Forest atual por uma regressão bem calibrada com binning de variáveis (WOE). O relatório para o Bacen fica praticamente pronto sozinho, e seu sono à noite melhora consideravelmente.

Leia em seguida