Documentação

Metodologia

Por que o Prisma faz as escolhas que faz — e onde elas falham.

Ridge vs OLS

O Prisma estima coeficientes por regressão Ridge (Tikhonov) por padrão. Em MMM, as variáveis de mídia tendem a ser colineares: campanhas sobem juntas em datas comerciais, e a separação dos efeitos individuais por OLS fica instável — pequenas mudanças nos dados produzem grandes mudanças nos coeficientes. Ridge adiciona uma penalização α‖β‖² que encolhe os coeficientes em direção a zero, trocando um pouco de viés por bastante redução de variância (Hoerl & Kennard, 1970). O custo é que a inferência clássica deixa de valer: os p-values exibidos são aproximações usando a variância residual e (X′X+αI)⁻¹, e subestimam a incerteza. Para inferência rigorosa, rode novamente com α=0 (OLS puro) — quando a colinearidade permite — e use os p-values dessa rodada.

Adstock geométrico

Mídia tem efeito que persiste: um spot de TV impacta vendas por semanas. O Prisma modela esse carryover com adstock geométrico: aₜ = xₜ + λ·aₜ₋₁, com λ ∈ [0,1). É a forma funcional original do MMM moderno (Broadbent, 1979) e continua sendo o baseline de praticamente toda a literatura — incluindo o framework Robyn (Meta, 2021) e o LightweightMMM (Google, 2022). Tem dois parâmetros conceituais (decay e meia-vida) que são equivalentes e interpretáveis. O Prisma permite λ por canal, porque TV tende a λ ≈ 0.5–0.8 (semanas de eco) enquanto search paid tende a λ ≈ 0 (consumo imediato). Usar um λ global achata esses contrastes e enviesa a atribuição.

Saturação Hill

Investir o dobro em um canal raramente entrega o dobro de vendas — há rendimentos decrescentes. O Prisma aplica a função de Hill: f(x) = xᵏ / (xᵏ + x₅₀ᵏ), em que x₅₀ é o ponto de meio-efeito e k controla a inclinação. É uma curva-S flexível (Jin et al., 2017; Robyn docs) que cobre desde quase-linear até saturação acentuada com poucos parâmetros. Sob Hill, o ROI marginal cai conforme o canal cresce, então as recomendações do simulador de realocação são confiáveis para movimentos pequenos (±15–25%) e progressivamente otimistas para grandes aumentos em um único canal.

Limites do modelo

MMM observacional não é experimento. Não controlamos as decisões de mídia, então não há identificação causal estrita: o que sai é a melhor associação condicional dado o que foi observado. Quatro limites práticos: (1) colinearidade residual após Ridge — canais que sempre sobem juntos têm atribuição instável; use VIF no explore para diagnosticar; (2) variáveis omitidas (concorrência, distribuição, preço) entram na base ou poluem coeficientes; (3) poucos pontos — semanas < 2× variáveis é overfit garantido, mesmo com R² alto; valide com holdout out-of-sample; (4) regime — o modelo aprende a relação histórica; mudanças estruturais (pandemia, novo canal, rebrand) quebram a extrapolação.

Referências

Hoerl, A. E., & Kennard, R. W. (1970). Ridge regression: Biased estimation for nonorthogonal problems. Technometrics, 12(1), 55–67.
Broadbent, S. (1979). One way TV advertisements work. Journal of the Market Research Society, 21(3), 139–166.
Jin, Y., Wang, Y., Sun, Y., Chan, D., & Koehler, J. (2017). Bayesian methods for media mix modeling with carryover and shape effects. Google Research.
Chan, D., & Perry, M. (2017). Challenges and opportunities in media mix modeling. Google Research.
Meta Open Source (2021). Robyn: Automated Marketing Mix Modeling. facebookexperimental.github.io/Robyn.
Google (2022). LightweightMMM. github.com/google/lightweight_mmm.