Documentação
Metodologia
Por que o Prisma faz as escolhas que faz — e onde elas falham.
Ridge vs OLS
O Prisma estima coeficientes por regressão Ridge (Tikhonov) por padrão. Em MMM, as variáveis de mídia tendem a ser colineares: campanhas sobem juntas em datas comerciais, e a separação dos efeitos individuais por OLS fica instável — pequenas mudanças nos dados produzem grandes mudanças nos coeficientes. Ridge adiciona uma penalização α‖β‖² que encolhe os coeficientes em direção a zero, trocando um pouco de viés por bastante redução de variância (Hoerl & Kennard, 1970). O custo é que a inferência clássica deixa de valer: os p-values exibidos são aproximações usando a variância residual e (X′X+αI)⁻¹, e subestimam a incerteza. Para inferência rigorosa, rode novamente com α=0 (OLS puro) — quando a colinearidade permite — e use os p-values dessa rodada.
Adstock geométrico
Mídia tem efeito que persiste: um spot de TV impacta vendas por semanas. O Prisma modela esse carryover com adstock geométrico: aₜ = xₜ + λ·aₜ₋₁, com λ ∈ [0,1). É a forma funcional original do MMM moderno (Broadbent, 1979) e continua sendo o baseline de praticamente toda a literatura — incluindo o framework Robyn (Meta, 2021) e o LightweightMMM (Google, 2022). Tem dois parâmetros conceituais (decay e meia-vida) que são equivalentes e interpretáveis. O Prisma permite λ por canal, porque TV tende a λ ≈ 0.5–0.8 (semanas de eco) enquanto search paid tende a λ ≈ 0 (consumo imediato). Usar um λ global achata esses contrastes e enviesa a atribuição.
Saturação Hill
Investir o dobro em um canal raramente entrega o dobro de vendas — há rendimentos decrescentes. O Prisma aplica a função de Hill: f(x) = xᵏ / (xᵏ + x₅₀ᵏ), em que x₅₀ é o ponto de meio-efeito e k controla a inclinação. É uma curva-S flexível (Jin et al., 2017; Robyn docs) que cobre desde quase-linear até saturação acentuada com poucos parâmetros. Sob Hill, o ROI marginal cai conforme o canal cresce, então as recomendações do simulador de realocação são confiáveis para movimentos pequenos (±15–25%) e progressivamente otimistas para grandes aumentos em um único canal.
Limites do modelo
MMM observacional não é experimento. Não controlamos as decisões de mídia, então não há identificação causal estrita: o que sai é a melhor associação condicional dado o que foi observado. Quatro limites práticos: (1) colinearidade residual após Ridge — canais que sempre sobem juntos têm atribuição instável; use VIF no explore para diagnosticar; (2) variáveis omitidas (concorrência, distribuição, preço) entram na base ou poluem coeficientes; (3) poucos pontos — semanas < 2× variáveis é overfit garantido, mesmo com R² alto; valide com holdout out-of-sample; (4) regime — o modelo aprende a relação histórica; mudanças estruturais (pandemia, novo canal, rebrand) quebram a extrapolação.
Referências
- Hoerl, A. E., & Kennard, R. W. (1970). Ridge regression: Biased estimation for nonorthogonal problems. Technometrics, 12(1), 55–67.
- Broadbent, S. (1979). One way TV advertisements work. Journal of the Market Research Society, 21(3), 139–166.
- Jin, Y., Wang, Y., Sun, Y., Chan, D., & Koehler, J. (2017). Bayesian methods for media mix modeling with carryover and shape effects. Google Research.
- Chan, D., & Perry, M. (2017). Challenges and opportunities in media mix modeling. Google Research.
- Meta Open Source (2021). Robyn: Automated Marketing Mix Modeling. facebookexperimental.github.io/Robyn.
- Google (2022). LightweightMMM. github.com/google/lightweight_mmm.