Otimização de campanhas de E-mail : identificando características que maximizam o open rate
Resumo
Resumo: Este trabalho investiga quais elementos do assunto de e-mails promocionais influenciam a taxa de abertura (open rate), utilizando dados reais de um e-commerce do setor aéreo (11 814 campanhas consolidadas e 364 envios com nível individual). O texto dos títulos e preheaders foi enriquecido via LLMs e modelado com regressão logística para interpretação global e com estimadores de CATE para mensurar a heterogeneidade de efeitos. Os resultados mostram que urgência, lembretes de viagem e CTA no preheader associam-se positivamente à probabilidade de alta abertura, enquanto excesso de números, emojis e exclamações exibem associações negativas. O modelo obteve AUC ˜ 0,923, indicando bom poder discriminativo. Dois experimentos A/B com personalização do nome no título revelaram efeitos contrastantes: +1,51 p.p. (significativo) em um cenário, versus -1,76 p.p. (significativo) em outro, com variação por segmento de cliente evidenciada pelos CATEs. Em bases mais desbalanceadas, observou-se maior variabilidade e assimetria nas probabilidades preditas. Os achados sugerem personalização seletiva, uso parcimonioso de gatilhos e um ciclo contínuo de testes baseados em evidência para maximizar desempenho com governança analítica Abstract: This study examines which email subject-line elements drive open rates using real airline e-commerce data (11,814 campaign-level records and 364 user-level sends). Subject lines and preheaders were LLM-enriched and analyzed with L1-regularized logistic regression for global interpretation, and CATE estimators to capture treatment heterogeneity. We find that urgency, trip reminders, and preheader CTAs are positively associated with high open rates, whereas excessive numbers, emojis, and exclamation marks show negative associations. The model achieved AUC ˜ 0.923, indicating strong discrimination. Two A/B experiments on first-name personalization yielded contrasting effects: +1.51 p.p. (significant) in one setting versus -1.76 p.p. (significant) in another, with CATE analyses revealing variation across customer segments. Under higher class imbalance, predicted probabilities exhibited greater variance and skewness. These findings support selective personalization, parsimonious use of persuasive cues, and an evidence-driven testing program to improve performance with analytical governance
Collections
- Data Science & Big Data [163]