Attribution marketing : mesurer l’incrémental sans surpromettre
L’attribution ne répond pas à la même question que l’incrémentalité
La plupart des équipes marketing demandent encore à l’attribution de trancher une question qu’elle ne peut pas résoudre seule : ce canal a-t-il réellement créé des conversions supplémentaires ? L’attribution, méthode qui assigne une conversion à un ou plusieurs points de contact marketing, décrit un chemin observé. Elle dit qu’un utilisateur a vu une campagne display, cliqué sur une annonce paid search, reçu un email puis acheté. Elle ne prouve pas que l’achat n’aurait pas eu lieu sans ces contacts. C’est cette confusion qui conduit à des ROAS flatteurs, des arbitrages média instables et des budgets déplacés vers les canaux les plus faciles à créditer plutôt que vers les plus incrémentaux.
L’incrémentalité désigne l’effet réellement causé par une action marketing, c’est-à-dire la différence entre ce qui s’est passé avec l’action et ce qui se serait passé sans elle. Ce scénario sans intervention est le contrefactuel. Il n’est jamais directement observable, ce qui oblige les marketeurs à l’estimer avec des protocoles expérimentaux, des groupes témoins, des modèles ou des tests géographiques. Le sujet est donc moins une question d’outil qu’une question de méthode : comment approcher suffisamment bien le contrefactuel pour prendre une décision économique sans promettre une précision impossible ?
Le CPA, coût par acquisition, soit le coût marketing nécessaire pour générer un client ou une conversion qualifiée, peut sembler excellent sur un canal qui capte surtout une demande déjà existante. Le ROAS, return on ad spend, ratio entre chiffre d’affaires attribué et dépenses publicitaires, peut être élevé pour une campagne de retargeting qui touche des visiteurs déjà proches de l’achat. Le funnel, parcours allant de la première exposition marketing à la conversion puis à la fidélisation, peut apparaître très dépendant d’un canal de bas de tunnel alors que ce canal ne fait qu’intercepter une intention construite ailleurs. L’attribution mesure une présence dans le parcours ; l’incrémentalité mesure une contribution causale.
Cette distinction devient critique dans un environnement où les signaux utilisateurs sont fragmentés. Les restrictions de cookies tiers, les consentements incomplets, les conversions cross-device, les walled gardens et les modèles d’attribution propriétaires rendent la lecture de plus en plus partielle. Pourtant, beaucoup de dashboards continuent d’afficher des chiffres au centime près, comme si l’incertitude avait disparu. Pour un professionnel du marketing, la maturité consiste à accepter que la mesure soit probabiliste, puis à construire un système de décision robuste malgré cette incertitude.
L’objectif n’est pas de supprimer l’attribution. Elle reste utile pour comprendre les parcours, détecter des ruptures, comparer des séquences, alimenter le pilotage opérationnel et dialoguer avec les plateformes. Mais elle doit être complétée par une mesure incrémentale, surtout lorsque les décisions portent sur des budgets importants, des arbitrages entre canaux ou des stratégies d’enchères automatisées. L’enjeu n’est pas de savoir quel modèle est vrai. Aucun ne l’est totalement. L’enjeu est de savoir quel niveau de preuve est suffisant pour déplacer un euro de budget avec un risque acceptable.
Pourquoi les modèles d’attribution classiques surestiment certains canaux
Les modèles d’attribution les plus courants répondent à une logique de répartition, pas de causalité. Le last click attribue 100 % de la conversion au dernier point de contact cliqué. Le first click crédite le premier. Le linéaire partage la valeur entre tous les contacts observés. Les modèles position-based donnent plus de poids au premier et au dernier contact. Les modèles data-driven, lorsqu’ils sont proposés par les plateformes, utilisent des statistiques internes pour estimer la contribution relative des interactions. Tous peuvent aider à lire un parcours. Aucun ne garantit que la valeur attribuée soit incrémentale.
Le last click favorise mécaniquement les canaux de capture : paid search marque, comparateurs, retargeting, emailing promotionnel de fin de parcours, affiliation couponing. Un utilisateur qui connaît déjà la marque, revient via une requête marque et achète sera souvent crédité au paid search marque, même si la demande a été créée par une campagne vidéo, du SEO, une recommandation ou une expérience précédente. Dans un dashboard, le paid search marque peut afficher un ROAS de 18, alors que son iROAS, incremental return on ad spend, soit le revenu incrémental généré par euro investi, peut être beaucoup plus bas si une partie importante des conversions aurait eu lieu sans achat média.
Le first click présente le biais inverse. Il survalorise les canaux d’amorçage lorsqu’ils sont visibles dans la donnée, mais ignore les expositions non trackées ou les effets de marque. Le linéaire donne une impression d’équilibre, mais il suppose implicitement que chaque contact contribue de manière similaire. Cette hypothèse est rarement défendable. Un clic de retargeting à J+1 après abandon panier ne porte pas le même mécanisme qu’une vidéo vue trois semaines plus tôt ou qu’un email de réactivation envoyé à un client dormant.
Les modèles data-driven ne sont pas magiques. Ils peuvent mieux exploiter les séquences observées, mais ils restent dépendants de la qualité des données disponibles. Si une plateforme ne voit que ses propres impressions, elle optimisera selon son périmètre. Si les conversions offline remontent avec retard ou de façon partielle, le modèle privilégiera les événements immédiats. Si le consentement varie par canal, device ou pays, le modèle apprendra sur une population mesurable qui n’est pas nécessairement représentative du trafic total. Le terme data-driven peut masquer un fait simple : le modèle est piloté par les données qu’il voit, pas par celles qui manquent.
Un exemple illustre le problème. Une marque e-commerce dépense 120 000 euros par mois en acquisition. Son reporting attribué indique 720 000 euros de chiffre d’affaires, soit un ROAS global de 6. Le retargeting affiche un ROAS de 14, le paid search marque un ROAS de 20, le paid social prospecting un ROAS de 2,4 et le display programmatique un ROAS de 1,8. Si l’équipe coupe le haut de funnel pour renforcer le retargeting, elle peut améliorer le ROAS attribué à court terme tout en réduisant le volume de nouveaux visiteurs qualifiés. Trois mois plus tard, les audiences de retargeting se tarissent, le search marque baisse et le chiffre d’affaires total recule. Le modèle avait identifié les canaux proches de la conversion, pas les canaux créateurs de demande.
La bonne lecture consiste à séparer trois notions : la conversion attribuée, la conversion assistée et la conversion incrémentale. La conversion attribuée est un choix de répartition. La conversion assistée indique qu’un canal apparaît dans le parcours avant la conversion. La conversion incrémentale estime ce qui a été réellement ajouté par l’action. Un canal peut avoir beaucoup d’assists et peu d’incrémentalité s’il touche des utilisateurs déjà convaincus. Un autre peut avoir peu de conversions attribuées mais une forte contribution incrémentale s’il crée une demande qui se convertit plus tard ailleurs.
Construire une hiérarchie de preuves plutôt qu’un modèle unique
La mesure incrémentale ne repose pas sur une méthode universelle. Elle exige une hiérarchie de preuves adaptée aux décisions. Toutes les décisions marketing ne méritent pas le même niveau de rigueur. Modifier une enchère quotidienne sur une campagne à faible budget ne demande pas le même protocole que réallouer 30 % du budget annuel entre paid social, TV connectée, search et emailing. La maturité analytique consiste à associer le niveau de preuve au niveau de risque.
On peut classer les méthodes en quatre familles. La première est l’expérimentation randomisée au niveau utilisateur. Un holdout, groupe volontairement exclu d’une exposition pour mesurer le scénario contrefactuel, permet de comparer des utilisateurs éligibles exposés à des utilisateurs éligibles non exposés. C’est le standard le plus robuste lorsque la randomisation est possible et que la contamination est limitée. Exemple : 90 % des visiteurs abandonnant leur panier reçoivent une séquence email de relance, 10 % restent en témoin. Si le groupe exposé convertit à 12,4 % et le holdout à 10,8 %, l’uplift absolu est de 1,6 point, soit une hausse relative de 14,8 %. La valeur incrémentale correspond à cet écart, pas à toutes les commandes des utilisateurs relancés.
La deuxième famille est le test géographique. Un geo test compare des zones exposées et des zones témoins, souvent utilisées pour les médias difficiles à randomiser au niveau individu : TV, radio, affichage, drive-to-store, programmatique local ou campagnes omnicanales. Le principe est de sélectionner des zones comparables, de maintenir l’action dans certaines et de la couper ou de la réduire dans d’autres, puis de mesurer l’écart de performance. La difficulté est de choisir des zones suffisamment similaires et d’éviter les effets de contamination, par exemple une campagne vue dans une zone témoin ou des achats réalisés hors zone.
La troisième famille regroupe les modèles économétriques, notamment le MMM, marketing mix modeling, méthode statistique qui estime l’impact des leviers marketing sur les ventes en intégrant dépenses média, saisonnalité, promotions, prix, distribution et facteurs externes. Le MMM est utile pour les arbitrages macro, surtout lorsque les données utilisateur sont incomplètes. Il permet d’estimer des rendements décroissants, des effets retardés et des contributions de canaux non cliquables. Mais il travaille à un niveau agrégé et nécessite suffisamment d’historique, souvent 18 à 36 mois de données hebdomadaires, pour produire des résultats stables.
La quatrième famille est le MTA, multi-touch attribution, attribution multi-touch qui répartit la valeur entre points de contact individuels. Le MTA reste pertinent pour l’analyse des séquences digitales mesurables, mais il doit être calibré par des tests d’incrémentalité. Sans calibration, il risque de devenir un système sophistiqué de redistribution de conversions non causales. Avec calibration, il peut aider à opérationnaliser les enseignements : quels chemins convertissent mieux, quelles fréquences deviennent inutiles, quels segments réagissent à quel message.
Un framework pragmatique consiste à distinguer trois niveaux de décision. Niveau 1 : pilotage tactique, avec attribution, micro-conversions validées et signaux plateforme, pour ajuster créations, audiences et enchères à court terme. Niveau 2 : arbitrage budgétaire mensuel ou trimestriel, avec holdouts, tests d’incrémentalité par canal et analyses par cohorte. Niveau 3 : allocation stratégique annuelle, avec MMM, geo tests et consolidation finance. Le piège est de demander au niveau 1 de résoudre les décisions du niveau 3. Une interface publicitaire peut optimiser une campagne, mais elle ne devrait pas décider seule de la structure globale du budget.
Mettre en place des holdouts sans casser l’exécution marketing
Le holdout est souvent la méthode la plus accessible pour mesurer l’incrémentalité digitale, mais il est aussi mal compris. Beaucoup d’équipes le perçoivent comme une perte de revenu : pourquoi priver 5 % ou 10 % des utilisateurs d’une action supposée performante ? Cette objection est logique si l’on confond revenu attribué et revenu incrémental. En réalité, un holdout achète une assurance analytique. Il permet de savoir si l’action crée de la valeur ou si elle capture une valeur déjà acquise.
La première règle est de définir l’unité de randomisation. Pour une séquence CRM, il faut souvent randomiser au niveau utilisateur ou client, pas au niveau session. Pour une campagne onsite, l’allocation doit être persistante afin qu’un visiteur ne voie pas alternativement l’expérience personnalisée et le contrôle. Pour un test média, la randomisation au niveau individu peut être impossible si la plateforme ne permet pas un contrôle strict de l’exposition ; il faut alors utiliser des audiences d’exclusion, des tests géographiques ou des expériences proposées par la plateforme, en gardant en tête leurs limites.
La deuxième règle est de mesurer l’exposition réelle. Être éligible à une campagne n’est pas équivalent à l’avoir vue. Une publicité achetée en RTB, real-time bidding, mécanisme d’enchères en temps réel permettant d’acheter une impression publicitaire disponible, peut être servie sans être vue. Une campagne achetée via une DSP, demand-side platform, plateforme permettant aux annonceurs d’acheter des impressions programmatiques, peut toucher des utilisateurs avec des fréquences très différentes. Un email peut être envoyé mais non ouvert. Un push peut être délivré mais ignoré. Le protocole doit distinguer population éligible, population exposée et population effectivement mesurée.
La troisième règle est de choisir un KPI primaire proche de la valeur. Pour un e-commerce, le chiffre d’affaires incrémental peut être insuffisant si la marge varie fortement selon les catégories. La marge par utilisateur éligible est souvent plus robuste. Pour un SaaS B2B, le lead incrémental peut être trompeur si la qualité baisse. Il faut mesurer le SQL, sales qualified lead, lead accepté par les ventes comme opportunité potentielle, le pipeline créé ou le revenu signé lorsque le délai le permet. Pour une campagne drive-to-store, le trafic magasin doit être relié aux ventes ou au panier moyen, sinon l’uplift de visites peut masquer une faible contribution commerciale.
La quatrième règle est de dimensionner correctement le test. Si le taux de conversion de base est de 2 %, détecter un uplift relatif de 5 % nécessite souvent des centaines de milliers de visiteurs par variante. Le MDE, minimum detectable effect, effet minimal détectable avec une puissance statistique donnée, doit être défini avant le lancement. Si le volume est insuffisant, l’équipe doit accepter de mesurer un effet plus large, agréger des segments cohérents ou considérer le test comme exploratoire. L’erreur la plus fréquente est de lancer un holdout trop petit, puis de conclure que l’effet est nul alors que le test était simplement sous-puissant.
Exemple concret : une enseigne observe 400 000 visiteurs éligibles par mois à une campagne de retargeting onsite et email. Le taux d’achat naturel estimé est de 6 %. L’équipe crée un holdout de 10 %, soit 40 000 utilisateurs. Le groupe exposé convertit à 7,1 %, le holdout à 6,4 %. L’uplift absolu est de 0,7 point. Sur 360 000 utilisateurs exposés, cela représente environ 2 520 commandes incrémentales. Si le panier moyen est de 85 euros et la marge brute de 38 %, la marge incrémentale est d’environ 81 400 euros. Si le coût de la campagne, remises incluses, atteint 52 000 euros, le gain net est de 29 400 euros. Le reporting attribué aurait pu revendiquer toutes les commandes du groupe exposé, soit plus de 25 000 commandes, mais la décision économique dépend des 2 520 commandes incrémentales.
Relier attribution, plateformes média et enchères automatisées sans créer de boucle de biais
La mesure d’incrémentalité devient plus complexe lorsque les plateformes média optimisent en continu. Les algorithmes d’enchères apprennent à partir des conversions qui leur sont renvoyées. Si ces conversions sont attribuées mais peu incrémentales, l’algorithme peut devenir très performant pour trouver des utilisateurs qui auraient converti de toute façon. Le système améliore alors le CPA observé tout en dégradant l’efficacité marginale du budget.
Ce phénomène est fréquent en retargeting. Une plateforme reçoit comme signal toute conversion post-clic ou post-view dans une fenêtre de sept jours. Elle identifie rapidement les utilisateurs les plus proches de l’achat : visiteurs récents, paniers abandonnés, clients déjà engagés. Le CPA baisse, le ROAS augmente, l’équipe augmente le budget. Mais le canal sature vite, car il cible une demande existante. Sans holdout, impossible de savoir quelle part des conversions est réellement ajoutée. Dans certains secteurs, des tests d’incrémentalité montrent que le retargeting peut avoir une incrémentalité de 10 % à 40 % des conversions attribuées selon la fenêtre, la pression commerciale et la notoriété de marque. Cela ne signifie pas qu’il faut l’arrêter ; cela signifie qu’il faut le valoriser à son effet marginal réel.
Le sujet concerne aussi le paid search marque. Acheter sa propre marque peut être utile pour défendre l’espace publicitaire, contrôler le message, contrer des concurrents ou orienter vers des landing pages spécifiques. Mais l’incrémentalité peut être très variable. Sur une marque forte avec un bon SEO, couper partiellement le paid search marque peut révéler que 60 % à 90 % des conversions se reportent vers l’organique ou le direct. Sur une marque attaquée par des concurrents, le report peut être beaucoup plus faible. La bonne question n’est pas le search marque est-il bon ou mauvais, mais dans quelles conditions protège-t-il une valeur réellement menacée ?
Pour éviter les boucles de biais, les signaux transmis aux plateformes doivent être hiérarchisés. Un achat avec marge connue vaut mieux qu’un simple ajout panier. Un lead qualifié vaut mieux qu’un formulaire soumis. Un client nouveau vaut mieux qu’un client existant si l’objectif est l’acquisition. Lorsque c’est possible, il faut transmettre des valeurs différenciées : marge estimée, score de qualité, statut nouveau client, probabilité de closing. Une conversion binaire donne à l’algorithme une vision trop plate de la valeur.
Il faut aussi stabiliser l’environnement pendant les tests critiques. Si l’équipe change simultanément les budgets, les créas, les audiences, les pages d’atterrissage et les règles d’attribution, le résultat devient illisible. Un test d’incrémentalité média doit documenter les changements d’enchères, les promotions, les ruptures produit, les variations de prix et les campagnes concurrentes connues. La rigueur ne supprime pas le bruit, mais elle évite de confondre une décision média avec un effet de contexte.
Enfin, les fenêtres d’attribution doivent être challengées. Une fenêtre post-view de 30 jours peut gonfler artificiellement la contribution d’un canal display exposant beaucoup d’impressions. Une fenêtre post-clic trop courte peut sous-estimer des cycles longs en B2B. La fenêtre doit refléter le cycle d’achat, mais aussi le risque de capturer des conversions naturelles. Une approche utile consiste à comparer plusieurs fenêtres et à regarder la décroissance marginale : si l’essentiel de la valeur attribuée apparaît très tard et sans différence significative face à un holdout, la contribution est probablement surestimée.
Utiliser le MMM et les geo tests pour arbitrer les budgets, pas pour remplacer le terrain
Lorsque les budgets dépassent un certain seuil et que les canaux incluent du offline, de la vidéo, du display haut de funnel ou des effets de marque, les holdouts utilisateur ne suffisent plus. Le MMM et les geo tests deviennent nécessaires pour lire les effets agrégés. Ils permettent d’estimer des contributions que les modèles click-based voient mal : notoriété, saisonnalité, pression promotionnelle, distribution, prix, météo, concurrence ou effets retardés.
Un MMM robuste commence par une question de décision. Voulez-vous estimer le ROI moyen historique par canal ? Identifier les rendements décroissants ? Simuler une réallocation budgétaire ? Mesurer l’effet retardé de la vidéo ? Séparer promotion et média ? Le modèle ne doit pas être un exercice académique. Il doit produire des courbes de réponse exploitables : à partir de quel niveau de dépense le canal sature-t-il, quel budget marginal reste rentable, quel délai d’effet faut-il anticiper ?
La qualité des données est déterminante. Il faut idéalement des séries temporelles cohérentes : dépenses par canal, impressions ou GRP, ventes, marge, prix, promotions, stocks, distribution, saisonnalité, événements externes. Une granularité hebdomadaire est souvent un compromis acceptable ; une granularité quotidienne peut être bruitée, une granularité mensuelle peut masquer trop d’effets. Les modèles bayésiens sont de plus en plus utilisés car ils permettent d’intégrer des priors, c’est-à-dire des hypothèses préalables, et de produire des intervalles d’incertitude. Cette incertitude doit être assumée dans la décision. Un canal estimé avec un ROI entre 0,8 et 3,5 ne doit pas être traité comme un canal prouvé à 2,1.
Les geo tests complètent le MMM en apportant une preuve expérimentale. Supposons qu’une marque veuille mesurer l’effet incrémental d’une campagne programmatique locale sur les ventes en magasin. Elle sélectionne 20 zones comparables : 10 zones exposées, 10 zones témoins. Avant le test, les ventes hebdomadaires moyennes sont de 100 000 euros par zone dans les deux groupes. Pendant quatre semaines, les zones exposées passent à 112 000 euros et les zones témoins à 104 000 euros, probablement sous l’effet de la saison. L’uplift incrémental n’est pas 12 %, mais environ 8 points au-dessus de la tendance témoin. Si le coût média est de 60 000 euros et la marge incrémentale estimée de 128 000 euros, le test suggère un effet rentable. Mais il faut vérifier la significativité, les différences de stock, les promotions locales et les contaminations.
Le MMM a aussi des limites. Il peut confondre des canaux corrélés, par exemple TV et search marque si les deux montent simultanément. Il peut sous-estimer les petits canaux à faible variation budgétaire, car un modèle apprend surtout des changements observés. Il peut produire des résultats instables si l’historique est court ou si les données de promotion sont mal codées. C’est pourquoi il doit être calibré avec des expériences : holdouts CRM, tests de coupure search marque, geo tests display, lift studies plateforme. Le modèle donne une carte ; les expériences fournissent des points de vérité terrain.
La meilleure pratique consiste à créer une boucle de calibration. Les tests incrémentaux alimentent le MMM en contraintes ou en priors. Le MMM identifie les canaux et niveaux de dépenses à tester. Les résultats expérimentaux corrigent les hypothèses d’attribution et les signaux envoyés aux plateformes. Cette boucle est plus lente qu’un dashboard temps réel, mais elle est beaucoup plus fiable pour les décisions de budget significatives.
Présenter l’incrémentalité sans surpromettre : intervalles, hypothèses et décisions
Un des risques majeurs de la mesure incrémentale est de remplacer une fausse précision par une autre. Certaines équipes passent d’un ROAS attribué présenté au centime près à un iROAS incrémental présenté comme une vérité définitive. C’est une erreur. Toute mesure incrémentale dépend d’hypothèses : qualité du groupe témoin, stabilité du contexte, absence de contamination, fenêtre de mesure, choix du KPI, puissance statistique, méthode de modélisation. La rigueur consiste à présenter les résultats avec leurs conditions de validité.
Un reporting mature doit afficher au moins quatre éléments. Premièrement, l’estimation centrale : par exemple, campagne A générant 180 000 euros de marge incrémentale. Deuxièmement, l’intervalle d’incertitude : par exemple, entre 90 000 et 260 000 euros avec un niveau de confiance donné. Troisièmement, les hypothèses clés : zones comparables, promotions stables, tracking backend fiable, exclusion des clients existants. Quatrièmement, la décision recommandée : augmenter, maintenir, réduire, retester ou segmenter.
Cette approche change la discussion avec les directions marketing et financières. Au lieu de dire ce canal a un ROAS de 5,6, l’équipe peut dire : les tests suggèrent un iROAS entre 1,4 et 2,2 sur les nouveaux clients, rentable au-dessus d’une marge brute de 35 %, mais l’effet disparaît au-delà de 3 expositions par semaine et reste non prouvé sur les clients existants. Cette formulation est moins spectaculaire, mais beaucoup plus actionnable. Elle indique où investir, où limiter la fréquence et où ne pas extrapoler.
Il faut également distinguer effet moyen et effet marginal. Un canal peut avoir été rentable historiquement tout en étant peu rentable sur le prochain euro dépensé. Les rendements décroissants sont centraux en média. Les premiers euros sur un canal touchent souvent les audiences les plus réceptives ; les euros suivants élargissent vers des profils moins qualifiés. Un ROAS moyen de 3 ne garantit pas qu’une hausse de budget de 30 % produira encore un ROAS de 3. Les décisions doivent regarder la courbe de réponse marginale, pas seulement la performance moyenne.
La segmentation est tout aussi importante. L’incrémentalité peut varier fortement entre nouveaux clients et clients existants, marque et non-marque, mobile et desktop, zones urbaines et rurales, périodes promotionnelles et périodes pleines, audiences froides et audiences chaudes. Un résultat global peut masquer des effets opposés. Une campagne peut être très incrémentale sur les nouveaux visiteurs issus du paid social prospecting, publicité sociale visant des audiences peu intentionnistes, et presque nulle sur les visiteurs récents déjà engagés. L’arbitrage ne doit donc pas être canal contre canal, mais segment, pression, message et moment contre alternative budgétaire.
Enfin, la mesure incrémentale doit rester reliée aux contraintes opérationnelles. Un canal peut être incrémental mais difficile à scaler. Un autre peut être moins incrémental mais nécessaire pour défendre une position concurrentielle. Un holdout peut être méthodologiquement idéal mais politiquement difficile pendant une période commerciale critique. La mesure n’élimine pas l’arbitrage ; elle le rend explicite. Surpromettre, c’est prétendre que le modèle décide. Mesurer correctement, c’est donner une estimation suffisamment fiable pour choisir en connaissance de cause.
Conclusion : une méthode actionnable pour mesurer mieux sans prétendre tout savoir
L’attribution marketing reste indispensable, mais elle ne doit plus être confondue avec la preuve de création de valeur. Elle décrit des parcours, répartit des conversions et facilite le pilotage opérationnel. L’incrémentalité cherche à mesurer l’effet causal réel d’une action. Entre les deux, il existe une zone d’incertitude que les professionnels du marketing doivent traiter avec méthode plutôt qu’avec des dashboards trop précis pour être vrais.
Une approche opérationnelle tient en huit étapes. Premièrement, séparer clairement conversion attribuée, conversion assistée et conversion incrémentale dans les reportings. Deuxièmement, identifier les décisions à fort enjeu qui méritent un niveau de preuve supérieur : hausse de budget, coupure de canal, changement de stratégie d’enchères, activation promotionnelle. Troisièmement, mettre en place des holdouts persistants lorsque la randomisation utilisateur est possible, notamment en CRM, retargeting, personnalisation onsite et emailing. Quatrièmement, utiliser des geo tests pour les médias difficiles à randomiser individuellement ou les dispositifs locaux. Cinquièmement, construire un MMM pour les arbitrages macro, en l’alimentant avec des données propres et en le calibrant par des expériences. Sixièmement, transmettre aux plateformes des signaux de conversion pondérés par valeur, marge ou qualité, afin de limiter les boucles d’optimisation sur des événements peu incrémentaux. Septièmement, présenter les résultats avec intervalles d’incertitude, hypothèses et limites de validité. Huitièmement, décider sur l’effet marginal et segmenté, pas seulement sur le ROAS moyen attribué.
Le bon niveau d’ambition n’est pas de mesurer parfaitement chaque euro. C’est impossible dans un environnement fragmenté, multi-canal et partiellement observable. Le bon niveau d’ambition est de réduire les erreurs coûteuses : surinvestir dans des canaux de capture, couper des leviers créateurs de demande, entraîner les algorithmes sur de mauvais signaux, généraliser des résultats valables seulement sur un segment ou confondre performance court terme et croissance incrémentale.
Pour les équipes CRO, acquisition et analytics, la discipline consiste à poser systématiquement la question contrefactuelle : que se serait-il passé sans cette action ? Plus la réponse est approximative, plus la décision doit rester prudente. Plus le protocole est robuste, plus l’équipe peut déplacer du budget avec confiance. L’incrémentalité ne promet pas une vérité absolue. Elle impose une meilleure hygiène de décision : moins de certitudes affichées, plus de preuves comparables, et une capacité accrue à investir là où le marketing crée réellement de la valeur plutôt que là où il sait seulement se faire attribuer la conversion.