3-krotny wzrost konwersji dzięki targetowaniu mailingu w oparciu o model predykcyjny

Dzisiejsi konsumenci są stale zalewani przekazami różnych marek. Wiele marek wysyła wiele komunikatów, wieloma kanałami. Powoduje to, że trudno przyciągnąć i zatrzymać na dłużej uwagę konsumenta. Jednocześnie łatwo konsumenta zmęczyć komunikacją i sprawić, że będzie na nią zwracał coraz mniejszą uwagę. Tym samym ważniejszy niż kiedykolwiek wcześniej staje się odpowiedni dobór treści, wysyłanie jak najbardziej dopasowanego do konsumenta przekazu oraz ograniczanie wiadomości, które nie są interesujące i zwiększają jedynie ryzyko uniewrażliwienia się konsumenta na przekaz.

W rozwiązaniu problemu pomaga modelowanie predykcyjne. Systemy oparte o uczenie maszynowe są w stanie z dużą dokładnością przewidzieć zainteresowanie konsumenta danym rodzajem wiadomości czy oferty. Artykuł na konkretnym i aktualnym przykładzie (z maja 2023) pokazuje, jak w praktyce zastosować wspomniane narzędzia. Ze względu na najwyższy standard zachowania poufności, liczby, które zaprezentujemy będą przeskalowane lub pokazane jako indeksy. Wiernie odwzorują jednak zaobserwowane różnice i efekty.

Problem tradycyjnego podejścia do targetowania mailingu i potrzeba zmiany

Organizacja, której dotyczy przykład, jak wiele innych, przez długie lata stosowała metodę tzw. „maksymalizacji przychodów” z bazy komunikacyjnej poprzez szerokie i częste wysyłki. Czyli w praktyce wysłano informację o ofercie do wszystkich konsumentów, którzy mieli zgodę na komunikację danym kanałem. W nielicznych wypadkach przy pomocy kryteriów eksperckich zawężano nieco komunikowaną bazę. Opierano się jednak na prostych kryteriach typu: kupił kiedykolwiek wcześniej promowany produkt, nie kupił produktu X w ciągu ostatnich 6 miesięcy, jest w kobietą w wieku powyżej 55 lat itp. Wyniki przez długi czas były bardzo dobre i nikt nie widział potrzeby zmian w stosowanym procesie. W pewnym momencie zaczęto jednak obserwować powolny spadek wskaźnika otwieralności maili (tzw. open rate). Trend spadkowy zaczął być wyraźny. W połączeniu ze zmniejszającą się liczbą nowo pozyskiwanych konsumentów, skłoniło to organizację do refleksji czy da się lepiej pracować z istniejącą bazą. Co zrobić, żeby odwrócić trend spadającego zainteresowania wysyłaną komunikacją?

Zapadła decyzja o przetestowaniu włączenia uczenia maszynowego i analityki predykcyjnej do procesu doboru konsumentów do kampanii mailingowych. Przygotowaliśmy system modelowania predykcyjnego generujący „szyte na miarę” każdej kampanii modele scoringowe. Ogólna architektura systemu przedstawiona jest na schemacie poniżej.

targetowanie mailingu

Wykorzystanie modelowania predykcyjnego w targetowaniu mailingu

Na potrzeby treningu modelu jakie dane wejściowe wykorzystanych zostało ponad 100 zmiennych z wymienionych na schemacie obszarów. Model budowane są w oparciu o zaawansowane algorytmy, będące w stanie poradzić sobie z taką mnogością atrybutów i wyekstraktować z nich jak najwięcej informacji o faktycznym profilu konsumenta. Finalnym efektem jest oszacowanie prawdopobieństwa zainteresowania daną komunikacją przez każdego konsumenta. Następnie wykorzystywane jest to do ostatecznej selekcji konsumentów do kampanii.

Wyniki zmian w procesie targetowania komunikacji spełniły (a nawet w pewnych aspektach przekroczyły) oczekiwania. Aby dowieść przydatności modelu przeprowadziliśmy eksperymenty. Połowa bazy była przedmiotem selekcji starym sposobem, druga zaś była selekcjonowana przy pomocy predykcji modelu. Trzeba przy tym zaznaczyć, że w obu grupach korzystaliśmy dokładnie z tych samych maili – ten sam temat, dokładnie taka sama kreacja. Również moment wysyłki był ten sam. Żaden z tych czynników nie mógł zatem wpłynąć na wyniki eksperymentu. Jedyną różnicą pomiędzy grupami był sposób selekcjonowania konsumentów.

Efekty zastosowania modelowania predykcyjnego

W grupie targetowanej przy pomocy modelu udało się blisko 14-krotnie ograniczyć liczebność komunikowanej grupy – na każdy 100 komunikowanych przy tradycyjnych kryteriach przypada zaledwie 7 komunikowanych według procesu opartego o model predykcyjny.

Liczebność komunikowanej grupy

Jednocześnie tak niewielka grupa wygenerowała podobną (bo zaledwie o około 2% niższą) sprzedaż.

Sprzedaż w komunikowanej grupie

Zostało to osiągnięte dzięki znacząco wyższej (3-krotnie) konwersji w grupie przypisywanej do kampanii w nowy sposób. A także dużo (4-krotnie) większej średniej wartości paragonu w tejże grupie.

Targetowanie mailingu - Konwersja z komunikacji na zakup
Targetowanie mailingu - Średnia wartość zakupu komunikowanych produktów

Zawężenie komunikowanej grupy pozwoliło ograniczyć ją do naprawdę zainteresowanych ofertą. Świadczy o tym dużo wyższy wskaźnik open rate (3,2 x wyższy) oraz click to open rate (prawie 2x wyższy). Wskaźnik „click to open rate” jest w tym przypadku obliczany jako CTOR = LC/LO, gdzie LC to liczba konsumentów, którzy kliknęli w linka z  maila, a LO to liczba konsumentów, którzy otworzyli maila. O ile wskaźnik open rate jest w dużym stopniu zależny od tematu wiadomości, to wyższy wskaźnik CTOR świadczy o faktycznym zainteresowaniu treścią i ofertą, która zawarta jest w mailu.

Targetowanie mailingu - reakcja na komunikację

Targetowanie mailingu w oparciu o model predykcyjny – podsumowanie

Dzięki zastosowaniu zaawansowanego narzędzia data science w postaci modelu predykcyjnego udało się osiągnąć:

– lepsze dopasowanie komunikacji do zainteresowań i potrzeb konsumenta

– znaczące zmniejszenie liczby komunikowanych w danej kampanii z minimalnym uszczerbkiem dla wyniku sprzedażowego (nieco ponad 2%)

– zmniejszenie „przesytu” komunikacyjnego – konsument będzie w nowym procesie otrzymywał komunikację rzadziej ale będzie ona lepiej dopasowana

Dokładny wpływ modelu i nowego procesu targetowania na trend otwieralności i klikalności mailingów, może być zbadany dopiero w dłuższym okresie i wymaga co najmniej kilku miesięcy obserwacji. Pierwsze odnotowane wyniki wyglądają jednak obiecująco i dają podstawy do oczekiwania odwrócenia wyraźnego negatywnego trendu widocznego w miesiącach przed wprowadzeniem modelu scoringowego.

Na koniec warto podkreślić, że zaletą systemu jest otwartość jego architektury na nowe źródła danych. W przypadku udostępnienia nowych zmiennych zostaną one automatycznie włączone w proces treningu modelu i wykorzystane do predykcji. Ważną cechą opisywanego rozwiązania jest także zdolność modelu do aktualizowania się w miarę napływu nowych danych w tym danych dotyczących zrealizowanych kampanii i ich skuteczności. Dzięki temu model automatycznie będzie dostosowywał się do zmieniających się potrzeb i zachowań konsumentów oraz ich reakcji na wysyłaną komunikację. Gwarantuje to użyteczność systemu także w długim horyzoncie czasowym.

Modelowanie atrybucyjne – klucz do zrozumienia efektywności działań marketingowych

W dobie rosnącej liczby kanałów komunikacji i punktów kontaktu z marką, właściwa identyfikacja wagi i wpływu każdego z nich nabiera coraz większego znaczenia. Poprawna odpowiedź na pytanie: w jakim stopniu wykorzystanie danego komunikatu i kanału wpłynęło na realizację celu jest kluczowa dla optymalizacji działań i maksymalizowania zwrotu z zainwestowanego budżetu marketingowego. Problem jest tyleż ważny, co trudny. Z pomocą przychodzi jednak modelowanie atrybucyjne i metody data science.

Czym jest modelowanie atrybucyjne?

Modelowanie atrybucyjne to proces budowy modelu służącego do przydzielania wartości każdemu z punktów kontaktu (touchpointów) na ścieżce konwersji klienta. Ma na celu zrozumienie, które kanały marketingowe i działania przyczyniają się do osiągnięcia celów biznesowych, takich jak np. sprzedaż, pozyskanie nowego klienta, aktywizacja klientów uśpionych, rekrutacja nowych uczestników programu lojalnościowego czy zwiększenie świadomości marki.  Pod pojęciem modelu atrybucyjnego może kryć się wiele różnych konstruktów, od bardzo (zbyt) prostych do bardzo złożonych. Generalnie modele można podzielić na: jednopunktowe, wielopunktowe oparte o reguły i algorytmiczne modele wielopunktowe.

Modelowanie jednopunktowe

Modele jednopunktowe przydzielają całą wartość konwersji (czy szerzej osiągnięcia celu) tylko jednemu punktowi kontaktu. Typowe podejścia to pierwsze kliknięcie (first-click) lub ostatnie kliknięcie (last-click). Są to uproszczone modele. Nie uwzględniają całej ścieżki konwersji klienta. Nie uwzględniają interakcji między różnymi punktami kontaktu oraz kontekstu w jakim się on odbywa. Ich zaletą jest prostota i łatwość zastosowania. W złożonym świecie dzisiejszego marketingu są jednak zbyt proste aby wiarygodnie odzwierciedlać rzeczywistość.

Modele wielopunktowe oparte o reguły

Modele wielopunktowe rozdzielają wartość pomiędzy różne punkty kontaktu na ścieżce klienta. Przy czym dzielą się one na oparte o reguły i modele algorytmiczne. Te pierwsze przypisują wartość poszczególnym kontaktom w oparciu o predefiniowane reguły. Przykładowo:

  • model liniowy – przydziela jednakową wartość każdemu punktowi kontaktu, z jakim zetknął się konsument na swojej ścieżce do konwersji;

  • model U-kształtny – przydziela największą wartość pierwszemu i ostatniemu punktowi kontaktu, punkty pośrednie mają w tym modelu mniejsze (choć niezerowe) znaczenie;

  • model oparty o czas konwersji – przydziela tym większą wartość im punkt był bliżej momentowi konwersji. W tym modelu największa waga przypisywana jest do ostatniego kontaktu bezpośrednio poprzedzającego konwersję.

Zaletą modeli opartych o reguły jest ich klarowność i względna prostota. Także to, że nie pomijają żadnych punktów kontaktu na ścieżce prowadzącej do konwersji. Ich wagi nadawane są jednak w oparciu o arbitralnie dobrane reguły. Dla każdej z nich można znaleźć uzasadnienie. Nie sposób jednak stwierdzić, która z nich jest najlepsza. Podobnie jak w przypadku modeli jednopunktowych ich wadą jest również to, że nie uwzględniają interakcji pomiędzy różnymi punktami styku i nie biorą pod uwagę kontekstu.

Algorytmiczne modele wielopunktowe

Modele algorytmiczne podobnie jak modele oparte o reguły przypisują wagę każdemu punktowi kontaktu na ścieżce klienta. Jednak zamiast arbitralnych reguł wykorzystują do określenia tych wag zaawansowane metody statystyczne. Zamiast więc przyjmować predefiniowane reguły, modele te „uczą się reguł” na podstawie rzeczywistych danych (przy pomocy metod uczenia maszynowego). Modele takie uwzględniają kolejność punktów kontaktu i interakcje pomiędzy nimi. Przykładowo wpływ emaila na konwersję może być większy, gdy był on poprzedzony wyświetleniem banera. Uwzględniają także kontekst np. porę roku, pogodę, aktywność medialną konkurencji, ceny. Mogą działać na bardzo szczegółowym poziomie np. rozróżniać wpływ poszczególnych wariantów kreacji bądź miejsca i czasu ich wyświetlenia.

Trudno nie zgodzić się ze stwierdzeniem, że dziś to właśnie tego typu modele są „złotym standardem”. Tylko one pozwalają uwzględnić całą złożoność ścieżek kontaktu konsumenta z marką. Za dokładnością i korzyściami płynącymi z modeli algorytmicznych idą jednak związane z nimi wyzwania. W szczególności co do ilości, jakości i zakresu danych oraz kompetencji analitycznych niezbędnych do ich stworzenia. Ich wadą jest też ograniczona transparentność wynikająca ze złożoności reguł jakie rządzą rzeczywistością i są identyfikowane przez model. Modele algorytmiczne pozwalają jednak na zaawansowana symulację (what if?) różnych scenariuszy np. co jeśli zrezygnowalibyśmy zupełnie z kanału A? co jeśli ograniczylibyśmy budżet na kanał B? co jeśli zamienilibyśmy kolejność komunikatów w sekwencji? To z kolei pozwala na optymalizację budżetu i działań. Inwestycja w tego typu model może się więc z nawiązką zwrócić.

Podsumowanie

Marketingowe modele atrybucyjne przeszły długą ewolucję od prostych jednopunktowych, do wielopunktowych opartych o złożone algorytmy uczenia maszynowego i metody statystyczne (m.in. oparte o głębokie sztuczne sieci neuronowe). Jest to przy tym wciąż obszar intensywnych badań i eksperymentów zarówno w środowisku naukowym, jak i wśród praktyków. Pomimo złożoności i wyzwań związanych z ich tworzeniem i zastosowaniem, są one coraz bardziej dostępne dzięki spadającym kosztom gromadzenia i przetwarzania danych. Wkraczamy więc w epokę, w której nie powinniśmy pytać „czy” warto je stosować, ale „jak” w sposób efektywny je budować i wykorzystywać.

Przewidywanie sprzedaży w nieprzewidywalnych czasach. Dlaczego warto prognozować nie tylko sprzedaż, ale także popyt?

Niestety niestabilna sytuacja gospodarcza sprawia, że utrzymanie rentownego biznesu sprzedaży detalicznej staje się coraz trudniejsze. Sprzedawcy muszą być w stanie przewidzieć przyszłość z pewną dokładnością, aby prowadzić dochodowy biznes. Prognozowanie sprzedaży i popytu stają się zatem dwoma kluczowymi aspektami planowania biznesowego.

Predykcja sprzedaży czy predykcja popytu – co wybrać?

Określenia predykcja sprzedaży i predykcja popytu niekiedy używane są zamiennie. Jest jednak pomiędzy nimi zasadnicza różnica. Czego owa różnica dotyczy i na której predykcji powinniśmy się szczególnie skupić? O tym w dzisiejszym artykule.

Na początek warto poświęcić chwilę na przypomnienie relacji pomiędzy kluczowymi pojęciami: popyt, sprzedaż i podaż. Popyt odnosi się do ilości produktów lub usług, jakie klienci chcieliby nabyć w danym okresie. Sprzedaż zaś to ilość produktów lub usług, które faktycznie zostały sprzedane w tymże  okresie. Do zaistnienia sprzedaży, konieczna jest podaż produktów lub usług, która zdolna jest zaspokoić popyt. Podaż bowiem to ilość dostarczonych produktów i usług, które są dostępne w danym okresie. Nie ma zatem sprzedaży, gdy nie ma popytu. Nie ma jednak również sprzedaży gdy jest popyt, a brakuje wystarczającej podaży. Generalnie, możemy mieć zatem do czynienia z trzema sytuacjami:

  1. Popyt = podaż
    Sytuacja idealna: klienci są usatysfakcjonowani możliwością zaspokojenia swoich potrzeb, a firma jest zadowolona gdyż sprzedaje cały dostępny zapas.

  2. Popyt > podaż
    Nie wszyscy klienci są w stanie zaspokoić swoje potrzeby, firma ponosi zaś koszty utraconej potencjalnej sprzedaży. Z sytuacją taką mamy do czynienia np. wtedy gdy brakuje danego towaru w magazynie, czy na półce sklepowej w momencie, w którym konsument chciałby go nabyć. W warunkach konkurencji rynkowej, klient może w takim wypadku kupić substytucyjny produkt/usługę u konkurencji.

  3. Popyt < podaż
    Sytuacja niekorzystna dla firmy, która zamroziła pieniądze w towarze zalegającym na półkach, traci możliwość wykorzystania powierzchni sklepowej i zasobów logistycznych na dostarczenie produktów na który jest popyt oraz ponosi ryzyko całkowitej utraty wartości produktu (np. w wyniki przekroczenia terminu przydatności do spożycia).

Trafne prognozy popytu pozwalają unikać sytuacji nr 2 i 3 albo przynajmniej minimalizować ich skalę i związane z nimi koszty. Jednocześnie możemy wskazać 5 obszarów, w których predykcja popytu przynosi korzyści.

Korzyści z prognozowania popytu

  • Optymalizacja produkcji i zapasów
    Dzięki trafnej predykcji popytu, firma może lepiej przewidzieć, jaką ilość produktów będzie potrzebowała na dany okres To pozwala na zoptymalizowanie procesów produkcyjnych oraz kontrolowanie poziomu zapasów.

  • Zwiększenie sprzedaży
    Zapewnienie odpowiedniej ilości produktów w magazynie pozwala firmie zwiększyć swoją sprzedaż oraz zadowolenie klientów.

  • Lepsze planowanie kampanii marketingowych
    Dysponując trafną predykcją popytu firma może lepiej zaplanować, które produkty (lub kategorie produktowe) i w jakim okresie opłaca się promować.

  • Optymalizacja cen
    Dzięki predykcji popytu i znajomości stanów magazynowych, firma może optymalizować cenę produktu, tak aby zrównoważyć popyt z podażą i zmaksymalizować zysk.

  • Redukcja kosztów
    Dzięki dokładnej predykcji popytu firma może uniknąć kosztów nadmiernych zapasów i niepotrzebnych kosztów logistycznych.

Predykcja sprzedaży a predykcja popytu – różnice

Co jeśli jednak zamiast predykcji popytu będziemy przygotowywać predykcję sprzedaży? W takiej sytuacji ryzykujemy niedoszacowanie. Jak już zauważyliśmy, sprzedaż następuje wtedy, gdy popyt spotyka się z podażą. W sytuacji, w której podaż jest niewystarczająca (brak towaru) to popyt nie zostanie zaspokojony i sprzedaż będzie niższa niż mogłaby być. W skrajnym przypadku przy całkowitym braku towaru na półce, sprzedaż będzie wynosić 0. Model predykcyjny sprzedaży może w takim wypadku prawidłowo przewidzieć brak sprzedaży. Wykorzystanie jednak takiego modelu do podjęcia decyzji o właściwym zapasie produktu skutkować będzie niedoszacowaniem i utratą potencjalnej sprzedaży. Co gorsza wskaźniki dokładności takiego modelu mogą być bardzo wysokie. Możemy mieć do czynienia bowiem z samospełniającą się przepowiednią:

Brak towaru → zerowa sprzedaż → model przewiduje brak sprzedaży w kolejnym okresie →
decyzja o braku dostawy produktu (skoro zakładany jest brak sprzedaży) → brak towaru.

I koło się zamyka.

Jest to potencjalnie kosztowny błąd na etapie przygotowywania koncepcji modelu i pułapka w którą niekiedy wpadają firmy. Tymczasem metody uczenia maszynowego pozwalają zbudować i wytrenować modele predykcyjne zdolne do predykcji popytu (a nie tylko sprzedaży). Modele takie biorą pod uwagę szereg różnych czynników wpływających na popyt (m.in. sezonowość, cenę, pogodę, promocje) i mogą działać na dowolnym poziomie agregacji (grupa produktowa/pojedynczy produkt, region/grupa sklepów/pojedynczy sklep itd.).

Podsumowanie

Trafna predykcja popytu to klucz do osiągnięcia sukcesu. Pozwala na redukcję kosztów, zwiększenie sprzedaży oraz podniesienie zadowolenia klientów. Jednak korzyści te może zapewnić tylko właściwy dobór metod data science odpowiednich do rozwiązania tego rodzaju problemu.

Gdzie mam szukać klientów?

Baza klientów to istotne aktywo każdego przedsiębiorstwa. Gromadzone o klientach dane pozwalają na lepsze targetowanie komunikacji i przygotowanie bardziej dopasowanej oferty. Zdrowy biznes potrzebuje jednak stałego dopływu nowych klientów. Na ich temat zaś nie ma zazwyczaj danych (lub jest ich niewiele). Gdzie szukać klientów? I czy data science może więc pomóc w docieraniu do nich?

Na postawione powyżej pytanie najlepiej odpowiedzieć na przykładzie. Jakiś czas temu jedna z firm chciała istotnie poszerzyć bazę klientów kupujących jej flagowy produkt. Doświadczenie podpowiadało, że produkt ten jest atrakcyjny dla zupełnie innej grupy konsumentów niż typowy klient firmy. Planowana była akcja reklamowa z wykorzystaniem bilbordów i ulotek. Przy ograniczonym budżecie firma nie chciała jednak „zasypać” materiałami całego miasta i okolic, w których działa. Zamierzała skupić swoje wysiłki i budżet w lokalizacjach o największym prawdopodobieństwie wysokiego zwrotu z inwestycji.

Pierwszym pomysłem, jak wykorzystać dane do rozwiązania tego problemu, było sprawdzenie skąd pochodzą aktualni klienci nabywający produkt. Ich dane adresowe były w bazie dzięki prowadzonemu programowi lojalnościowemu. Przeprowadzono analizę profilu demograficzno-behawioralnego klientów kupujących flagowy artykuł – przedmiot kampanii. W stosunku do typowych klientów, grupa ta cechowała się nadreprezentacją grupy wiekowej 30-35 lat o ponad 10 punktów proc. wyższym udziałem mężczyzn i wyższymi dochodami. Założono, że szczególnie atrakcyjne z punktu widzenia planowanej kampanii będą rejony o ponadprzeciętnym udziale mieszkańców o takiej właśnie charakterystyce. Wytypowano zatem obszary (osiedla, dzielnice, gminy) na podstawie kilku źródeł danych. Pochodziły one m.in. z informacji udostępnianych publicznie przez Główny Urząd Statystyczny oraz oferowanych komercyjnie przez różnych dostawców prywatnych.

W obawie, że samo wskazanie miejsc zamieszkania klientów o podwyższonym zainteresowaniu nie wystarczy, potrzebne było bardziej precyzyjne oszacowanie potencjału sprzedażowego poszczególnych lokalizacji. Krótko mówiąc, szukano odpowiedzi na pytanie: na jaką sprzedaż możemy liczyć? W tym celu zbudowany został model predykcyjny, który był w stanie dla każdego obszaru wskazać przewidywaną przyszłą sprzedaż w dowolnie zdefiniowanym okresie. Model wykorzystywał m.in. takie zmienne, jak struktura wieku i płci w poszczególnych dystryktach, dochody na gospodarstwo domowe, czas dojazdu do punktu obsługi, zachowania zakupowe istniejących klientów z danej okolicy. Przeciętny błąd predykcji modelu wahał się w granicach +/- 6%.  Dla zilustrowania poziomu szczegółowości, z jaką model był w stanie wskazać lokalizacje poniższa tabela zawiera definicję dwóch topowych rekomendacji modelu predykcyjnego.

Obszary z największym potencjałem wskazane przez model zostały także zwizualizowane na mapach (przykład jednej z nich poniżej).

W celu dokonania oceny trafności rekomendacji modelu porównane zostały efekty przeprowadzonych działań w grupie 10 najlepszych miejsc wskazanych przez model z 10 lokalizacjami z miejsc 11-20 rankingu. Zwrot z inwestycji w grupie rekomendowanej przez model był o ponad 21% wyższy w stosunku do grupy porównawczej.

Data science w odpowiedni sposób, łącząc wewnętrzne i zewnętrzne źródła danych o różnym poziomie szczegółowości (dane dotyczące indywidualnego klienta z danymi zagregowanymi opisującymi całe obszary), może pomagać rozwiązywać różnorakie problemy, przed jakimi staje biznes. Tym samym przyczynia się do zwiększania zwrotu z inwestycji.