Bayesowska analiza przyczynowa – skuteczna metoda pomiaru efektywności kampanii marketingowych

Do klientów wysyłamy nawet kilkanaście różnych wiadomości marketingowych w ciągu tygodnia. Często ta sama grupa odbiorców bierze udział w wielu różnych kampaniach. Stosujemy rozmaite kryteria kwalifikacji konsumentów do wysyłek. Zwykle różne kampanie rywalizują o tych samych „najlepszych” klientów. Nie zawsze możemy zastosować grupy kontrolne. Czasem przez pomyłkę grupa kontrolna zostaje skomunikowana. Na koniec zadajemy sobie pytanie: które z tych działań przyniosła rzeczywisty pozytywny efekt i przełożyło się na istotne dla nas wskaźniki. Czy nie brzmi to jak codzienności w wielu firmach?

Tradycyjne podejścia, jak testy A/B lub proste modele statystyczne, zawodzą w bardziej złożonych sytuacjach, w których kampanie się pokrywają, występują efekty zmiennych zakłócających, a zachowania klientów są zróżnicowane. Bayesian causal inference, czyli bayesowska analiza przyczynowa, oferuje innowacyjną i elastyczną alternatywę, która odpowiada na te wyzwania. Poniżej przyjrzymy się, jak ten model działa, jakie są jego kluczowe zalety oraz jakie ograniczenia należy uwzględnić.

Wyzwania stojące przed marketerami

Proste metody mogą być skuteczne tylko w idealnych laboratoryjnych warunkach. Rzeczywistość, w jakiej funkcjonuje rynek jest jednak od nich daleka. Marketing staje przed wieloma wyzwaniami, które utrudniają precyzyjną ocenę skuteczności kampanii. Możemy tutaj wskazać m.in.:

  • Nakładanie się kampanii – klienci często otrzymują kilka komunikatów marketingowych w krótkim czasie, co utrudnia przypisanie sprzedaży do konkretnej kampanii.

  • Kryteria przydzielania klientów do kampanii – wybór klientów do kampanii nie jest przypadkowy; klienci o wyższej wartości mogą częściej otrzymywać promocje, co może zakłócać wyniki analizy.

  • Różnorodność klientów – Odpowiedzi klientów na kampanie są różne w zależności od preferencji, demografii i wzorców zakupowych. Pominięcie tych różnic prowadzi do wyników, które nie oddają rzeczywistej skuteczności kampanii.

Bayesian causal inference odpowiada na te wyzwania, uwzględniając zróżnicowane zachowania klientów, nakładające się kampanie oraz wpływu selekcji klientów na wynik kampanii.

Czym jest bayesowska analiza przyczynowa?

Bayesowska analiza przyczynowa to metoda statystyczna, która pozwala ocenić rzeczywisty wpływ kampanii marketingowych na sprzedaż albo inne kluczowe dla marketera wskaźniki (np. lojalność). Osiąga się to poprzez budowę modelu opisującego wzajemny wpływ różnych czynników na generowane zachowania konsumentów. Model ten integruje wcześniejszą wiedzę marketera (np. pozyskaną z analizy poprzednich kampanii), aktualizuje ją na podstawie dostępnych danych, a następnie generuje rozkład prawdopodobieństw dla efektów kampanii i zachowań klientów.

Kluczowe składniki modelu

W modelu bayesowskim dla analizy przyczynowej kampanii marketingowych kluczowe są trzy elementy:

  1. Bazowa skłonność do zakupu – Niezależnie do kampanii każdy klient ma pewną naturalną skłonność do dokonania kolejnego zakupu wynikającą na przykład z jego cyklu życia, aktualnego nastawienia do marki, zasobności portfela.  Odpowiednie zamodelowanie bazowego poziomu wydatków z uwzględnieniem cech demograficznych, behawioralnych i transakcyjnych uwzględnić bazowy poziom wydatków, pomaga wyizolować rzeczywisty inkrementalny wpływ kampanii.
  1. Wpływ kampanii – Każda uwzględniana w analizie kampania ma modelowany osobno rozkład prawdopodobieństwa wpływu na sprzedaż. Pozwala to na ocenę, o ile kampania zwiększa sprzedaż powyżej bazowego poziomu wydatków klientów.

  2. Struktura hierarchiczna – Aby zapewnić skalowalność i poprawić interpretowalność wyników, klienci mogą być grupowani w segmenty, na przykład według demografii albo cech behawioralnych, z których każdy ma wspólne parametry.

Zalety wykorzystania bayesowskiej analizy przyczynowej w analizach marketingowych

  • Dokładność atrybucji – modelowanie oddzielnych parametrów dla wpływu kampanii i bazowych zachowań klientów pozwala na rozdzielenie nakładających się efektów kampanii i dokładniejsze przypisanie sprzedaży do poszczególnych działań.

  • Odporność na nielosowy wybór do kampanii – model uwzględnia wpływ kryteriów selekcji do kampanii, co daje mu przewagę nad metodami tradycyjnymi. Przykładowo,  bogatsi klienci mogą być częściej objęci pewnymi kampaniami. Bez uwzględnia ich naturalnej tendencji do wyższych wydatków model przeszacowywałby rzeczywisty efekt kampanii. 

  • Uwzględnienie heterogeniczności klientów – omawiana metoda bayesowska pozwala na uchwycenie różnorodności zachowań i cech klientów. Model bierze pod uwagę wypływ tych cech na bazową skłonność do zakupu oraz na skuteczność oddziaływani samej kampanii (ta sama kampania może w różny sposób oddziaływać na różne grupy klientów).

  • Precyzyjne oszacowanie niepewności wyniku – metoda bayesowska zapewnia pełny rozkład prawdopodobieństw wyników, co daje lepszy wgląd w wiarygodność estymacji i buduje zaufanie do metody. Minimalizuje to ryzyko wyciągnięcia niepoprawnych wniosków z przeprowadzanej analizy.

Ograniczenia baysowskiej metody

Jak każda metoda także bayesowska analiza przyczynowa ma swoje ograniczenia i wyzwania. Należą do nich przede wszystkim:

  • Wrażliwość na założenia początkowe – w przypadku ograniczonej ilości danych metoda jest dosyć wrażliwa na założenia początkowe co do przypuszczalnej skuteczności kampanii. Wraz ze wzrostem liczby dostępnych danych znaczenie tych wstępnych założeń maleje;

  • Kompetencje analityczne – choć same wyniki analizy są łatwe w interpretacji i przystępne dla osób bez wiedzy specjalistycznej z dziedziny data science to przeprowadzenie analizy wymaga wysokich kompetencji statystycznych, analitycznych i programistycznych;

  • Wymagania Techniczne – metoda jest dosyć złożona obliczeniowo i duże bazy konsumentów z licznymi kampaniami wymagają zaawansowanej infrastruktury obliczeniowej.

Umiejętne dostosowania modelu do dostępnych danych i mocy obliczeniowej będącej do dyspozycji może zmniejszyć ryzyka i niedogodności związane z tymi wyzwaniami. Tym istotniejsze jednak są odpowiednie kompetencje osób przeprowadzających analizy dla działu marketingu.

Podsumowanie

Bayesowska analiza przyczynowa oferuje dokładne i skalowalne podejście do oceny wpływu kampanii marketingowych na kluczowe dla marketerów wskaźniki (np. sprzedaż, lojalność). Model uwzględnia zróżnicowanie klientów, wpływ kryteriów selekcji i efekty nakładających się kampanii, co pozwala uzyskać bardziej precyzyjne wyniki niż w przypadku metod tradycyjnych. Choć istnieją ograniczenia, takie jak zależność od założeń początkowych i ograniczenia w skalowalności, metoda ta dostarcza wartościowych informacji, które wspierają podejmowanie decyzji opartych na danych. Dzięki temu zespoły marketingowe mogą lepiej alokować budżety, dostosować strategię kampanii i optymalizować komunikację z klientami, zwiększając efektywność wydatków marketingowych.

Zysk Natychmiast czy Lojalność na Lata? Uczenie maszynowe w zarządzaniu krótko- i długoterminową wartością klienta

Jedno z kluczowych wyzwań w zarządzaniu relacjami z klientami, to godzenie ze sobą perspektywy krótko i długoterminowej wartości klienta (Customer Lifetime Value, CLV). Czy lepszy jest niższy zysk tu i teraz czy potencjalnie większy, ale przecież niepewny w przyszłości? Czy i ile opłaca się zainwestować dziś w klienta by zyskać więcej w przyszłych okresach? To tylko niektóre z dylematów przed jakimi stają marketerzy. W tradycyjnym podejściu istnieje wiele „pokus” by koncentrować się na szybkich zyskach kosztem budowania trwałych relacji z klientami. Jednak w dzisiejszym niezwykle konkurencyjnym w większości branż rynku, strategiczne połączenie krótkoterminowych sukcesów z długoterminowym wzrostem wartości klienta staje się kluczowe dla przetrwania i rozwoju przedsiębiorstwa. Uczenie maszynowe w unikalny sposób może pomóc w balansowaniu tych dwóch perspektyw.

Krótko- a długoterminowa wartość klienta

Krótkoterminowa wartość klienta to metryka, która odnosi się do bezpośrednich przychodów generowanych z pojedynczej transakcji lub krótkotrwałej interakcji z klientem. Przykładami działań nastawionych na maksymalizację tej wartości mogą być krótkie kampanie promocyjne, intensywne akcje sprzedażowe, czy szybkie kampanie remarketingowe. Głównym celem jest szybki zysk – działania te często są oparte na promocjach, obniżkach cen lub ofertach typu „kup teraz”, które zachęcają do natychmiastowych zakupów.

Z kolei długoterminowa wartość klienta to całkowita wartość, jaką klient może przynieść firmie na przestrzeni lat. W tym przypadku, istotne jest nie tylko to, ile klient wyda w pojedynczej transakcji, ale także jego lojalność wobec marki, częstotliwość powrotu, rekomendacje i wpływ na innych klientów. Strategie oparte na długoterminowej wartości koncentrują się na budowaniu trwałych relacji, angażowaniu klientów i tworzeniu doświadczeń, które zwiększają ich satysfakcję oraz lojalność.

Uczenie maszynowe (ML) a maksymalizacja wartości klienta

Uczenie maszynowe (ang. machine learning, ML) rewolucjonizuje wiele aspektów funkcjonowania firm, w tym także sposób jaki zarządzają relacjami z klientami. Dzięki zaawansowanych modelom predykcyjnym, możliwe jest przewidywanie, jaka będzie wartość danego klienta w określonym przedziale czasowym. Modele te biorą pod uwagę nie tylko dane o  bieżących i historycznych zakupach, ale również historię interakcji klienta z marką, poziom jego zaangażowania w kampanie marketingowe oraz wiele innych zmiennych.  

Dzięki precyzyjnym predykcjom, firmy mogą różnicować swoje działania kierowane do poszczególnych segmentów  – na przykład zainwestować więcej w klientów o wysokiej długoterminowej wartości lub skoncentrować się na zwiększaniu krótkoterminowej wartości klientów o mniejszym potencjale lojalności. Przykładowe podejścia do konsumentów o różnych estymacjach wartości dla firmy zestawione są w poniższej matrycy.

Kluczem do skutecznej implementacji takiego podejścia jest bardzo precyzyjna predykcja wartości konkretnego klienta w obu perspektywach czasowych. Osiągnięcie tego jest zaś praktycznie niemożliwe bez odwołania się do metod uczenia maszynowego, zwłaszcza w przypadku bardzo licznych baz konsumentów.

Możliwości uczenia maszynowego

W przykładzie dzielimy horyzont wartości klienta na dwie grupy: krótki i długi. Nic nie stoi jednak na przeszkodzie by dokonać dokładniejszego podziału i stworzyć modele predykcyjne odpowiadające dowolnie dużej liczbie perspektyw czasowych relewantnych dla danej bazy konsumentów czy branży. Możliwości uczenia maszynowego nie ograniczają nas także do uproszczonych klasyfikacji typu wysoki/niski. W praktyce możemy uzyskać konkretną wartość monetarną wraz z oszacowanym marginesem błędu. Na wykresie poniżej najjaśniejszy obszar reprezentuje najbardziej prawdopodobną kombinację krótko i długookresowej wartości konkretnego konsumenta z bazy.

Co więcej możliwe jest również precyzyjne oszacowanie, w jaki sposób zakwalifikowanie danego klienta do konkretnej kampanii wpłynie na jego krótko- i długookresową wartość. W przykładzie poniżej kampania o kodzie A411 dla klienta o id 1411642 z dużym prawdopodobieństwem zwiększy jego krótkookresową wartość – zdecydowana większość obszaru na prawo od czerwonej pionowej linii oznaczającej 0 (brak zmiany). Model szacuje jednak, że wpływ tej kampanii na wartość klienta w długim horyzoncie będzie raczej negatywny – większa część obszaru poniżej poziomej czerwonej linii oznaczającej 0 (brak zmiany) w długim okresie.

Podsumowanie

Utrzymanie równowagi między krótkoterminową a długoterminową wartością klienta to jedno z największych wyzwań dla marketerów. Dzięki uczeniu maszynowemu, firmy mogą wreszcie połączyć te dwa cele, zamiast wybierać między szybkim zyskiem a długoterminową lojalnością klientów.

W praktyce oznacza to, że algorytmy mogą przewidywać, którzy klienci przyniosą większą wartość w długiej perspektywie, pomagając firmom inwestować w budowanie relacji z nimi, a jednocześnie optymalizować szybkie kampanie sprzedażowe dla mniej lojalnych klientów. Dzięki ML, możliwe staje się ograniczenie ryzyka „krótkowzroczności marketingowej” – firmom nie grozi już koncentrowanie się wyłącznie na szybkich, jednorazowych zyskach kosztem lojalności.

Przyszłość marketingu będzie opierała się na jeszcze bardziej zaawansowanych modelach predykcyjnych, optymalizacyjnych i automatyzacji decyzji, co pozwoli na maksymalne wykorzystanie potencjału każdego klienta – zarówno w perspektywie krótko, jak i długoterminowej.

Dlaczego nie odnoszę spodziewanych korzyści ze stosowania AI w marketingu?

Zainteresowanie tematem sztucznej inteligencji (AI) nie słabnie. Niemalże każdego dnia pojawiają się zapowiedzi kolejnych przełomów w tej dziedzinie. Publiczność najbardziej ekscytuje się osiągnięciami tzw. generatywnej AI. Są one najbardziej spektakularne i wywierają największe wrażenie. Rozmowa z komputerem w języku naturalnym, komputer malujący obrazy albo tworzący film na podstawie podanego mu scenariusza przemawiają do wyobraźni.  Warto jednak pamiętać, że AI to także bardziej prozaiczne modele, które, działając w tle i bez przykuwania aż tak wielkiej uwagi, odgrywają istotną rolę w wielu procesach biznesowych w tym także w marketingu. Zdarza się, że nie przynoszą jednak spodziewanych korzyści a ich działanie bywa rozczarowujące. Jakie błędy mogą przyczyniać się do takich sytuacji i co zrobić, aby ich uniknąć?

Niewłaściwie sformułowany problem

Zdarza się, że już na samym początku projektu AI pojawia się fundamentalny kłopot. Jest nim wyraźny rozdźwięk między rzeczywistą potrzebą biznesową a definicją problemu, do którego rozwiązania zabiera się zespół AI. Przykładowo zespół marketingowy stawia sobie za cel zmniejszenie liczby odchodzących klientów. Zamierza wykorzystać do tego specjalną akcję obejmującą kupony z atrakcyjnymi rabatami. Naturalnie budżet na te działania jest ograniczony. W pierwszym kroku zespół chce zidentyfikować klientów najbardziej zagrożonych rezygnacją.

Zleca więc komórce AI opracowanie modelu szacującego prawdopodobieństwo odejścia dla każdego klienta. Team AI wywiązuje się ze swojego zadania znakomicie. Buduje model o bardzo dużej dokładności predykcji. Dział marketingu postanawia więc wykorzystać model i kwalifikować do akcji osoby o największym prawdopodobieństwie odejścia aż do wyczerpania budżetu. Akcja się odbywa. Całkiem dużo zagrożonych konsumentów zostaje. Wszyscy mają poczucie dobrze wykonanej pracy i racjonalnie wykorzystanego budżetu. Czy jednak rzeczywiście budżet został wykorzystany optymalnie? Czy można było coś zrobić lepiej? Okazuje się, że tak.

Zamiast prawdopodobieństwa odejścia można było przewidywać szansę pozytywnej reakcji na akcję. Z pozoru drobna różnica. Może jednak przynieść diametralnie lepsze efekty. W zastosowanym wariancie kwalifikowano osoby najbardziej zagrożone. Wśród nich były jednak osoby, których nie da się przekonać do pozostania żadną akcją. Są to bardzo często właśnie osoby ze szczytu listy zagrożonych – sfrustrowane obsługą klienta, rozczarowane jakością produktu, już od jakiegoś czasu poszukujący alternatywnego dostawcy. Wykorzystując budżet na tych konsumentów, pominięto konsumentów o nieco niższym (ale wciąż wysokim) ryzyku, którzy były jednak bardziej podatne na zmianę decyzji dzięki przeprowadzonej akcji. Pewna cześć budżetu została zmarnotrawiona na próbę przekonania tych, których przekonać się nie dało. Równocześnie nie wykorzystano możliwości przekonania tych, na których decyzję można było jeszcze wpłynąć. Lepsze, bardziej precyzyjne zdefiniowanie problemu w kontekście oczekiwanego efektu biznesowego pozwoliło by na skorzystanie w dużo większym stopniu z możliwości jakie daje zastosowanie algorytmów AI.

Niewłaściwe mierniki sukcesu

W wielu sytuacjach przyjęcie niewłaściwych wskaźników może prowadzić do błędnych decyzji. Bywają one związane także z rezygnacją z narzędzi, które. Jedna z prężnie działających na rynku polskim firm dysponowała zbudowanym specjalnie dla niej systemem predykcyjnym AI pozwalającym na spersonalizowną rekomendację oferty, która miała być zawarta w wysyłanym mailingu. Firma miała bardzo szerokie portfolio produktów i wiele konkurujących ze sobą ofert. Stworzony system miała za zadanie dobierać relewantną dla danego konsumenta i jednocześnie maksymalizującą możliwy do osiągnięcia zysk, komunikację. Chodziło także o to, by nie bombardować konsumenta zbyt dużą liczbą komunikatów. Główną obawą była rezygnacja z otrzymywania mailingów przez „zaspamowanych” klientów. Szczycono się tym, że wskaźnik „unsubscribe” utrzymuje się na bardzo niskim poziomie. W warunkach silnej presji wyników sprzedażowych, zaczęto jednak postrzegać limitowanie liczby komunikatów jako przeszkodę w realizacji celów. Managerowie przypuszczali, że zwiększenie liczby wysyłanych wiadomości przyniesie większą sprzedaż. Obawiano się jedynie zwiększonego odsetka rezygnacji z subskrypcji.

Przeprowadzony został quasi-eksperyment, polegający na zwiększeniu liczby komunikatów przy jednoczesnej obserwacji wskaźników sprzedażowych oraz odsetka rezygnacji. Sprzedaż wzrosła a podwyższenia wskaźnika odejść nie zaobserwowano. Zachęciło to dalszego zwiększania liczby komunikatów aż do całkowitej rezygnacji z utrzymywania wspomnianego narzędzia AI. Firma zrobiła więc krok wstecz. Model został odrzucony na rzecz „eksperckiego” kwalifikowania konsumentów do komunikacji. Pozostający na stabilnym poziomie odsetek rezygnacji utrzymywał decydentów w przekonaniu, że liczba wysyłek, oczywiście jeśli pozostanie w jak to ujęto „granicach zdrowego rozsądku”, nie zniechęca klientów do subskrybowania. Głosy zespołu data science, który próbował przekonać do szerszego spojrzenia na problem, zostały zignorowane. Popełniono szkolny błąd.

Managerowie zignorowali uwidaczniający się spadkowy trend wskaźnika otwarć (open rate). Zaawansowany model został odrzucony i uznany za zbędny koszt. Nie wzięto pod uwagę, że konsumenci mogą być do tego stopnia przesyceni, że zaczynają ignorować wiadomości od tego nadawcy. Przestają je otwierać, a co za tym idzie, nie dbają także by kliknąć w link „wypisz mnie”. Możliwość utrzymania długotrwałej relacji i możliwości generowania zysków z komunikacji w przyszłości, poświęcono na rzecz krótkotrwałego efektu sprzedażowego.

Błędy w komunikacji pomiędzy zespołem marketingowym a zespołem AI

Wspólnym mianownikiem obu przytoczonych wcześniej sytuacji jest w istocie brak odpowiedniej komunikacji między zespołem marketingu a zespołem AI. W pierwszym przypadku można było przekazać do zespołu AI więcej informacji dotyczących celu biznesowego i kontekstu (w tym także ograniczeń budżetowych) projektu. Dałoby to szansę na bardziej adekwatną definicję problemu i pełniejsze wykorzystanie możliwości, jakie daje zaawansowane modelowanie. W konsekwencji przełożyłoby się to na lepsze wykorzystanie budżetu i wyższe ROI. W drugim przypadku należało przyłożyć większą wagę do zgłaszanych przez zespół AI wątpliwości co do definicji problemu i przyjętego miernika. Pozwoliłoby to na uniknięcie, kosztownej w dłuższym okresie, błędnej decyzji o powrocie do starych metod i odrzuceniu potencjału AI.

Sukces projektu i pełne wykorzystanie możliwość AI wymaga dobrej komunikacji i współdziałania ekspertów od marketingu z ekspertami AI. W osiągnięciu takiego stanu może pomóc unikanie następujących błędów:

  • zbyt ogólnie zdefiniowany cel biznesowy („chcemy ograniczyć liczbę odchodzących klientów” to o kilka poziomów szczegółowości za mało),

  • nieostre definicje fundamentalnych pojęć (niekiedy wyzwaniem jest zdefiniowanie co to znaczy, że klient odszedł),

  • brak określenia kontekstu i rzeczywistego celu biznesowego w briefie przekazywanym do zespołu AI,

  • ukrywanie przez zespół marketingowy przed zespołem AI braków w zrozumieniu specyfiki i możliwości rozwiązań AI,

  • związane z powyższym nadmierne oczekiwania wobec rezultatów projektu albo uznanie z góry, że AI nie może pomóc w rozwiązaniu danego problemu marketingowego,

  • ukrywanie przez zespół AI przed zespołem marketingowym braków w rozumieniu zagadnień z dziedziny marketingu i kontekstu projektu,

  • związane z powyższym ograniczenie się zespołu AI do literalnej interpretacji dostarczonego briefu,

  • posługiwanie się „nowomową” branżową,

  • nadmierne skupienie się na technikalniach kosztem utraty przez zespół AI perspektywy biznesowej i realnego celu projektu.

Podsumowanie

Przytoczone w artykule przykłady to tylko wierzchołek góry lodowej. Niektórzy mogą postrzegać obie sytuacje jako proste, wręcz szkolne błędy. To dobrze. To znaczy, że są już na wyższym poziomie rozumienia specyfiki pracy z projektami AI. Tam także jednak czyhają pułapki. Dla innych nawet te dwa przytoczone przykłady mogą otwierać oczy, skłonić do refleksji i poszukać podobnych problemów we własnych projektach. To też dobrze. To znaczy, że stawiają kolejny ważny krok na drodze do pełniejszego wykorzystania potencjału jaki drzemie w marketingowych zastosowaniach AI. W każdej sytuacji należy pamiętać, że do zastosowania AI z sukcesem potrzebna jest dobra komunikacja i współpraca zespołu data science/AI z zespołem marketingowym.

Jak wyjść z pułapki RFM?

(R)ecency, (F)requency, (M)onetary value to klasyka analizy marketingowej. Wszyscy to znamy. Wielu z nas korzysta. Każdy z nas rozumie. Czy jednak na pewno? Analiza RFM ma bez wątpienia wiele zalet i dlatego też jest w użyciu już od wielu lat. Warto poznać jednak także jej wady i ograniczenia. Po to by stosować ją właściwie i nie usiłować rozwiązywać przy jej pomocy problemów, których nie jest w stanie rozwiązać.

RFM w praktyce

Podejście RFM jest metodą segmentacji klientów, która opiera się na trzech głównych wskaźnikach:

  • Recency (ostatni zakup): określa, jak (nie)dawno klient dokonał zakupu.
  • Frequency (częstotliwość zakupów): mierzy, jak często klient dokonuje zakupów.
  • Monetary (wartość zakupów): określa, ile klient wydaje podczas każdego zakupu.

Zakładając, że mamy dane o transakcjach klientów, dla każdego z nich obliczamy wartość trzech wymienionych wcześniej wskaźników (R, F, M). Następnie wartości dla każdego wskaźnika dzielimy na grupy (przykładowo 3), gdzie grupa I to czołowa 1/3 klientów pod względem danego wskaźnika, grupa II do środkowa 1/3 klientów, a grupa III to najsłabsza 1/3 klientów. Dla lepszego zrozumienia rozważmy przykład konkretnego klienta. Klient ten ostatnio dokonał zakupu 15 dni temu, a więc całkiem niedawno. Kupuje średnio 2 razy w miesiącu, co w przypadku tej bazy konsumentów jest wysoką częstotliwością. Jego średni paragon jednak to zaledwie 50 zł, co jest na tle innych klientów stanowi bardzo niską wartość.

Nasz przykładowy klient jest zatem w czołowych grupach pod kątem R i F oraz w najsłabszej grupie ze względu na M. Może go zatem oznaczyć R-1, F-1, M-3. Przy takim podziale konsument może trafić do 1 z 27 segmentów (3R x 3F x 3M = 27) Warto zaznaczyć, że dla każdej grupy kategoryzować można również na więcej niż 3 przedziały. Wszystko zależy od tego, ile segmentów RFM chcemy uzyskać. Jak już wspomniałem wcześniej – przy podziale na 3 uzyskujemy 27 segmentów. Przy podziale na 4 mamy 64 segmenty. Jeśli będziemy dzielić na 5 to liczba segmentów wzrośnie aż do 125. Przy podziale na 6 uzyskamy 216 segmentów, a jeśli zakres każdej z 3 zmiennych zdecydujemy się dzielić na 10 przedziałów to łączna liczba segmentów osiągnie aż 1000.

Jakie zalety ma RFM?

Wśród zalet podejścia RFM możemy wskazać m.in.:

  • Prostota i łatwość interpretacji –  wynika z niewielkiej liczby zmiennych (trzy), prostego do wytłumaczenia sposobu przeprowadzenia analizy i co za tym idzie intuicyjnej interpretacji  powstających segmentów.
  • Relatywna szybkość przeprowadzenia analizy.
  • Brak konieczności posiadania specjalistycznego oprogramowania.
  • Stosunkowo niskie wymagania, co do znajomości metod statystycznych.

Do czego prowadzi prostota analizy RFM?

Niestety wymieniona wśród zalet prostota, jest źródłem także jednej z najistotniejszych wad podejścia RFM. Ograniczenie liczby wymiarów do 3 (R,F,M) ułatwia interpretację wyników, ale jednocześnie zawęża powstający w ten sposób profil konsumenta. Podsumowanie aktywności transakcyjnej konsumenta przy pomocy 3 liczb, jest często zbyt daleko idącym uproszczeniem. Może dawać bardzo zniekształcony (a wręcz zafałszowany) obraz klienta. Ilustruje to poniższy przykład.

Diagram pokazuje czterech klientów z zauważalnie różnymi wzorcami zakupowymi, ale identycznymi cechami pod względem ostatniego zakupu, częstotliwości zakupów i stażu (pierwszego zakupu).

Ten sam problem dotyczy także wartości wydatków. Klient, który wydaje zawsze 50 zł i klient, który wydaje raz 1 zł a raz 99 zł, będą mieli taką samą średnią wartość paragonu.

Kolejnym ograniczeniem metody RFM jest pomijanie pozatransakcyjnych aspektów zachowań konsumentów. Chociażby takich jak interakcje z kierowaną do nich komunikacją marketingową, kontakty z różnymi punktami styku z firmą (np. reklamacji, telefonów do call center) czy aspekty demograficzne (np. w niektórych branżach częstotliwość i wydatki mogą się zmieniać wraz z wiekiem).

Wśród ograniczeń RFM warto wskazać również skupienie na historii. RFM podsumowuje zachowania zakupowe konsumentów od pewnego do pewnego momentu. Pomaga posegmentować klientów w oparciu o ich przeszłe transakcje. RFM nie mówi jednak nic o ich przyszłych zachowaniach. Sam w sobie nie ma żadnej mocy predykcyjnej.

Istnieją rozmaite wariacje i rozwinięcia modelu RFM. Dodawane są do niego nowe zmienne (np. RFD, RFE, RFM-I) lub modyfikowany jest sposób ich kalkulacji.  Celem jest przezwyciężenie wspomnianych wcześniej ograniczeń. Nie zmieniają one jednak fundamentalnego problemu a więc próby opisania złożonych zachowań konsumentów przy pomocy kilku zagregowanych liczb.

Na czym polega pułapka RFM?

RFM może stać się więc pułapką przede wszystkim, gdy:

  • jest głównym (lub wręcz jedynym) narzędziem, jakie wykorzystujemy do analizy oraz planowania strategii i działań komunikacyjnych.
  • Wyniki RFM są nadinterpretowane tzn. wyciągane są z nich wnioski, do których metoda ta nie daje podstaw.

W pierwszym przypadku pomijamy istotną część danych o konsumentach jakie można by wykorzystać, pracujemy w oparciu o bardzo wąski obraz konsumenta i ryzykujemy połączenie w ramach jednego segmentu konsumentów o zupełnie odmiennych wzorcach zachowań.

Drugi przypadek dotyczy przede wszystkim wykorzystywania RFM do predykcji przyszłych zachowań konsumentów zwłaszcza na poziomie mikro. Manifestować się to może m.in. w zakładaniu, że konsument osiągający najwyższe wartości wskaźników RFM będzie w przyszłości utrzymywać się w najlepszym „segmencie” . To oczywiście może być prawda. Nie decydują o tym jednak wyłącznie przeszłe zakupy, ale wiele innych czynników, których RFM, co do zasady nie uwzględnia.

Jakie są alternatywy dla RFM?

Jak już zauważyliśmy wcześniej główne ograniczenia wykorzystania podejścia RFM sprowadzają się do:

  • Zbyt uproszczonego obrazu konsumenta i tym samym dużego ryzyka błędu segmentacji.
  • Braku możliwości predykcji zachowań konsumentów.

Do rozwiązania pierwszego problemu znakomicie nadają się segmentacje wielowymiarowe oparte o uczenie maszynowe. W ich przypadku liczba uwzględnianych czynników może być niemal nieograniczona. Segmenty są definiowane w sposób algorytmiczny. W taki sam sposób przypisywani są też do nich konsumenci. Kosztem większej szczegółowości jest nieco trudniejsza interpretacja. Doświadczony analityk potrafi jednak zwizualizować segmenty w taki sposób, aby były łatwo rozumiane przez menedżerów.

Problem predykcji najlepiej rozwiązywać przy pomocy dedykowanych do tego metod i algorytmów budowy modeli predykcyjnych. Modele takie nie tylko ograniczają się do analizy danych historycznych ale rozpoznają specyficzne wzorce zachowań pozwalające na predykcje przyszłości. Predykcja taka może być prowadzona na poziomie pojedynczego konsumenta (a nie segmentu) i pozwalać na pełną personalizację działań. Wśród konkretnych metod warto tutaj wspomnieć o modelach sekwencji zachowań opartych o głębokie uczenie maszynowe.

Podsumowanie

Znany i popularny model RFM może być bardzo użytecznym narzędziem. Pod warunkiem jednak, że będzie właściwie interpretowany i stosowany ze świadomością jego ograniczeń. To świetne narzędzie, żeby spojrzeć na bazę konsumentów „z lotu ptaka”. Gdy zależy nam jednak na bardziej szczegółowym obrazie oraz predykcji przyszłych zachowań konsumentów, należy zwrócić się w stronę narzędzi wyspecjalizowanych do rozwiązywania tego typu problemów.