Segmentace 5 miliónů zákazníků v České spořitelně

Česká spořitelna je největší retailovou bankou v České republice a má také nejdelší historii. Přesto si uvědomila, jak málo své zákazníky vlastně zná. Projekt segmentace zákazníků,  zložený na softwaru od společnosti SAS Institute jí přinesl znalosti, jaké potřebuje přenést do oblasti marketingu typu one-to-one, tj. přímo k zákazníkovi.

Prediktivní modelování založené na segmentaci nám dává na našem trhu klíčovou výhodu.

Petr Ptáčník
Data Mining Project Manager

Segmentace kleintské základny pro potřeby marketingu

Česká spořitelna se svými 5 miliony zákazníků je největší retailovou bankou v České republice a její kořeny sahají do roku 1825. Od roku 2000, kdy se Česká spořitelna stala členem silné skupiny Erste Bank, tato společnost prošla rozsáhlou transformací a dosáhla v klíčových oblastech výrazného zlepšení. Zaměřuje se na zlepšování svých produktových nabídek pro individuální klienty. Aby toho mohla dosáhnout, spustila projekt segmentace své klientské základny. Učinila tak na základě vysoké propracovanosti, s daty o vlastnictví, a s využitím bankovních produktů a služeb, a navíc použila demografická data. „Tím, že jsme vytěžili z dat informace o našich klientech jsme mohli položit základ segmentace všech našich zákazníků, nejen celého trhu. To je velmi podstatné, protože v našich systémech a v datovém skladu se nachází mnoho informací," uvedl Petr Ptáčník, Data Mining Project Manager u České spořitelny. Odborníci banky na obchod a marketing si uvědomovali, že precizní segmentace klientů bude základním stavebním kamenem pro budoucí volbu, jak zacházet se zákazníky a vytvářet pro ně produkty. Nad tím vším pak Česká spořitelna hodlala spravovat vztahy se svými zákazníky jako s jednotlivci, aby mohla maximalizovat výslednou hodnotu.

Tvorba segmentů

Na základě auditu bankovních dat bylo navrženo 10 dimenzí, okolo kterých bylo možno zákazníky segmentovat, aby banka vytěžila informace, jaké potřebovala. Tým pro dolování dat (data mining) zvolil primární dimenze, které vytvářejí vlastní segmenty. Primární dimenze byly dále členěny jednak co do všeobecných charakteristik klientů (ziskovost, stav životního cyklu, bonita a věrnost), jednak co do charakteristik specifických pro banky (vklady versus půjčky klientů, nároční klienti versus tradiční, aktivní versus spící, a také klienti s aktivním transakčním účtem versus ti jež jej neměli). Sekundární dimenze které nebyly určeny pro vytváření segmentů, avšak spíše pro jejich popis a pro poskytnutí některých dalších pohledů na jednotlivé klienty, zahrnovaly demografické údaje, jakými jsou místo bydliště a další různé informace, vztahující se ke klientovi a k bance.

Několik dimenzí volalo po kreativním myšlení a rozhodování týmu, aby bylo možno překlenout mezery ukryté v dostupných informacích. Banka například neměla k dispozici údaje o ziskovosti svých zákazníků, takže se tým musel rozhodnout použít hrubý výdělek (s úrokem a bez úroku) spíše než opravdový zisk. Původní plán počítal s využitím popisných stavů životního cyklu klienta, kam patří například dítě, mladá rodina, bezdětná rodina apod. Tým však shledal, že informace z dostupných dat byly často nespolehlivé nebo neúplné. Ti, kteří měli z dat vytěžit informace, proto museli provádět odhady založené na dostupných demografických údajích, jakými jsou například věk, příjem a výdaje, a dále ukazatele typu student nebo penzista. Pod pojmem "bohatost" tým považoval odhad finančního potenciálu, například jakou půjčku si může klient dovolit a s jakým dalším výdělečným potenciálem může banka počítat. Pro výpočet této hodnoty tým přičetl ke všem účtům celkovou kreditní sumu, polovinu celkového debitu a funkci čistého příjmu. "Vypracovali jsme vzorec pro kalkulaci bohatosti klienta se značnou přesností. Avšak byl příliš komplexní, aby pomohl při vlastním prodeji a v marketingu, takže jsme uplatnili jednodušší ukazatel," sdělil Petr Ptáčník.

Analytici České spořitelny postupně odhalovali, že efektivní segmentace se pohybuje téměř na pomezí umění a vědy. Jak totiž například ohodnotit zákazníka jako "loajálního"? Jedním z ohledů je samozřejmě doba, po kterou je jednotlivec zákazníkem banky. Druhým ukazatelem pak je počet bankovních produktů a služeb, jež si tento zákazník kupuje. Realizační tým proto začlenil do hodnocení loajality zákazníka oba tyto ukazatele. Určil pak ve firemních databázích sedm úrovní loajality, od ne-klientů, přes nové klienty, až po "středně zavázané klienty" se dvěma účty přičemž jeden z nich musel být starší pěti let, a nakonec až po "silně zavázané klienty" s přinejmenším třemi účty.

„Shledali jsme, že jednou z nejužitečnějších dimenzí bylo jednoduché určení zákazníků s vkladem a zákazníků s půjčkami, kdy jsme propočetli čistý poměr odečtením celkových půjček od celkových vkladů," prozradil Petr Ptáčník, a doplnil: „To bylo velmi užitečné, protože nám to umožnilo identifikovat zákazníky s vysokými vklady, které jsme pojmenovali jako ‚investory', a dále ty zákazníky, kteří jsou ve značných dluzích. Obě výše jmenované skupiny jsou pro banku zdrojem hodnot. U zákaznických segmentů přinášejících velké příjmy se ukázalo, že velmi málo z těchto zákazníků se pohybuje okolo nuly nebo těsného vyvážení, a že existuje velký počet zákazníků s vysoce pozitivní nebo negativní nevyvážeností. Když se pak jde směrem dolů, k nižším příjmovým hodnotám, tyto poměry se postupně obracejí."

Odborníci na marketing rovněž chtěli být schopni rozlišit mezi tradičními a vyspělejšími klienty. To sice zní hezky, avšak rozlišit je v praxi je mnohem obtížnější. "Využívání nových distribučních kanálů je určující a užitečné kriterium pro popis, avšak příliš úzké pro definici," vysvětluje Petr Ptáčník. Dimenze "aktivních versus spících" klientů byla další zajímavou oblastí, založenou na množství transakcí za měsíc, která byla týmem rozdělena na dvě skupiny. Jednu z nich určili jako "spící" na jednom okraji a jako "extrémně aktivní" na straně druhé.

Přiřazení klientů specifickým segmentům zjednodušila modelovací analýza. „Objektem zkoumání bylo opět poskytnout praktickou a užitečnou informaci obchodu a marketingu," zdůraznil Petr Ptáčník. Realizační tým nasadil standardní statistické nástroje, jako například korelační a faktorovou analýzu, a poté použil K-rozměrný prostor pro vytvoření 20 svazků (clusterů) s využitím 10 dimenzí. „Tento přístup může být dosti komplexní, proto jsme hledali způsob, jak snížit počet 20 clusterů a 10 klientských segmentů (plus tři ne-klientské segmenty) spojováním, novým segmentováním a novými návrhy," prozrazuje Jan Spousta, který v bance nasadil segmentační analýzu. Avšak jestliže bylo cílem přijít s jednoduchými segmenty, proč jít do takových délek? Proč jen jednoduše nenasadit pro segmentaci hotová pravidla, která stačí vzít "ze šuplíku"? Jan Spousta vysvětluje, že takovýto přístup by ani neposloužil praktickým účelům, ani by nepřinesl bance konkurenční výhody, jaké hledali. Například dva klientské segmenty, vkladatelé a klienti pobočky, jsou identičtí jinak než podle toho, zda jsou vkladatelé zákazníky mateřské banky. „Rozdíl je z analytického hlediska bezvýznamný. Avšak ke vkladatelům můžeme s nabídkou přistupovat přímo, takže z perspektivy subjektivního marketingu se jedná o kritickou důležitost. Účelem bylo vytvořit některá pravidla, jež by nám dala jednoduché, hierarchické a snadno aktualizovatelné segmenty, které by byly využitelné v našich specifických aplikacích. Segmentace není pouhým statistickým cvičením. Segmentace je požadavkem a zorným úhlem pohledu dnešního trhu," doplňuje Jan Spousta.

Vytvořené segmenty

Klientských segmenty v sestupném pořadí, jaký mají pro banku význam:

  • Investoři: vysoce hodnotní (bonitní) klienti.
  • Držitelé půjček: klienti s půjčkami, klienti generující vysoký příjem, nebo držitelé hypoték.
  • Solventní klienti: vysoké příjmy nebo vysoká vyváženost.
  • Dlužníci: obzvláště negativní čistá nevyváženost.
  • Mládež a studenti: mladší než 18 let a studenti.
  • Penzisté: klienti starší než 60 let nebo klienti s penzí jako zdrojem příjmů.
  • Nezabezpečení: nízká vyváženost a vlastnictví produktů typu půjček.
  • Transaktoři: vygenerují v průměru čtyři transakce za měsíc.
  • Klienti pobočky: nejsou zákazníky mateřské banky.
  • Vkladatelé: ostatní.
  • Hodnotu pro banku představují klíčové určující prvky: investor je například vysoce bonitní klient, bez ohledu na ostatní příznaky, jakými jsou například věk nebo příjem. „Jsme přesvědčeni, že jsme sestavili soubor zákaznických segmentů, s nimiž je obchodní a marketingový tým spokojen," tvrdí Jan Spousta, a dodává: „Když se kolega z marketingu nakonec zeptal: ‚Proč je to tak jednoduché?', to už jsem mohl považovat za fakt, že je náš přístup opravdu správný." Jan Spousta

Výsledky

Projekt segmentace nakonec dospěl v popisu segmentů do značných detailů: jejich velikosti, ziskovosti, demografie, vlastnictví produktů a dynamičnosti segmentů. Například graf příjmů podle klientů na jedné ose a velikost vkladů na druhé ose ukázal, že investoři přinášejí pro banku podstatně vyšší hodnotu než kterýkoliv jiný segment - na druhou stranu se však rovněž jedná o ten nejmenší. Držitelé půjček, kteří tvoří další velmi malý segment, jsou též velmi ziskoví, přestože mají negativní nevyváženost. "Takováto pozorování nám dávají důležitý náhled, jak máme se zákazníky nakládat na individuální úrovni," dodává Jan Spousta.

Odborníci, kteří v České spořitelně dolují informace z dat, vytvořili na zákaznickém základě dvě segmentace, a sice jednu v roce 2002 a druhou pro rok 2003. To jim umožnilo sledovat přesuny mezi segmenty a ukázalo se, že se tak stalo u zhruba 20 % klientů. Tým pak zmapoval statisticky nejvýznamnější přesuny. Řada z nich byla předvídatelných, ostatní byly spíše nepředvídatelné. „Pomohlo nám to porozumět typickým životním cyklům a odhalit nejlepší způsoby, jak přemístit zákazníky z některého segmentu do ziskovějšího. Typickou cestou je přesun z ne-klientské skupiny do skupiny studentů a mládeže, nebo vkladatele, transaktora (pokud si zákazník vede dobře), nebo do skupiny solventních klientů. Solventní klienti posléze směřují buď do segmentu investorů, nebo (například, pokud si zákazník vezme hypotéku), mezi držitele půjček. Méně úspěšní zákazníci pak zpravidla zůstávají v zajetí bludného kruhu periodických přechodů mezi segmenty nezabezpečených a dlužníků."

Česká spořitelna zakončila popis segmentů v létě 2004 a doplnila jej výsledky průzkumu trhu. „V současnosti vše uvádíme do běžného života banky," říká Jan Spousta. Odborníci kteří vytěžují z dat informace již analyzovali v každém ze segmentů nákupní vzory a umožnili marketingovým specialistům předpovědět, jací zákazníci si koupí které produkty, a podle toho zaměřit marketingové kampaně. „Prediktivní modelování založené na segmentaci nám dává na našem trhu klíčovou výhodu," vyvozuje Petr Ptáčník.

Ceska_sporitelna

Výzva

Česká spořitelna je největší retailovou bankou v České republice a má také nejdelší historii. Přesto si uvědomila, jak málo své zákazníky vlastně zná. Projekt segmentace zákazníků, zložený na softwaru od společnosti SAS Institute jí přinesl znalosti, jaké potřebuje přenést do oblasti marketingu typu one-to-one, tj. přímo k zákazníkovi.

Řešení

SAS Customer Intelligence

Výzva

Vznik platformy pro marketing na zákaznické úrovni.

The results illustrated in this article are specific to the particular situations, business models, data input, and computing environments described herein. Each SAS customer’s experience is unique based on business and technical variables and all statements must be considered non-typical. Actual savings, results, and performance characteristics will vary depending on individual customer configurations and conditions. SAS does not guarantee or represent that every customer will achieve similar results. The only warranties for SAS products and services are those that are set forth in the express warranty statements in the written agreement for such products and services. Nothing herein should be construed as constituting an additional warranty. Customers have shared their successes with SAS as part of an agreed-upon contractual exchange or project success summarization following a successful implementation of SAS software. Brand and product names are trademarks of their respective companies.