Knihy

IT SYSTEM 4/2002 - TRENDY

Olivia Parr Rud: Data Mining

Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM)
(Vydal: Computer Press, 2001)

Pojem "data mining" (DM) v názvu knihy působí poněkud podivně. Přitahuje čtenáře, kteří vědí o co v data miningu jde a paradoxně odpuzuje právě ty, kdo by se s ním měli, mohli nebo chtěli seznámit. Význam českého slova "dolování" řada lidí vnímá jinak, než odpovídá anglickému originálu mining. I já bych asi uvítal spíš pojem "vytěžování", než dolování, jelikož podstatnou částí procesu data miningu je datové modelování. Z pojetí knihy DM je zřejmé, že jde více o to "dolovat z dat" než o "dolování dat".

Autorka charakterizuje proces DM fázemi:

  • příprava dat pro modelování
  • výběr a transformace proměnných
  • zpracování a vyhodnocení modelu
  • ověření modelu
  • implementace a údržba modelu.

Autorka charakterizuje obecný cíl DM jako snahu o sloučení různých rozsáhlých a často nekompatibilních dat do systému - modelu umožňujícího odhalení vztahů mezi daty. Podtitulek knihy naznačuje, že metody a techniky DM jsou v knize spojovány s oblastí CRM.

Výrazem tohoto pojetí obsahu knihy je zaměření vybraných kapitol knihy na:

  • profilaci a segmentaci
  • modelování odezvy
  • modelování rizika
  • model pravděpodobnosti odchodu zákazníků
  • model LTV ( Long Time Value ) - hodnota produktu po dobu jeho existence.

Kniha se soustřeďuje na osvojení praktických znalostí potřebných pro využívání moderních technik modelování dat ve světě marketingu, rizika a řízení vztahů se zákazníky (CRM). Autorka vychází z poznání, že úspěch jakéhokoliv modelovacího projektu vyžaduje nejen dostatečné porozumění metodologiím, ale také dobrou znalost dat, trhu a celkových obchodních cílů. DM představuje širokou škálu technik a metod používaných v celé řadě dalších odvětví. Patří k nim pojišťovnictví, investiční bankovnictví, veřejné služby, telekomunikace, zásilkové služby, energetika, maloobchod, cestovní ruch, atd.

Autorka se cílevědomě snaží podat látku DM tak, aby byla aplikovatelná v reálném životě firmy - instituce. Hnacím motorem DM je profitabilita. V souladu s tím autorka akcentuje zaměření na segmentaci a profilaci zákazníků a maximalizaci efektivnosti direct-marketingu. Během své pedagogické praxe jsem se setkal s dvěma extrémy: na jedné straně dobrá znalost obsahových otázek aplikační oblasti provázená podceňováním exaktních metod a moderních technik, na straně druhé vysoká znalost moderních exaktních metod provázená potížemi při interpretaci výsledků jejich aplikace. Velice si vážím praktického přístupu autorky knihy DM právě proto, že vychází ze snahy o spojení obsahových poznatků zvolené aplikační sféry s metodami DM. Pokud jste se začetli do této mé recenze a zvažujete zda investovat či neinvestovat čas do studia obsahu knihy, odpovězte si na otázku: "potřebuji zhodnotit svá data ve prospěch firmy?". Plnému pochopení obsahu knihy prospěje znalost základů statistiky a zdravý podnikatelský úsudek. Základní znalosti o metodách statistického a analytického modelování a znalost jazyka systému SAS studium knihy velmi usnadní.

Kniha poslouží analytikům, pracovníkům v oblasti DM a marketingovým manažérům. Je škoda, že při překladu názvu knihy bylo vypuštěno slovo "kuchařka". Vyjadřuje dobře praktické zaměření textu a dodávalo by více odvahy začátečníkům. Kniha obsahuje celou řadu praktických rad a tipů od renomovaných expertů v oblasti DM. Každá kapitola končí stručným souhrnem poznatků. Obsahuje řadu případových studií, z nichž hlavní provází výklad v několika kapitolách knihy - především základními fázemi práce s datovým modelem. Příklady jsou postaveny na využití procedury pro logistickou regresi a programovány jsou v jazyce systému SAS. Kniha poslouží jako všestranný průvodce všemi fázemi procesu DM především pro ty, kdo se s DM setkávají poprvé. Pro zkušenější analytiky poslouží kniha jako užitečná reference. Manažéři získají přečtením knihy základní ponětí o dovednostech a postupech nezbytných pro úspěšnou aplikaci datových modelů. Věřím tomu, že kniha DM pomůže dobře pokrýt rostoucí poptávku po vzdělaných analyticích a odbornících na dolování dat. Podle této knihy se čtenáři naučí připravovat velmi výkonné datové modely ve velmi krátkém čase. Nedílnou součástí knihy je přiložený CD-ROM. Obsahuje vzorové databáze a demoverze dvou programů. Vzorová data jsou doplněna podrobnými popisy jednotlivých proměnných. Program JMP obsahuje řadu funkcí pro interaktivní statistickou analýzu dat. Program DATAFLUX představuje nástroj pro čištění, standardizaci, ověřování a integraci dat z nejrůznějších databází. Na CD jsou uvedeny i popisy obou programů společně s ukázkovými příklady. Nabízený kód může sloužit v roli samostatné modelovací šablony , jelikož kroky probíhající před a po procesu modelování lze aplikovat v jakémkoliv balíku pro datové modelování.

Autorem recenze je Doc. Ing. Katolický, CSc.

The Power To Know