SAS Slovakia Newsletter / Biznis analytika

Môžeme veriť našim informáciám?

Každému iste napadne, že je dobré vedieť, z akých a ako kvalitných surovín sú vyrobené pokrmy, na ktorých si pochutnávame. Veď mnohokrát lákavo vyzerajúce, príjemne voňajúce a dokonca výborne chutnajúce porcie zďaleka nemusia byť hodnotné a zdravé.

Nemali by sme sa podobne zaujímať o suroviny, z ktorých je uvarená strategická informácia, ktorú konzumujeme? Veru mali!  Napriek tomu, že to vieme, je zarážajúce, ako málo sa staráme o to, z čoho a ako tá jedna verzia pravdy, na ktorú sa toľko spoliehame, vznikla.

Všetky tie technológie a metódy s overenými a vycibrenými postupmi skutočne dokážu vyrobiť z rôznorodého dátového materiálu dokonalý informačný produkt, a potom ho naservírovať v lákavej podobe  vrátane pomyselných čerešničiek na torte. Ale sú to stále len nástroje, ktoré vedia z mnohých surovín namiešať a upiecť jednu substanciu, ktorá potom pre pohľad na svet predstavuje vytúženú jednu verziu … ale čoho? Nemôže sa náhodou stať, že namixovaním a vyžehlením nekvalitného, neúplného, nesprávneho a nekonzistentného materiálu dospejeme skôr k jednotnej verzii NEPRAVDY? A na základe nej potom činíme naše strategické rozhodnutia? Možno , že nie, ale možno áno. Ale kto to má vedieť a ako to spoznáme?

Tým všetkým sa zaoberá dnes už celkom samostatný odbor kvality dát. Ide v ňom o to, aby materiál, z ktorého sa vytvárajú informácie, prešiel účinnou vstupnou kontrolou a aby bol pred ďalším použitím zušľachtený (vyčistený, zbavený balastu a hlušiny, doplnený o nevyhnutné prísady a predspracovaný). A aby mal „certifikát pôvodu“, teda v našom prípade metainformácie, z ktorých bude konečnému spotrebiteľovi jasné, z akých a ako kvalitných zdrojov pochádza a čo sa s ním všetko dialo, a ako sa teda môže na výsledok spoľahnúť…

Skúsme si to trochu priblížiť na jednoduchom príklade

Aká je bonita zákazníka?

Predstavme si úlohu, ktorej cieľom je analyzovať hodnotu jednotlivých zákazníkov pre náš biznis a na základe toho ich rozdeliť do skupín a o tie sa potom zodpovedajúcim spôsobom starať. Napr. identifikovať skupinu klientov s veľkým obchodným prínosom, perspektívnych klientov a tých, s ktorými sú spojené skôr náklady než zisk. Základnou otázkou v tejto situácii je, akú má klient hodnotu a ako ju dokážeme zistiť. Ideálne je samozrejme pozbierať všetky dostupné informácie o tom, ktoré produkty a v akom finančnom objeme si už zaobstaral, ako splácal alebo nesplácal záväzky, koľko peňazí a na akých účtoch si u nás uložil, do akej sociálnej skupiny patrí, ako sa jeho aktivity vyvíjali v čase, atď. – napadne nás iste mnoho ďalších vecí, ktoré by sa hodili. Pre zodpovedanie týchto otázok je podstatné, aby sme o ňom skutočne našli všetky informácie, čo je zase podmienené tým, „aby sme ho vždy poznali“. Teda – aby sme dokázali vždy rozoznať, že sa jedná o dáta toho istého klienta. Veď sú uložené v rôznych systémoch, vznikli v rôznom čase a údaje, podľa ktorých ho môžeme identifikovať, sa môžu trochu alebo veľmi líšiť. Náhodne alebo možno aj zámerne…  Takže sa môže ľahko stať, že ich systém môže považovať za viac (avšak menej bonitných) klientov alebo nebude možné vyhodnotiť s ním spojené prípadné riziká, atď. Všetky presné čísla vypočítané pokročilými metódami na báze zložitých modelov sú nanič, keď reportujú dvakrát (trikrát, štyrikrát, desaťkrát) viac klientov než v skutočnosti máme… Obdobné to môže byť s produktmi, ktoré sa v rôznych systémoch „iba trochu inak označujú”, ale aj adresami, kontaktmi, účtami a ďalšími údajmi.

Akosť dát

Rozpoznanie dátových záznamov, prináležiacich jednému subjektu (osobe, organizácii, účtu, výrobku, automobilu, adrese, kontaktu, …) je hlavnou cieľovou úlohou odboru dátovej kvality. Samozrejme, očakávame, že budú rovnako opravené chyby, zjednotené zápisy, doplnené chýbajúce položky, atď. Tých úloh je celý rad. Základom toho všetkého a kľúčom k ďalšiemu je na prvom mieste poznanie, aké dáta nám do spracovania vlastne vstupujú.

Aké – teda ako vyzerajú (formát, štruktúra), čo vlastne obsahujú (definície, biznis metadáta), ako boli vytvorené (procesy, štandardy) a na čo budú použité (biznis procesy)… a, samozrejme,  v akom sú stave (presnosť, správnosť, úplnosť, konzistencia…). Aby sme vedeli, ako môžeme s dátovou surovinou naložiť, potrebujeme všetko toto vedieť. Teda o aké dáta sa jedná – aká je ich akosť (latinsky je to rovnaké – “aký“ =“qualis“, odtiaľ  “akost”=”qualitas”).  A sme konečne zase pri kvalite dát.  Prečo sme sa o tom toľko rozrozprávali? Návrat k jazykovým koreňom až prekvapivo výstižne ukazuje, čoho sa dátová kvalita týka – teda nielen samotných chýb v dátach, ale predovšetkým súvislostí,  pri ktorých starosť o ňu dáva zmysel.

DQ a Biznis analytika

Ako je to s dátovou kvalitou v rámci riešení  biznis analytiky? Je zrejmé, že pre zmysluplné a spoľahlivé analýzy, reporty, dashboardy, grafy a strategické informácie vôbec, je potrebné zaoberať sa ošetrovaním dátovej kvality. A tiež sa to vždy dialo. Typicky v rámci procesov ETL, ktoré vždy v nejakej miere zachytávali a opravovali chyby, integrovali rôzne informácie, konštruovali konformované dimenzie…

Dá sa teda povedať, že dátová kvalita vždy bola, je a bude samostatnou disciplínou v rámci biznis analytiky. V posledných rokoch však získava omnoho širšie súvislosti. Čím ďalej sa viac rozostrujú hranice medzi svetmi primárneho a sekundárneho spracovania informácií, aj dátová kvalita musí slúžiť poskytovaniu pravdivej jednej verzie pravdy všetkým (teda aj operatívnym) systémom. A tak sa dnes stáva komplexnou iniciatívou v rámci podnikových programov starostlivosti o dáta a správy kmeňových dát, vznešene nazývaných Master Data Management. O tom zase nabudúce.

Vladimír Kyjonka, BI Advisor