|
|
 |
 |
 |
Extraction, Transformation and Loading (ETL)
Ismert tény, hogy minden adattárház építési, üzleti intelligencia rendszer bevezetési projekt legkritikusabb része az ETL (Extraction, Transformation, Load) folyamat kiépítése és működtetése.
Az ETL biztosítja az adatok különböző rendszerekből történő elérésének, transzformációjának, integrációjának és betöltésének automatizált működtetését. Különböző felmérések bizonyítják, hogy egy teljes adattárház projekt költségvetésének kb. 60-80%-át az ETL kialakítása viszi el. Az ETL-nek nagyon fontos szerepe van az adatminőség kezelésében. A Data Warehousing Institute becslése szerint az adatok gyenge minősége az USA-ban évi 611 milliárd dollár veszteséget okoz.
Minden adattárház építési, üzleti intelligencia rendszer bevezetési projekt során felmerül a kérdés, hogy egyedi fejlesztéssel alakítsuk ki az ETL folyamatot vagy használjunk erre a célra egy ETL eszközt. Mindkét módszernek vannak előnyei és hátrányai de a SAS meglátása szerint amennyiben egy nagyobb intézmény, vállalat a döntéshozatal támogatását az összes területen adattárház alapokra szeretné helyezni, ez a kérdés egyértelműen eldől az ETL eszköz javára.
Tekintsük át milyen előnyei, hátrányai vannak az egyes megközelítéseknek:
Egyedi fejlesztés |
ETL eszköz |
| Előnyök |
- Alacsony licensz költség (általában már rendelkezésre áll valamilyen fejlesztőeszköz);
- egyedi igények, specifikumok maximálisan kielégíthetők;
- a programok optimalizáltak;
- korábbi fejlesztési projektek tapasztalatai felhasználhatók.
|
- Gyorsabban és olcsóbban alakíthatnak ki ETL-folyamatokat, s ehhez könnyen használható metaadat-kezelő eszközök állnak rendelkezésre;
- gyorsabban futtathatják az ETL-folyamatokat, mivel a nyílt, natív, többszálú és párhuzamos feldolgozásra képes adatkinyerő és -átalakító motorok párhuzamosan is dolgoztathatók, mégpedig platformfüggetlenül;
- csökkenthetik a birtoklási költséget azzal, hogy kihasználják a minőségi és konzisztenciaproblémákat megoldó, szabványos és a testre szabott adattisztítási képességeket;
- robusztus adatszolgáltatást biztosíthatnak többszállítós környezetben, az egyetlen platform elvén működő és hatékony átalakítási nyelv segítségével;
- kiterjeszthetik a meglévő egyedi rendszerek, hardverek és ERP-beruházások értékét.
|
| Hátrányok |
- A programok menedzselése, karbantartása nehézkes;
- az adattárházban bekövetkezett változtatások jelentősen befolyásolhatnak sok kapcsolódó alkalmazást;
- kódok központi tárházának hiánya;
- korlátozott metaadat-kezelési funkcionalitás;
- hosszú fejlesztési ciklus;
- limitált audit lehetőség.
|
- Magas bevezetési költség;
- a legtöbb termék csupán felhasználói ismerete;
- az optimalizálási lehetőségek helyenként korlátozottak.
|
|
 |
|