Tipy na prácu so SAS Enterprise Minerom 5.2 (EM)
- Uzlu “Input Data Source” nemôže predchádzať žiaden iný uzol v procesnom diagrame
- Uzlu ”Sampling” musí predchádzať uzol, ktorý exportuje dataset
- Uzlu “Assessment” musí predchádzať aspoň jeden uzol, ktorý vytvára modely
- Uzlu “Score” musí predchádzať uzol, ktorý produkuje skórovací kód a v prípade, ak majú byť dáta aj oskórované, vstupom musí byť aj dátový súbor určený na preskórovanie (ľubovoľný kód, ktorý modifikuje dáta alebo vytvára modely, generuje skórovací kód)
- Uzol “SAS Code” môže byť použitý ako vstup v ľubovoľnom kroku pri tvorbe procesného diagramu. Ako vstup nevyžaduje ani uzol “Input Data Source”
Pri práci so SAS EM 5.2 je dôležité dbať na kvalitu vstupných údajov, formátov jednotlivých premenných aj v súvislosti s typom analýzy. Taktiež aj formáty a názvy premenných v modelovacích a skórovacích funkciách musia byť identické.
Keď užívateľ vytvorí alebo otvorí projekt, alebo procesný diagram v SAS EM 5.2, interné procesy, ktoré spravujú diagram a použité dátové zdroje sú priradené danému užívateľovi (sú zablokované - "locked"). Toto znemožní ostatným užívateľom v otvorení tohto diagramu, aby nedošlo k viacerým súčasným zmenám na tom istom projekte.

Ak nastane situácia, že pri práci s projektom sa stratí spojenie klientskej a serverovej časti aplikácie SAS Enterprise Miner, alebo je práca so SAS EM nekorektne ukončená, diagram a dátové zdroje zostávajú zablokované.
Zablokovanie je zrušené po určitej časovej perióde (ktorá je zadefinovaná). Doba, po ktorej je zablokovanie zrušené je špecifikovaná na Java Serveri. Je nastavená v milisekundách, pričom štandardné nastavenie je 600 000 milisekúnd (10 minút). Na zmenu tohto intervalu napr. na 30 sekúnd je potrebné zmeniť start-up súbor pre Java server nasledovne:
java -Djava.rmi.dgc.LeaseValue=30000 ServerMain
Pri vytváraní procesného diagramu a dopĺňania jednotlivých analýz (uzlov) si užívateľ môže špecifikovať vlastnosti úlohy a tieto interaktívne nastavovať. Vložením vybraného uzlu do diagramu a jeho označením sa v ľavej časti aplikácie zobrazí okno s nastaveniami danej úlohy.

Štandardne bývajú zobrazované základné vlastnosti vybranej úlohy. Pre zobrazenie všetkých vlastnosti a nastavení úlohy je potrebné nastavenie na rozšírené zobrazovanie vlastností úlohy (Advanced - viď obrázok).

SAS Enterprise Miner 5.2 v niektorých prípadoch pri opakovanom spracovaní neaktualizuje celý procesný diagram. Napríklad pri zmene v 3 uzle diagramu, neaktualizuje všetky predchádzajúce uzly. Všeobecne, všetky uzly nasledujúce po zmenenom uzle (vrátane neho) sú aktualizované a pri spracovaní sa výstupy pregenerujú. Uzly predchádzajúce zmenenému uzlu nebudú aktualizované, ani pregenerované výstupy.
Ak bude vykonaná zmena už v prvom uzle procesného diagramu(napríklad uzol „Input Data Source“), budú aktualizované všetky uzly tohto diagramu, ktoré nadväzujú. Potom pri spustení ľubovoľného uzlu, všetky predchádzajúce budú tiež pregenerované. Za zmenu je považovaná zmena parametrov úlohy alebo predchádzajúcich úloh.
Za zmenu na nepovažuje napr. zmena v dátovom zdroji (ak bol súbor len mechanicky prepísaný s rovnakým názvom súboru a premennými), prípadne ak boli dáta zmazané. Ak bola táto zmena vykonaná cez uzly úloh v SAS EM 5.2, alebo zmenou dátového zdroja, bude zohľadnená.
Po spracovaní úlohy sa v poslednej časti vlastností danej úlohy zobrazia aj informácie o stave spracovania úlohy, tj. či posledné spracovanie bolo úspešné, ako dlho trvalo spracovanie a kedy spracovanie prebehlo.

Po úspešnom spracovaní úlohy sú nastavenia „Needs Updating“ a „Needs to Run“ nastavené na „NO“ – t.j. ak nenastane zmena v danej úlohe alebo v úlohách predchádzajúcich úlohách, táto nebude pri opakovanom spúšťaní reálne vykonaná.
V prípade, ak je potrebné pregenerovanie celého diagramu od prvého uzla „Input Data Source“, je možné využiť možnosť nastavenia „Rerun“ a nastaviť ju na „Yes“.

Nastavenie „Rerun“ v uzle „Input Data node“ určuje, či chce užívateľ reálne spustenie daného uzla, ak spustí (prípadne znovu spustí) ktorýkoľvek uzol v tomto toku. Spracovanie je vykonané bez ohľadu na to, či už daný uzol bol úspešne spracovaný a nastali v jeho nastaveniach nejaké zmeny. Nastavenie na „YES“ znamená znovu spracovanie aj všetkých nasledujúcich uzlov bez ohľadu na zmeny v už vykonaných úlohách pri každom pregenerovaní.
Ak je ako typ výstupu („Output type“) nadefinovaný „View“, výstupom každého spracovania (bez ohľadu na nastavenia vlastnosti „Rerun“) budú vždy aktuálne dáta.
|