Wsparcie techniczne
Zrób to sam
Dla aktywnych
Nasze dokumenty
Architektura SAS® 9
FAQ
Hotline
Kilka słów o nas
 

FAQ - SAS® Data Integration Studio

Wersja 3.4

  • Co nowego w DI Studio 4.2?
  • Gdzie znajduje się podręcznik użytkownika do DI Studio 4.2?
  • Gdzie znajdują się informacje o hot fixach do DI Studio 4.2?
  • Czy DI Studio 4.2 może współpracować z serwerem metadanych 9.1.3?
  • Dlaczego na serwerze ciągle działa proces, chociaż zadanie uruchomione w DI Studio zakończyło się?
  • Czy można uruchomić różne zadania w jednej sesji workspace serwera?
  • Czy ta sama tabela może być użyta kilka razy w tym samym zadaniu?
  • Co zrobić, żeby przy ładowaniu tabeli był wykorzystany bulk-load?
  • Jak przy eksporcie do pliku tekstowego NIE umieszczać wartości numerycznych w cudzysłowach?
  • Czy transformacja może zapisywać wyniki bezpośrednio do docelowego zbioru?
  • Czy wynikowa tabela musi być zarejestrowana w metadanych przed stworzeniem zadania?
  • Jak najprościej dodać do zadania polecenie zawiadamiania użytkownika, że zadanie/transformacja zakończyło się?
  • Jak automatycznie zapisywać informacje o czasie przetwarzania zadania?
  • Jak można zdefiniować akcję w ramach mechanizmu Status Handling, jeżeli transformacja nie ma takiej zakładki?
  • Przy przetwarzaniu batchowym zadania stworzonego w DI Studio pojawia się błąd:
    ERROR: The PERFINIT macro has not been run.
    
  • W kodzie generowanym przez DI Studio domyślnie włączona jest opcja MPRINT. Czy można ją wyłączyć?
  • Gdzie mogę znaleźć informacje na temat poprawy wydajności procesów ETL?
  • Czy można kontrolować porządek łączenia tabel w SQLu generowanym przez transformację SQL Join?
  • Jak zwiększać poziom debugowania dla DI Studio?
  • Jak zmieniać ustawienia pamięciowe dla DI Studio?

  • Co nowego w DI Studio 4.2?

    Informacje na temat nowości w SAS DI Studio 4.2 można znaleźć m.in. w dokumentacji What’s New in SAS 9.2, w rozdziale poświęconym SAS Data Information Studio oraz w prezentacji z SAS Global Forum A Whole New World: What's New in SAS® Data Integration Studio 4.2.

  • Powrót na górę

  • Gdzie znajduje się podręcznik użytkownika do DI Studio 4.2?

    Podręcznik użytkownika DI Studio 4.2 jest dostępny na amerykańskich stronach Wsparcia Technicznego: SAS® Data Integration Studio 4.21: User's Guide

  • Powrót na górę

  • Gdzie znajdują się informacje o hot fixach do DI Studio 4.2?

    Do pełnej funkcjonalności, DI Studio wymaga zainstalowania dodatkowych hot fixów po stronie aplikacji klienckiej oraz serwerowej. Najnowsze hot fixy można ściągnąć ze stron:

  • Powrót na górę

  • Czy DI Studio 4.2 może współpracować z serwerem metadanych 9.1.3?

    Nie. Z powodu zmian, jakie zaszły w protokole używanym do łączenia z serwerami SAS, DI Studio 4.2 nie może współpracować z serwerem metadanych 9.1.3.

  • Powrót na górę

  • Dlaczego na serwerze ciągle działa proces, chociaż zadanie uruchomione w DI Studio zakończyło się?

    W momencie, kiedy z DI Studio uruchamiane jest zadanie, powoływana jest sesja workspace serwera, na którym wykonywany jest kod. Zakończenie przetwarzania nie kończy sesji workspace serwera, który działa do czasu zamknięcia zadania tak, aby kolejne jego uruchomienie było wykonywane przez tę samą sesję SASa. Dopiero zamknięcie Job Editora powoduje zakończenie sesji.

    Podobnie w przypadku uruchamiania kodu własnego z Code Editora. Pierwsze uruchomienie powoduje powołanie sesji workspace serwera na serwerze. Działa on do czasu zamknięcia okna Code Editora.

  • Powrót na górę

  • Czy można uruchomić różne zadania w jednej sesji workspace serwera?

    W DI Studio dla każdego uruchamianego kodu (albo z okna Job Editor albo Code Editor) powoływana jest niezależna sesja SASa (workspace serwer). Nie jest możliwe, żeby nowe zadanie uruchomić w ramach już istniejącego procesu.

  • Powrót na górę

  • Czy ta sama tabela może być użyta kilka razy w tym samym zadaniu?

    Tak. Tabela może być użyta w zadaniu wiele razy zarówno jako źródło danych, jak i jako wynik zadania.

    Jednakże dodanie tej samej tabeli kilka razy jako źródło danych powoduje, że DI Studio tworzy (bez potrzby) widok dla każdego wystąpienia tabeli oprócz pierwszego. To może pogarszać wydajność np. w przypadku odwołania do zewnętrznych baz.

    Należy również uważać żeby nie skasować tabeli w przypadku, gdy ta sama tabela jest jednocześnie źródłem danych jak i wynikiem zadania.

  • Powrót na górę

  • Co zrobić, żeby przy ładowaniu tabeli był wykorzystany bulk-load?

    W DI Studio lub w SAS Management Console, we właściwościach tabeli, na zakładce Physical Storage pod przyciskiem Table Options należy dodać opcję:

       BULKLOAD=YES
    
    Niektóre engine'y SAS/ACCESS (ODBC, OLE DB, Teradata) pozwalają na zdefiniowanie opcji BULKLOAD jako opcji biblioteki. W takim przypadku we właściwościach tabeli, na zakładce Options należy wybrać Additional Options, a następnie na zakładce Output wybrać Yes w polu Whether to use DBMS's bulk load.
  • Powrót na górę

  • Jak przy eksporcie do pliku tekstowego NIE umieszczać wartości numerycznych w cudzysłowach?

    Przy zapisie do pliku tekstowego należy we właściwościach pliku, na zakładce File Parameters zaznaczyć opcję Treat consecutive delimiters as a single delimiter.

  • Powrót na górę

  • Czy transformacja może wyniki zapisywać bezpośrednio do docelowego zbioru?

    Tak. W wielu zadaniach transformacja Table Loader nie jest konieczna, a wyniki transformacji można zapisywać bezpośrednio do zbioru wynikowego zamiast tworzenia tymczasowego obiektu.

    Trzeba jednak pamiętać, że w większości przypadków metoda ta jest użyteczna przy prostym ładowaniu zbiorów SAS. Przy bardziej skomplikowanym ładowaniu danych, np. do zewnętrznych baz danych, stworzenie struktury pośredniej i użycie transformacji Table Loader może się okazać konieczne.

  • Powrót na górę

  • Czy wynikowa tabela musi być zarejestrowana w metadanych przed stworzeniem zadania?

    Nie. DI Studio 4.2 pozwala na tworzenie wynikowych tabel w trakcie budowy zadania, na podstawie zdefiniowanych mapowań. Wystarczy dla tabeli tymczasowej, będącej wynikiem ostatniej transformacji w zadaniu, wybrać opcję Register table.

  • Powrót na górę

  • Jak najprościej dodać do zadania polecenie zawiadamiania użytkownika, że zadanie/transformacja zakończyło się?

    Do powiadamiania użytkownika, że zadanie lub transformacja w ramach zadania została wykonana, służy zakładka Status Handling, dostępna we właściwościach zadania oraz wielu transformacji. W zależności od wybranego obiektu (zadanie lub konkretna transformacja), dostępne są różne warunki i akcje, które będą wykonane, jeżeli warunek będzie spełniony.

    Przykładowe warunki:

    • Successful - zadanie/transformacja zakończyło się bez błędu
    • Warnings - w trakcie wykonywania zadania/transformacji pojawiło się ostrzeżenie
    • Errors - w trakcie przetwarzania pojawiły się błędy
    • Table Does not Exist - tabela nie istnieje
    • Data Modified - dane zostały zmodyfikowane.
    Przykładowe akcje:
    • Abort - przetwarzanie zostanie przerwane
    • Send Email - pod wskazany adres zostanie przesłany email
    • Send Entry to Text File - do wskazanego pliku tekstowego zostanie zapisana podana informacja wraz z dokładnym czasem zapisu
    • Send Entry to Dataset - do wskazanego zbioru zostanie dopisana podana informacja z dokładnym czasem zapisu
    • Custom - wywołane zostanie macro wskazane przez użytkownika.
  • Powrót na górę

  • Jak automatycznie zapisywać informacje o czasie przetwarzania zadania?

    Jeżeli zadanie jest uruchamiane w ramach DI Studio, podstawowe statystyki dotyczące jego wykonania są wyświetlane w oknie Runtime Manager (wywoływanym z menu View -> Runtime Manager). Pojawiają się w nim następujące informacje:

    • nazwa zadania
    • status zadania
    • data i czas rozpoczęcia zadania
    • data i czas zakończenia zadana
    • wykorzystywany serwer aplikacji.
    Podstawowe statystyki z wykonania zadania można również automatycznie zapisywać w zbiorze, korzystając z zakładki Status Handling we właściwościach zadania. Należy tam stworzyć nową pozycję i wybrać:
    • Code condition: Job Status
    • Action: Send Job Status
    oraz podać nazwę biblioteki i zbioru, do którego będą wpisywane informacje o zadaniu.

    Uwaga! Biblioteka musi być dostępna dla serwera aplikacji. Jeżeli zbiór istnieje, to obserwacja zostanie dopisana na jego koniec. W przeciwnym przypadku zbiór zostanie stworzony.

    W zbiorze będą zapisywane następujące informacje:

    • nazwa zadania
    • status zadania
    • kod zakończenia zadania
    • liczba rekordów w ostatniej ładowanej tabeli przed załadowaniem
    • liczba rekordów w ostatniej ładowanej tabeli po załadowaniu
    • biblioteka i nazwa ostatniej tabeli ładowanej w zadaniu
    • użytkownik, który zadanie uruchamiał
    • czas rozpoczęcia i zakończenia działania
  • Powrót na górę

  • Jak można zdefiniować akcję w ramach mechanizmu Status Handling, jeżeli transformacja nie ma takiej zakładki?

    Nie wszystkie zadania mają zakładkę Status Handling. W takim przypadku można wykorzystać transformację Return Code Check, żeby wykonać akcję zależną od kodu powrotu transformacji w zadaniu.

  • Powrót na górę

  • Przy przetwarzaniu batchowym zadania stworzonego w DI Studio pojawia się błąd:

    ERROR: The PERFINIT macro has not been run.
    

    Powodem błędu najczęściej jest brak w konfiguracji DATA Step Batch Servera dodatkowych mechanizmów logowania. Szczegóły opisuje nota SN-35891

  • Powrót na górę

  • W kodzie generowanym przez DI Studio domyślnie włączana jest opcja MPRINT. Czy można ją wyłączyć?

    W kodach generowanych przez DI Studio włączenie opcji MPRINT uzależnione jest od wartości makrozmiennej %etls_debug:

    %global etls_debug;
    %macro etls_setDebug;
      %if %str(&etls_debug) ne 0 %then
        OPTIONS MPRINT%str(;);
    %mend;
    %etls_setDebug; 
    
    Ponieważ na ogół nie jest ona zdefiniowana, więc opcja MPRINT zostaje ustawiona, co może spowodować duże rozmiary plików z logami.

    Najprościej ustawić wartość makrozmiennej w autoexecu workspace serwera:

    OPTIONS NOMPRINT;
    %let etls_debug=0; 
    
    Może się jednak zdarzyć, że mimo to w zadaniu opcja MPRINT jednak zostanie użyta. Dzieje się tak, gdy użyta jest jedna z 2 transformacji:
    • Standardize
    • Surrogate Key Generator
  • Powrót na górę

  • Gdzie mogę znaleźć informacje na temat poprawy wydajności procesów ETL?

    Informacje na temat wydajności procesów ETL zostały zebrane w dokumencie: ETL Performance Tuning Tips.

  • Powrót na górę

  • Czy można kontrolować porządek łączenia tabel w SQLu generowanym przez transformację SQL Join?

    Tak. Użytkownik ma pełną kontrolę nad kolejnością łączenia tabel. Wystarczy wyświetlić właściwości transformacji, a następnie za pomocą odpowiedniego przepięcia strzałek, zdefiniować porządek łączenia.

  • Powrót na górę

  • Jak zwiększać poziom debugowania dla DI Studio?

    W tym celu w pliku <folder intalacyjny SAS-a>\SASDataIntegrationStudio\4.2\distudio.ini należy dodać na koniec ustawienia MainClass opcje:

    -debug –serverlog
    
    Logi powstaną w katalogu C:\Documents and Settings\<userid>\Application Data\SAS\SASDataIntegrationStudio\4.2\DataIntegrationStudio_Log.txt, gdzie <userid> jest id użytkownika Windows uruchamiającego DI Studio. Plik jest nadpisywany za każdym razem, gdy startuje DI Studio.

    Uwaga! Przed modyfikacją pliku distudio.ini należy stworzyć jego kopię.

    Uwaga! Zwiększanie poziomu debugowania odbywa się w porozumieniu ze wsparciem technicznym.

  • Powrót na górę

  • Jak zmieniać ustawienia pamięciowe dla DI Studio?

    Ustawienia pamięciowe dla DI Studio modyfikuje się w porozumieniu ze wsparciem technicznym, modyfikując plik konfiguracyjny DI Studio <folder intalacyjny SAS-a>\SASDataIntegrationStudio\4.2\distudio.ini

    Warto rozważyć ustawienie parametrów:

    1. Xmx (maximum heap size):
      • domyślnie Xmx jest ustawiony na 512m
      • zwiększenie na 1024, czyli JavaArgs_1=-Xmx1024m
    2. MaxPermSize:
      Jeżeli w di studio.ini nie jest ustawiony MaxPermSize=128m, dodaje się linijkę
      JavaArgs_<NR>=-XX:MaxPermSize=128m
      
      gdzie <NR> jest kolejnym numerem parametru .

    Uwaga! Przed modyfikacją pliku distudio.ini należy stworzyć jego kopię.

  • Powrót na górę

    Data ostatniej aktualizacji dokumentu: 21.05.2010

     

  • Citat
    Warsztaty SAS® 9 dla Administratorów
    Rodzaje serwerów SAS® 9
    Przypisywanie bibliotek SAS® 9
    Pozycja 'SAS' w menu MS Excel
    SAS Dates, Times, and Datetimes
    SAS Free Tutorials
    Hotline NEWS






    Kontakt
    Wsparcie techniczne
    +48-22-5604666
    od poniedziałku do pi±tku w godzinach od 8.30 do 16.30.
     
    support@spl.sas.com