Datenmanagement  
Ausgabe 4/2004        
         
Kursprogramm   |   E-Learning   |   Ausbildungsberatung   |   Zertifizierung   |   SAS®9 Update |   SAS Training Plus




Wussten Sie schon, wie Sie mehrfach vorhandene und damit nicht eindeutige Schlüssel löschen können?

Und so geht’s:

PROC SORT bietet mit zwei Optionen eine einfache Möglichkeit, um Dubletten zu eliminieren: NODUPKEY und NODUP. Die Option NODUPKEY löscht die zweite und jeder weitere Beobachtung mit demselben Wert in der Schlüsselvariable. Die Option NODUP löscht Dubletten, deren Ausprägungen in allen Variablen übereinstimmen. Allerdings werden echte Dubletten nur erkannt, wenn sie in der Datei unmittelbar aufeinander folgen.

PROC SORT DATA = test NODUPKEY;
BY var1;
RUN;


In SAS Version 8 erscheint im Log lediglich die Anzahl der gelöschten Beobachtungen, nicht aber, welche Beobachtungen gelöscht wurden. In SAS®9 werden durch die Option DUPOUT= in der PROC SORT-Anweisung die Dubletten in eine SAS Datei geschrieben.