Und so geht’s:
PROC SORT bietet mit zwei Optionen eine einfache Möglichkeit,
um Dubletten zu eliminieren: NODUPKEY und NODUP. Die Option
NODUPKEY löscht die zweite und jeder weitere Beobachtung
mit demselben Wert in der Schlüsselvariable. Die Option
NODUP löscht Dubletten, deren Ausprägungen in allen
Variablen übereinstimmen. Allerdings werden echte Dubletten
nur erkannt, wenn sie in der Datei unmittelbar aufeinander folgen.
PROC SORT DATA = test NODUPKEY;
BY var1;
RUN;
In SAS Version 8 erscheint im Log lediglich die Anzahl der gelöschten
Beobachtungen, nicht aber, welche Beobachtungen gelöscht
wurden. In SAS®9 werden durch die Option DUPOUT= in der
PROC SORT-Anweisung die Dubletten in eine SAS Datei geschrieben.
|