Изучение различных методов выбора первых N наблюдений в SAS

В SAS выбор первых N наблюдений из набора данных является обычной задачей. В этой статье будут представлены несколько методов выполнения этой задачи, а также примеры кода. Независимо от того, являетесь ли вы новичком или опытным программистом SAS, эти методы предоставят вам гибкость и возможность эффективного получения желаемого количества начальных наблюдений.

Методы выбора первых N наблюдений в SAS:

  1. Шаг DATA с операторами SET и STOP:
    Самый простой способ выбрать первые N наблюдений — использовать шаг DATA в SAS. Объедините оператор SET с оператором STOP, чтобы ограничить количество обрабатываемых наблюдений.
data first_n;
   set your_dataset;
   if _N_ <= N then output;
run;

Замените your_datasetна имя вашего фактического набора данных и установите Nна желаемое количество наблюдений.

  1. Опция набора данных OBS=:
    Опция набора данных OBS= позволяет указать количество наблюдений, которые будут считаны из набора данных. Этот метод эффективен, если вы хотите частично прочитать большой набор данных.
data first_n;
   set your_dataset(obs=N);
run;

Замените your_datasetна имя вашего фактического набора данных и установите Nна желаемое количество наблюдений.

  1. SQL с предложением TOP:
    Если вы предпочитаете SQL, вы можете использовать предложение TOP в инструкции PROC SQL для выбора первых N наблюдений.
proc sql outobs=N;
   create table first_n as
   select *
   from your_dataset;
quit;

Замените your_datasetна имя вашего фактического набора данных и установите Nна желаемое количество наблюдений.

  1. PROC PRINT с опцией N=:
    Процедура PROC PRINT позволяет ограничить количество отображаемых наблюдений с помощью опции N=.
proc print data=your_dataset (obs=N);
run;

Замените your_datasetна имя вашего фактического набора данных и установите Nна желаемое количество наблюдений.

  1. PROC SORT с параметрами NODUPKEY и FIRSTOBS.
    Если вы хотите выбрать первые N уникальных наблюдений на основе определенных переменных, вы можете использовать PROC SORT с параметрами NODUPKEY и FIRSTOBS.
proc sort data=your_dataset out=first_n nodupkey;
   by variable1 variable2 ...;
run;

Замените your_datasetна имя вашего фактического набора данных и соответствующим образом укажите переменные в операторе BY.