В SAS выбор первых N наблюдений из набора данных является обычной задачей. В этой статье будут представлены несколько методов выполнения этой задачи, а также примеры кода. Независимо от того, являетесь ли вы новичком или опытным программистом SAS, эти методы предоставят вам гибкость и возможность эффективного получения желаемого количества начальных наблюдений.
Методы выбора первых N наблюдений в SAS:
- Шаг DATA с операторами SET и STOP:
Самый простой способ выбрать первые N наблюдений — использовать шаг DATA в SAS. Объедините оператор SET с оператором STOP, чтобы ограничить количество обрабатываемых наблюдений.
data first_n;
set your_dataset;
if _N_ <= N then output;
run;
Замените your_dataset
на имя вашего фактического набора данных и установите N
на желаемое количество наблюдений.
- Опция набора данных OBS=:
Опция набора данных OBS= позволяет указать количество наблюдений, которые будут считаны из набора данных. Этот метод эффективен, если вы хотите частично прочитать большой набор данных.
data first_n;
set your_dataset(obs=N);
run;
Замените your_dataset
на имя вашего фактического набора данных и установите N
на желаемое количество наблюдений.
- SQL с предложением TOP:
Если вы предпочитаете SQL, вы можете использовать предложение TOP в инструкции PROC SQL для выбора первых N наблюдений.
proc sql outobs=N;
create table first_n as
select *
from your_dataset;
quit;
Замените your_dataset
на имя вашего фактического набора данных и установите N
на желаемое количество наблюдений.
- PROC PRINT с опцией N=:
Процедура PROC PRINT позволяет ограничить количество отображаемых наблюдений с помощью опции N=.
proc print data=your_dataset (obs=N);
run;
Замените your_dataset
на имя вашего фактического набора данных и установите N
на желаемое количество наблюдений.
- PROC SORT с параметрами NODUPKEY и FIRSTOBS.
Если вы хотите выбрать первые N уникальных наблюдений на основе определенных переменных, вы можете использовать PROC SORT с параметрами NODUPKEY и FIRSTOBS.
proc sort data=your_dataset out=first_n nodupkey;
by variable1 variable2 ...;
run;
Замените your_dataset
на имя вашего фактического набора данных и соответствующим образом укажите переменные в операторе BY.