SAS - Struttura del programma

La programmazione SAS prevede prima la creazione / lettura dei set di dati nella memoria e poi l'analisi su questi dati. Dobbiamo capire il flusso in cui viene scritto un programma per raggiungere questo obiettivo.

Struttura del programma SAS

Il diagramma seguente mostra i passaggi da scrivere nella sequenza data per creare un programma SAS.

Ogni programma SAS deve avere tutti questi passaggi per completare la lettura dei dati di input, analizzare i dati e fornire l'output dell'analisi. Anche ilRUN L'istruzione alla fine di ogni passaggio è necessaria per completare l'esecuzione di quella fase.

Passaggio DATI

Questa fase prevede il caricamento del set di dati richiesto nella memoria SAS e l'identificazione delle variabili (chiamate anche colonne) del set di dati. Cattura anche i record (chiamati anche osservazioni o soggetti). La sintassi per l'istruzione DATA è la seguente.

Sintassi

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

Esempio

L'esempio seguente mostra un semplice caso di denominazione del set di dati, definizione delle variabili, creazione di nuove variabili e immissione dei dati. Qui le variabili stringa hanno un $ alla fine e i valori numerici sono senza.

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

Passaggio PROC

Questo passaggio implica il richiamo di una procedura incorporata SAS per analizzare i dati.

Sintassi

PROC procedure_name options; #The name of the proc.
RUN;

Esempio

L'esempio seguente mostra l'utilizzo di MEANS procedura per stampare i valori medi delle variabili numeriche nel data set.

PROC MEANS;
RUN;

Il passaggio OUTPUT

I dati dei set di dati possono essere visualizzati con istruzioni di output condizionali.

Sintassi

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Esempio

L'esempio seguente mostra l'utilizzo della clausola where nell'output per produrre solo pochi record dal set di dati.

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

Il programma SAS completo

Di seguito è riportato il codice completo per ciascuno dei passaggi precedenti.

Output del programma

L'output del codice precedente è visualizzato nel file RESULTS tab.