R è un linguaggio di programmazione pensato per l'analisi statistica e la creazione di grafici per questo scopo. Invece dei tipi di dati, ha oggetti di dati che vengono utilizzati per i calcoli. Viene utilizzato nei campi del data mining, analisi di regressione, stima di probabilità ecc., Utilizzando molti pacchetti disponibili in esso.

Ci sono 6 oggetti dati in R. Sono vettori, elenchi, array, matrici, frame di dati e tabelle.

Un nome di variabile valido è costituito da lettere, numeri e caratteri di punto o di sottolineatura. Il nome della variabile inizia con una lettera o il punto non seguito da un numero.

Una matrice è sempre bidimensionale in quanto ha solo righe e colonne. Ma un array può avere un numero qualsiasi di dimensioni e ogni dimensione è una matrice. Ad esempio, un array 3x3x2 rappresenta 2 matrici ciascuna di dimensione 3x3.

Gli oggetti dati Fattore in R vengono utilizzati per archiviare ed elaborare dati categoriali in R.

Un file csv può essere caricato utilizzando la funzione read.csv. R crea un data frame durante la lettura dei file CSV utilizzando questa funzione.

Il comando getwd () fornisce la directory di lavoro corrente nell'ambiente R.

Questo è il pacchetto che viene caricato per impostazione predefinita quando è impostato l'ambiente R. Fornisce le funzionalità di base come input / output, calcoli aritmetici ecc. Nell'ambiente R.

La regressione logistica si occupa di misurare la probabilità di una variabile di risposta binaria. In R la funzione glm () viene utilizzata per creare la regressione logistica.

L'espressione M [4,2] fornisce l'elemento alla quarta riga e alla seconda colonna.

Quando due vettori di lunghezza diversa sono coinvolti in un'operazione, gli elementi del vettore più corto vengono riutilizzati per completare l'operazione. Questo si chiama riciclaggio degli elementi. Esempio - v1 <- c (4,1,0,6) e V2 <- c (2,4) quindi v1 * v2 restituisce (8,4,0,24). Gli elementi 2 e 4 vengono ripetuti.

Possiamo chiamare una funzione in R in 3 modi. Il primo metodo è chiamare utilizzando la posizione degli argomenti. Il secondo metodo id da chiamare utilizzando il nome degli argomenti e il terzo metodo è quello di chiamare gli argomenti predefiniti.

La valutazione pigra di una funzione significa che l'argomento viene valutato solo se viene utilizzato all'interno del corpo della funzione. Se non è presente alcun riferimento all'argomento nel corpo della funzione, viene semplicemente ignorato.

Per installare un pacchetto in R usiamo il comando seguente.

install.packages("package Name")

Il pacchetto denominato "XML" viene utilizzato per leggere ed elaborare i file XML.

Possiamo aggiornare qualsiasi elemento ma possiamo eliminare solo l'elemento alla fine dell'elenco.

L'espressione generale per creare una matrice in R è - matrix (data, nrow, ncol, byrow, dimnames)

La funzione boxplot () è usata per creare boxplot in R. Ci vogliono una formula e un data frame come input per creare i boxplots.

La frequenza 6 indica che l'intervallo di tempo per i dati delle serie temporali è ogni 10 minuti di un'ora.

In R gli oggetti dati possono essere convertiti da una forma all'altra. Ad esempio, possiamo creare un data frame unendo molti elenchi. Ciò implica una serie di comandi R per portare i dati nel nuovo formato. Questo si chiama rimodellamento dei dati.

Genera 4 numeri casuali compresi tra 0 e 1.

Usa il comando

installed.packages()

Divide le stringhe nel vettore x in sottostringhe nella posizione della lettera e.

x <- "The quick brown fox jumps over the lazy dog"
split.string <- strsplit(x, " ")
extract.words <- split.string[[1]]
result <- unique(tolower(extract.words))
print(result)

Errore in v * x [1]: argomento non numerico per l'operatore binario

[1] 5 12 21 32 s

Converte un elenco in un vettore.

x <- pbinom(26,51,0.5)
print(x)

N / A

Utilizzo della funzione as.data.frame ()

function(x) { x[is.na(x)] <- sum(x, na.rm = TRUE); x }

Viene utilizzato per applicare la stessa funzione a ciascuno degli elementi in un array. Ad esempio, trovare la media delle righe in ogni riga.

Ogni matrice può essere chiamata array ma non il contrario. La matrice è sempre bidimensionale ma la matrice può essere di qualsiasi dimensione.

?N / A

sd (x, na.rm = TRUE)

setwd ("Percorso")

"%%" fornisce il resto della divisione del primo vettore con il secondo mentre "% /%" fornisce il quoziente della divisione del primo vettore con il secondo.

Trova la colonna ha il valore massimo per ogni riga.

hist ()

rm (x)

dati (pacchetto = "MASS")

data(package = .packages(all.available = TRUE))

Viene utilizzato per installare il pacchetto ar dalla directory locale sfogliando e selezionando il file.

15 %in% x
pairs(formula, data)

Dove formula rappresenta la serie di variabili utilizzate in coppia e dati rappresenta il set di dati da cui verranno prese le variabili.

Le funzioni subset () vengono utilizzate per selezionare variabili e osservazioni. La funzione sample () viene utilizzata per scegliere un campione casuale di dimensione n da un set di dati.

is.matrix (m) dovrebbe ritornare TRUE.

[1] NA

La funzione t () è usata per trasporre una matrice. Esempio: t (m), dove m è una matrice.

L'istruzione "next" nel linguaggio di programmazione R è utile quando si desidera saltare l'iterazione corrente di un ciclo senza terminarlo.