Esempio: covarianza e coefficiente di correlazione
Utilizzare le funzioni cvar e corr per misurare la solidità della correlazione tra due variabili e per verificare se i dati seguono una relazione lineare.
1. Esaminare i dati di tensione misurati in due punti di un circuito elettrico.
2. Tracciare il grafico dei dati e della linea di best fit.
3. Calcolare la covarianza delle due variabili.
Come la varianza misura la quantità di deviazione dei dati dalla rispettiva media, la covarianza misura la quantità di deviazione simultanea di due insieme di dati dalle rispettive medie.
La covarianza è correlata al coefficiente angolare della linea di best fit nel modo indicato di seguito.
Coefficiente di correlazione di Pearson
1. Calcolare il coefficiente di correlazione di Pearson.
Il segno del coefficiente di correlazione di Pearson indica la direzione della correlazione. In questo caso, il segno negativo di r indica che V1 è inversamente proporzionale a V2.
r è compreso nell'intervallo [-1, 1]. Se | r | è vicino a 1, esiste una correlazione significativa. Al contrario, se | r | è vicino a zero, non è possibile dimostrare una correlazione.
La funzione corr esegue il calcolo indicato di seguito.
2. Calcolare il coefficiente di determinazione.
Il coefficiente di determinazione fornisce una misura equivalente di intervallo e rapporto della solidità della correlazione.
Correlazione per ranghi di Spearman
La correlazione di Spearman utilizza la stessa formula della correlazione di Pearson, ma la applica invece ai ranghi dei dati in ogni insieme di dati.
1. Suddividere in ranghi i due insiemi di dati.
2. Verificare la correlazione, confrontando il coefficiente di correlazione per ranghi di Spearman con il coefficiente di correlazione di Pearson.
◦ Spearman
◦ Pearson
Il coefficiente di correlazione per ranghi di Spearman viene utilizzato nei test d'ipotesi non parametrici, ovvero nei test di correlazione che non dipendono dalla distribuzione o dal formato dei dati. Tale coefficiente si basa sulla formula di Pearson e ha le stesse proprietà (da -1 a +1). A differenza del coefficiente di Pearson, quello di Spearman può essere +1 o -1 e non richiede che i dati giacciano su una linea retta.