![Correlazioni tra due variabili e il coefficiente di correlazione r](https://i.ytimg.com/vi/-BJvvwyI4yg/hqdefault.jpg)
Contenuto
- Al passo
- Metodo 1 di 4: calcolare manualmente il coefficiente di correlazione
- Metodo 2 di 4: utilizzo di calcolatori di correlazione online
- Metodo 3 di 4: utilizzo di una calcolatrice grafica
- Suggerimenti
- Avvertenze
Il coefficiente di correlazione, indicato r o ρ, è la misura della correlazione lineare (la relazione, sia in forza che in direzione) tra due variabili. Va da -1 a +1, utilizzando i segni più e meno per rappresentare la correlazione positiva e negativa. Se il coefficiente di correlazione è esattamente -1, la relazione tra le due variabili è completamente negativa; se il coefficiente di correlazione è esattamente +1, la relazione è completamente positiva. Due variabili possono avere una correlazione positiva, una correlazione negativa o nessuna correlazione. È possibile calcolare la correlazione manualmente, utilizzando alcuni dei calcoli di correlazione gratuiti disponibili online o utilizzando le funzioni statistiche di una buona calcolatrice grafica.
Al passo
Metodo 1 di 4: calcolare manualmente il coefficiente di correlazione
Per prima cosa raccogli i tuoi dati. Per iniziare a calcolare una correlazione efficiente, esaminare prima le coppie di dati. È utile metterli in una tabella, sia verticalmente che orizzontalmente. Etichetta ogni riga o colonna x e y.
- Ad esempio, supponiamo di avere quattro coppie di dati per X e y. La tabella potrebbe quindi avere questo aspetto:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7
- Ad esempio, supponiamo di avere quattro coppie di dati per X e y. La tabella potrebbe quindi avere questo aspetto:
Calcola la media di X. Per calcolare la media, sono necessari tutti i valori di X aggiungere e quindi dividere per il numero di valori.
- Usando l'esempio sopra, nota che hai quattro valori per X. Per calcolare la media, somma tutti i valori X e dividerlo per 4. Il calcolo ha questo aspetto:
Trova la media di y. Alla media di y Per trovarlo, segui gli stessi passaggi, sommando tutti i valori di y insieme e quindi dividendo per il numero di valori.
- Nell'esempio sopra, hai anche quattro valori per y. Sommare tutti questi valori insieme e poi dividerli per 4. I calcoli avranno questo aspetto:
Determina la deviazione standard di X. Una volta che hai i tuoi mezzi, puoi calcolare la deviazione standard. Per fare ciò, usa la formula:
Calcola la deviazione standard di y. Utilizzando gli stessi passaggi di base, trova la deviazione standard di y. Utilizzerai la stessa formula, utilizzando i punti dati per y.
- Con i dati di esempio, i tuoi calcoli avranno questo aspetto:
Rivedi la formula di base per determinare un coefficiente di correlazione. La formula per il calcolo di un coefficiente di correlazione utilizza medie, deviazioni standard e il numero di coppie in un set di dati (rappresentato da n). Il coefficiente di correlazione stesso è rappresentato dalla lettera minuscola r o dalla lettera greca ρ (rho). Per questo articolo, useremo la formula nota come coefficiente di correlazione di Pearson come mostrato di seguito:
Determina il coefficiente di correlazione. Ora hai le medie e le deviazioni standard per le tue variabili, quindi puoi passare alla formula del coefficiente di correlazione. Ricordati che n rappresenta il numero di valori che hai. Hai già elaborato le altre informazioni pertinenti nei passaggi precedenti.
- Utilizzando i dati di esempio, è possibile inserire i dati nella formula del coefficiente di correlazione e calcolarli come segue:
Interpreta il risultato. Per questo set di dati, il coefficiente di correlazione è 0,988. Questo numero ti dice due cose sui dati. Guarda il segno del numero e la dimensione del numero.
- Poiché il coefficiente di correlazione è positivo, si può affermare che esiste una correlazione positiva tra i dati x e i dati y. Ciò significa che se i valori x aumentano, ti aspetti che anche i valori y aumentino.
- Poiché il coefficiente di correlazione è molto vicino a +1, i dati x ey sono strettamente correlati. Se dovessi rappresentare graficamente questi punti, vedresti che sono un'ottima approssimazione a una linea retta.
Metodo 2 di 4: utilizzo di calcolatori di correlazione online
Cerca online i calcolatori di correlazione. La misurazione della correlazione è un calcolo abbastanza standard per gli statistici. Il calcolo può diventare molto noioso per set di dati di grandi dimensioni se eseguito a mano. Pertanto, molte fonti hanno reso disponibili online calcoli di correlazione comuni. Utilizza qualsiasi motore di ricerca e inserisci il termine di ricerca "calcolatore di correlazione".
Immettere i dati. Leggere attentamente le istruzioni sul sito Web in modo da poter inserire i dati correttamente. È importante che le coppie di dati siano mantenute in ordine o si otterrà un risultato di correlazione errato. Diversi siti Web utilizzano formati diversi per immettere i dati.
- Ad esempio, sul sito web http://ncalculators.com/statistics/correlation-coefficient-calculator.htm troverai una casella orizzontale per l'immissione dei valori x e una seconda casella orizzontale per l'immissione dei valori y. Inserisci i termini, separati solo da virgole. Pertanto, il set di dati x calcolato in precedenza in questo articolo deve essere immesso come 1,2,4,5. Il set di dati y viene immesso come 1,3,5,7.
- In un altro sito, http://www.alcula.com/calculators/statistics/correlation-coefficient/, è possibile inserire i dati orizzontalmente o verticalmente, purché si mantengano i punti dati in ordine.
Calcola i risultati. Questi siti di calcolo sono popolari perché dopo aver inserito i dati in genere è sufficiente fare clic sul pulsante "Calcola": il risultato verrà visualizzato automaticamente.
Metodo 3 di 4: utilizzo di una calcolatrice grafica
Inserisci i tuoi dati. Sulla calcolatrice grafica, abilita la funzione statistica e poi seleziona il comando "Modifica".
- Ogni calcolatrice ha comandi da tastiera leggermente diversi. Questo articolo fornisce le istruzioni specifiche per la Texas Instruments TI-86.
- Per accedere alla funzione Stat, premere [2nd] -Stat (sopra il tasto "+") e quindi premere F2-Edit.
Elimina tutti i vecchi dati memorizzati. La maggior parte dei calcolatori manterrà i dati statistici fino a quando non verranno cancellati. Per assicurarti di non confondere i vecchi dati con i nuovi dati, dovresti prima cancellare tutte le informazioni salvate in precedenza.
- Utilizzare i tasti freccia per spostare il cursore per evidenziare la categoria "xStat". Quindi premere "Cancella" e "Invio". Questo dovrebbe cancellare tutti i valori nella colonna xStat.
- Utilizzare i tasti freccia per evidenziare la categoria "yStat". Premere "Cancella" e "Invio" per cancellare anche i dati per quella colonna.
Immettere i valori dei dati. Utilizzare i tasti freccia per spostare il cursore sul primo spazio sotto l'intestazione xStat. Digita il tuo primo valore di dati e poi premi Invio. Dovresti vedere lo spazio nella parte inferiore dello schermo "xStat (1) = __", dove il tuo valore riempie lo spazio vuoto. Quando si preme Invio, i dati riempiranno la tabella, il cursore si sposterà alla riga successiva e la riga in fondo allo schermo dovrebbe ora leggere "xStat (2) = __".
- Continua a inserire tutti i valori x.
- Dopo aver immesso i valori x, utilizzare i tasti freccia per spostarsi sulla colonna yStat e immettere i valori y.
- Quando tutti i dati sono stati inseriti, premere Exit per cancellare lo schermo e uscire dal menu Stat.
Calcola le statistiche di regressione lineare. Il coefficiente di correlazione è una misura di quanto i dati si avvicinano a una linea retta. Una calcolatrice grafica con funzioni statistiche può calcolare molto rapidamente la migliore linea di adattamento e il coefficiente di correlazione.
- Accedere alla funzione Stat e quindi premere il pulsante Calc. Sulla TI-86, questo è [2nd] [Stat] [F1].
- Scegli i calcoli di regressione lineare. Sulla TI-86, questo è [F3], etichettato "LinR". Il display grafico mostrerà quindi la riga "LinR _" con un cursore lampeggiante.
- Ora devi inserire i nomi delle due variabili che vuoi calcolare. Questi sono xStat e yStat.
- Sulla TI-86, selezionare l'elenco dei nomi ("Names") premendo [2nd] [List] [F3].
- La riga inferiore dello schermo dovrebbe ora mostrare le variabili disponibili. Scegli [xStat] (questo è probabilmente il pulsante F1 o F2), quindi inserisci una virgola e quindi [yStat].
- Premere Invio per calcolare i dati
Interpreta i risultati. Quando si preme Invio, la calcolatrice calcolerà immediatamente le seguenti informazioni per i dati inseriti:
Comprendi il concetto di correlazione. La correlazione si riferisce alla relazione statistica tra due quantità. Il coefficiente di correlazione è un singolo numero che è possibile calcolare per due set di punti dati. Il numero è sempre compreso tra -1 e +1 e indica quanto sono vicini i due set di dati.
- Ad esempio, se misurassi l'altezza e l'età dei bambini fino a 12 anni circa, ti aspetteresti di trovare una forte correlazione positiva. Man mano che i bambini invecchiano, tendono a diventare più alti.
- Un esempio di correlazione negativa è confrontare il tempo che qualcuno trascorre a praticare il golf con il punteggio di quella persona. Man mano che la pratica progredisce, il punteggio dovrebbe diminuire.
- In definitiva, ti aspetteresti poca correlazione, positiva o negativa, tra il numero di scarpe di una persona, ad esempio, ei voti degli esami.
Calcola la media. La media aritmetica, o "media", di un insieme di dati viene calcolata sommando tutti i valori dei dati e quindi dividendo per il numero di valori nell'insieme. Per determinare il coefficiente di correlazione per i dati, è necessario calcolare la media di ciascun set di dati.
- La media di una variabile è indicata dalla variabile con una linea orizzontale sopra di essa. Questo è spesso indicato come "x-bar" o "y-bar" per i set di dati di x e y. In alternativa, la media può essere indicata con la lettera greca minuscola μ (mu). Ad esempio, per indicare la media dei punti dati di x, potresti usare μX o μ (x).
- Ad esempio, se hai un insieme di x (1,2,5,6,9,10), la media di questi dati viene calcolata come segue:
Conosci l'importanza della deviazione standard. Nelle statistiche, la deviazione standard misura la variazione, mostrando la dispersione dei numeri dalla media. Un gruppo di numeri con una deviazione standard bassa è abbastanza vicino l'uno all'altro. Un gruppo di numeri con una deviazione standard elevata è più sparpagliato.
- Come simbolo, la deviazione standard è espressa utilizzando la lettera minuscola s o la lettera greca σ (sigma). Pertanto, la deviazione standard dei dati x viene scritta come SX o σX.
Riconosci la notazione della somma. L'operatore di somma è uno degli operatori più comuni in matematica e indica una somma di valori. È rappresentato dalla lettera maiuscola greca, sigma o ∑.
- Ad esempio, se hai una raccolta di punti dati x (1,2,5,6,9,10), ∑x significa:
- 1+2+5+6+9+10 = 33
- Ad esempio, se hai una raccolta di punti dati x (1,2,5,6,9,10), ∑x significa:
Suggerimenti
- Il coefficiente di correlazione viene talvolta definito "coefficiente di correlazione momento-prodotto di Pearson" in onore di Karl Pearson, il suo sviluppatore.
- In generale, un coefficiente di correlazione maggiore di 0,8 (positivo o negativo) rappresenta una forte correlazione; un coefficiente di correlazione inferiore a 0,5 (positivo o negativo di nuovo) rappresenta un coefficiente di correlazione debole.
Avvertenze
- La correlazione mostra che due set di dati sono collegati in qualche modo. Tuttavia, fai attenzione a non interpretarlo come una relazione causale. Ad esempio, se confronti le dimensioni delle scarpe delle persone e la loro altezza, probabilmente troverai una forte correlazione positiva. Le persone più grandi generalmente hanno piedi più grandi. Tuttavia, questo non significa che diventare alti ti farà crescere i piedi o che i piedi grandi ti faranno crescere. Succedono insieme e basta.