Come calcolare il coefficiente di correlazione lineare

Autore: Eric Farmer
Data Della Creazione: 7 Marzo 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
37. Studio correlazione spiegato semplicemente: coefficiente Bravais-Pearson
Video: 37. Studio correlazione spiegato semplicemente: coefficiente Bravais-Pearson

Contenuto

Il coefficiente di correlazione (o coefficiente di correlazione lineare) è indicato come "r" (in rari casi come "ρ") e caratterizza la correlazione lineare (cioè la relazione data da un certo valore e direzione) di due o più variabili. Il valore del coefficiente è compreso tra -1 e +1, ovvero la correlazione può essere sia positiva che negativa. Se il coefficiente di correlazione è -1, si ha una perfetta correlazione negativa; se il coefficiente di correlazione è +1, si ha una perfetta correlazione positiva. Altrimenti, c'è una correlazione positiva tra le due variabili, una correlazione negativa o nessuna correlazione. Il coefficiente di correlazione può essere calcolato manualmente, con calcolatori online gratuiti o con un buon calcolatore grafico.

Passi

Metodo 1 di 4: Calcolo manuale del coefficiente di correlazione

  1. 1 Raccogliere dati. Prima di iniziare a calcolare il coefficiente di correlazione, studia queste coppie di numeri. Meglio annotarli in una tabella che può essere disposta verticalmente o orizzontalmente. Etichetta ogni riga o colonna con "x" e "y".
    • Ad esempio, date quattro coppie di valori (numeri) delle variabili "x" e "y". Puoi creare la seguente tabella:
      • x|| sì
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Calcola la media aritmetica "x". Per fare ciò, somma tutti i valori x, quindi dividi il risultato per il numero di valori.
    • Nel nostro esempio, ci sono quattro valori per la variabile "x". Per calcolare la media aritmetica "x", aggiungi questi valori, quindi dividi la somma per 4. I calcoli sono scritti come segue:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μX=12/4{ displaystyle mu _ {x} = 12/4}
    • μX=3{ displaystyle mu _ {x} = 3}
  3. 3 Trova la media aritmetica "y". Per fare ciò, segui gli stessi passaggi, ovvero somma tutti i valori y, quindi dividi la somma per il numero di valori.
    • Nel nostro esempio vengono forniti quattro valori della variabile "y". Aggiungi questi valori, quindi dividi la somma per 4. I calcoli verranno scritti come segue:
    • μ=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μ=16/4{ displaystyle mu _ {y} = 16/4}
    • μ=4{ displaystyle mu _ {y} = 4}
  4. 4 Calcola la deviazione standard "x". Dopo aver calcolato le medie di "x" e "y", trova le deviazioni standard di queste variabili. La deviazione standard viene calcolata utilizzando la seguente formula:
    • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • Nel nostro esempio, i calcoli saranno scritti in questo modo:
    • σX=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σX=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σX=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σX=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σX=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Calcola la deviazione standard "y". Segui i passaggi descritti nel passaggio precedente. Usa la stessa formula, ma inserisci i valori y.
    • Nel nostro esempio, i calcoli saranno scritti in questo modo:
    • σ=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σ=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σ=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σ=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σ=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Scrivi la formula di base per calcolare il coefficiente di correlazione. Questa formula include le medie, le deviazioni standard e il numero (n) di coppie di numeri di entrambe le variabili. Il coefficiente di correlazione è indicato come "r" (in rari casi come "ρ"). Questo articolo utilizza una formula per calcolare il coefficiente di correlazione di Pearson.
    • ρ=(1n1)Σ(XμXσX)(μσ){ displaystyle rho = sinistra ({ frac {1} {n-1}} destra) Sigma sinistra ({ frac {x- mu _ {x}} { sigma _ {x}} } destra) * sinistra ({ frac {y- mu _ {y}} { sigma _ {y}}} destra)}
    • Qui e in altre fonti, le quantità possono essere indicate in modi diversi. Ad esempio, alcune formule contengono "ρ" e "σ", mentre altre contengono "r" e "s". Alcuni libri di testo forniscono formule diverse, ma sono controparti matematiche della formula precedente.
  7. 7 Calcola il coefficiente di correlazione. Hai calcolato le medie e le deviazioni standard di entrambe le variabili, quindi puoi utilizzare la formula per calcolare il coefficiente di correlazione. Ricordiamo che "n" è il numero di coppie di valori per entrambe le variabili. Altri valori sono stati calcolati in precedenza.
    • Nel nostro esempio, i calcoli saranno scritti in questo modo:
    • ρ=(1n1)Σ(XμXσX)(μσ){ displaystyle rho = sinistra ({ frac {1} {n-1}} destra) Sigma sinistra ({ frac {x- mu _ {x}} { sigma _ {x}} } destra) * sinistra ({ frac {y- mu _ {y}} { sigma _ {y}}} destra)}
    • ρ=(13){ displaystyle rho = sinistra ({ frac {1} {3}} destra) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle sinistra ({ frac {1-3} {1.83}} destra) * sinistra ({ frac {1-4} {2.58}} destra) + sinistra ({ frac {2 -3} {1.83}} destra) * sinistra ({ frac {3-4} {2.58}} destra)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + sinistra ({ frac {4-3} {1.83}} destra) * sinistra ({ frac {5-4} {2.58}} destra) + sinistra ( { frac { 5-3} {1.83}} destra) * sinistra ({ frac {7-4} {2.58}} destra)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = sinistra ({ frac {1} {3}} destra) * sinistra ({ frac {6 + 1 + 1 + 6} {4.721}} destra)}
    • ρ=(13)2,965{ displaystyle rho = sinistra ({ frac {1} {3}} destra) * 2.965}
    • ρ=(2,9653){ displaystyle rho = sinistra ({ frac {2,965} {3}} destra)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analizza il risultato. Nel nostro esempio, il coefficiente di correlazione è 0,988. Questo valore caratterizza in qualche modo un dato insieme di coppie di numeri. Prestare attenzione al segno e alla grandezza del valore.
    • Poiché il valore del coefficiente di correlazione è positivo, esiste una correlazione positiva tra le variabili "x" e "y". Cioè, all'aumentare del valore di "x", aumenta anche il valore di "y".
    • Poiché il valore del coefficiente di correlazione è molto vicino a +1, i valori delle variabili "x" e "y" sono altamente correlati. Se metti dei punti sul piano delle coordinate, saranno posizionati vicino a una linea retta.

Metodo 2 di 4: utilizzo di calcolatrici online per calcolare il coefficiente di correlazione

  1. 1 Trova una calcolatrice su Internet per calcolare il coefficiente di correlazione. Questo coefficiente viene spesso calcolato nelle statistiche. Se ci sono molte coppie di numeri, è quasi impossibile calcolare manualmente il coefficiente di correlazione. Pertanto, ci sono calcolatori online per calcolare il coefficiente di correlazione. In un motore di ricerca, inserisci "calcolatore del coefficiente di correlazione" (senza virgolette).
  2. 2 Inserisci i dati. Controllare le istruzioni sul sito per inserire i dati corretti (coppie di numeri). È imperativo inserire le coppie di numeri appropriate; altrimenti otterrai il risultato sbagliato. Ricorda che diversi siti Web hanno formati di input diversi.
    • Ad esempio, su http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, i valori delle variabili x e y sono inseriti in due linee orizzontali. I valori sono separati da virgole. Cioè, nel nostro esempio, i valori "x" sono inseriti in questo modo: 1,2,4,5 e i valori "y" in questo modo: 1,3,5,7.
    • In un altro sito, http://www.alcula.com/calculators/statistics/correlation-coefficient/, i dati vengono inseriti verticalmente; in questo caso, non confondere le corrispondenti coppie di numeri.
  3. 3 Calcola il coefficiente di correlazione. Dopo aver inserito i dati, è sufficiente fare clic sul pulsante "Calcola", "Calcola" o simili per ottenere il risultato.

Metodo 3 di 4: utilizzo di una calcolatrice grafica

  1. 1 Inserisci i dati. Prendi una calcolatrice grafica, entra in modalità di calcolo statistico e seleziona il comando "Modifica".
    • Calcolatrici diverse richiedono la pressione di tasti diversi. Questo articolo tratta della calcolatrice TI-86 di Texas Instruments.
    • Premere [2nd] - Stat (sopra il tasto +) per accedere alla modalità di calcolo statistico. Quindi premere F2 - Modifica.
  2. 2 Elimina i dati salvati in precedenza. La maggior parte delle calcolatrici conserva le statistiche che inserisci finché non le cancelli. Per evitare di confondere i vecchi dati con quelli nuovi, eliminare prima tutte le informazioni memorizzate.
    • Utilizzare i tasti freccia per spostare il cursore ed evidenziare l'intestazione 'xStat'. Quindi premere Cancella e Invio per cancellare tutti i valori inseriti nella colonna xStat.
    • Utilizzare i tasti freccia per evidenziare l'intestazione 'yStat'. Quindi premere Cancella e Invio per cancellare tutti i valori inseriti nella colonna yStat.
  3. 3 Inserisci i dati iniziali. Utilizzare i tasti freccia per spostare il cursore sulla prima cella sotto l'intestazione "xStat". Immettere il primo valore e premere Invio. Nella parte inferiore dello schermo viene visualizzato "xStat (1) = __", con il valore inserito che sostituisce uno spazio. Dopo aver premuto Invio, il valore inserito apparirà nella tabella e il cursore si sposterà sulla riga successiva; questo mostrerà "xStat (2) = __" nella parte inferiore dello schermo.
    • Inserisci tutti i valori per la variabile "x".
    • Dopo aver inserito tutti i valori per x, usa i tasti freccia per navigare fino alla colonna yStat e inserisci i valori per y.
    • Dopo aver inserito tutte le coppie di numeri, premere Esci per cancellare lo schermo e uscire dalla modalità di aggregazione.
  4. 4 Calcola il coefficiente di correlazione. Caratterizza quanto i dati siano vicini a una certa linea retta. La calcolatrice grafica può determinare rapidamente la retta adatta e calcolare il coefficiente di correlazione.
    • Fare clic su Statistiche - Calc. Sulla TI-86, premere [2nd] - [Stat] - [F1].
    • Selezionare la funzione Regressione lineare. Sulla TI-86, premere [F3] che è etichettato "LinR". Lo schermo visualizzerà la riga "LinR _" con un cursore lampeggiante.
    • Ora inserisci i nomi di due variabili: xStat e yStat.
      • Sulla TI-86, aprire l'elenco dei nomi; per fare ciò, premere [2nd] - [List] - [F3].
      • Le variabili disponibili sono visualizzate nella riga inferiore dello schermo. Seleziona [xStat] (probabilmente devi premere F1 o F2 per farlo), inserisci una virgola, quindi seleziona [yStat].
      • Premere Invio per elaborare i dati inseriti.
  5. 5 Analizza i tuoi risultati. Premendo Invio, lo schermo visualizzerà le seguenti informazioni:
    • =un+BX{ stile di visualizzazione y = a + bx}: questa è la funzione che descrive la linea. Si noti che la funzione non è scritta in forma standard (y = kx + b).
    • un={ stile di visualizzazione a =}... Questa è la coordinata y dell'intersezione della retta con l'asse y.
    • B={ stile di visualizzazione b =}... Questa è la pendenza della linea.
    • corretto={ displaystyle { text {corr}} =}... Questo è il coefficiente di correlazione.
    • n={ stile di visualizzazione n =}... Questo è il numero di coppie di numeri che sono state utilizzate nei calcoli.

Metodo 4 di 4: Spiegazione dei concetti di base

  1. 1 Comprendere il concetto di correlazione. La correlazione è la relazione statistica tra due quantità. Il coefficiente di correlazione è un valore numerico che può essere calcolato per due qualsiasi set di dati. Il valore del coefficiente di correlazione è sempre compreso nell'intervallo da -1 a +1 e caratterizza il grado di relazione tra due variabili.
    • Ad esempio, data l'altezza e l'età dei bambini (circa 12 anni). Molto probabilmente, ci sarà una forte correlazione positiva, perché i bambini diventano più alti con l'età.
    • Un esempio di correlazione negativa: secondi di penalità e tempo trascorso in allenamento di biathlon, ovvero più un atleta si allena, meno secondi di penalità verranno assegnati.
    • Infine, a volte c'è pochissima correlazione (positiva o negativa), come tra la misura delle scarpe e i punteggi matematici.
  2. 2 Ricorda come calcolare la media aritmetica. Per calcolare la media aritmetica (o media), è necessario trovare la somma di tutti questi valori, quindi dividerla per il numero di valori. Ricorda che la media aritmetica è necessaria per calcolare il coefficiente di correlazione.
    • Il valore medio di una variabile è indicato da una lettera con sopra una barra orizzontale. Ad esempio, nel caso delle variabili "x" e "y", i loro valori medi sono indicati come segue: x̅ e y̅. La media è talvolta indicata dalla lettera greca "μ" (mu). Per scrivere la media aritmetica dei valori della variabile "x", utilizzare la notazione μX o μ (x).
    • Ad esempio, dati i seguenti valori per la variabile "x": 1,2,5,6,9,10. La media aritmetica di questi valori viene calcolata come segue:
      • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μX=33/6{ displaystyle mu _ {x} = 33/6}
      • μX=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Notare l'importanza della deviazione standard. In statistica, la deviazione standard caratterizza il grado di dispersione dei numeri rispetto alla loro media. Se la deviazione standard è piccola, i numeri sono vicini alla media; se la deviazione standard è grande, i numeri sono lontani dalla media.
    • La deviazione standard è indicata dalla lettera "s" o dalla lettera greca "σ" (sigma). Pertanto, la deviazione standard dei valori della variabile "x" è indicata come segue: sX oX.
  4. 4 Ricordare il simbolo per l'operazione di sommatoria. Il simbolo di sommatoria è uno dei simboli più comuni in matematica e indica la somma dei valori. Questo simbolo è la lettera greca "Σ" (sigma maiuscolo).
    • Ad esempio, se dati i seguenti valori della variabile "x": 1,2,5,6,9,10, allora Σx significa:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Consigli

  • Il coefficiente di correlazione è talvolta chiamato "coefficiente di correlazione di Pearson" dal suo sviluppatore Carl Pearson.
  • Nella maggior parte dei casi, quando il coefficiente di correlazione è maggiore di 0,8 (positivo o negativo), si ha una forte correlazione; se il coefficiente di correlazione è inferiore a 0,5 (positivo o negativo), si osserva una correlazione debole.

Avvertenze

  • La correlazione caratterizza la relazione tra i valori di due variabili. Ma ricorda che la correlazione non ha nulla a che fare con la causalità. Ad esempio, se confronti l'altezza e il numero di scarpe delle persone, è probabile che trovi una forte correlazione positiva. In genere, più alta è la persona, maggiore è la misura della scarpa. Ma questo non significa che un aumento dell'altezza porti a un aumento automatico delle dimensioni delle scarpe, o che i piedi più grandi portino a una crescita più rapida. Queste quantità sono semplicemente correlate.