Determina il coefficiente di correlazione

Autore: Morris Wright
Data Della Creazione: 28 Aprile 2021
Data Di Aggiornamento: 19 Giugno 2024
Anonim
Correlazioni tra due variabili e il coefficiente di correlazione r
Video: Correlazioni tra due variabili e il coefficiente di correlazione r

Contenuto

Il coefficiente di correlazione, indicato r o ρ, è la misura della correlazione lineare (la relazione, sia in forza che in direzione) tra due variabili. Va da -1 a +1, utilizzando i segni più e meno per rappresentare la correlazione positiva e negativa. Se il coefficiente di correlazione è esattamente -1, la relazione tra le due variabili è completamente negativa; se il coefficiente di correlazione è esattamente +1, la relazione è completamente positiva. Due variabili possono avere una correlazione positiva, una correlazione negativa o nessuna correlazione. È possibile calcolare la correlazione manualmente, utilizzando alcuni dei calcoli di correlazione gratuiti disponibili online o utilizzando le funzioni statistiche di una buona calcolatrice grafica.

Al passo

Metodo 1 di 4: calcolare manualmente il coefficiente di correlazione

  1. Per prima cosa raccogli i tuoi dati. Per iniziare a calcolare una correlazione efficiente, esaminare prima le coppie di dati. È utile metterli in una tabella, sia verticalmente che orizzontalmente. Etichetta ogni riga o colonna x e y.
    • Ad esempio, supponiamo di avere quattro coppie di dati per X e y. La tabella potrebbe quindi avere questo aspetto:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Calcola la media di X. Per calcolare la media, sono necessari tutti i valori di X aggiungere e quindi dividere per il numero di valori.
    • Usando l'esempio sopra, nota che hai quattro valori per X. Per calcolare la media, somma tutti i valori X e dividerlo per 4. Il calcolo ha questo aspetto:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Trova la media di y. Alla media di y Per trovarlo, segui gli stessi passaggi, sommando tutti i valori di y insieme e quindi dividendo per il numero di valori.
      • Nell'esempio sopra, hai anche quattro valori per y. Sommare tutti questi valori insieme e poi dividerli per 4. I calcoli avranno questo aspetto:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Determina la deviazione standard di X. Una volta che hai i tuoi mezzi, puoi calcolare la deviazione standard. Per fare ciò, usa la formula:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Calcola la deviazione standard di y. Utilizzando gli stessi passaggi di base, trova la deviazione standard di y. Utilizzerai la stessa formula, utilizzando i punti dati per y.
          • Con i dati di esempio, i tuoi calcoli avranno questo aspetto:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Rivedi la formula di base per determinare un coefficiente di correlazione. La formula per il calcolo di un coefficiente di correlazione utilizza medie, deviazioni standard e il numero di coppie in un set di dati (rappresentato da n). Il coefficiente di correlazione stesso è rappresentato dalla lettera minuscola r o dalla lettera greca ρ (rho). Per questo articolo, useremo la formula nota come coefficiente di correlazione di Pearson come mostrato di seguito:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Determina il coefficiente di correlazione. Ora hai le medie e le deviazioni standard per le tue variabili, quindi puoi passare alla formula del coefficiente di correlazione. Ricordati che n rappresenta il numero di valori che hai. Hai già elaborato le altre informazioni pertinenti nei passaggi precedenti.
              • Utilizzando i dati di esempio, è possibile inserire i dati nella formula del coefficiente di correlazione e calcolarli come segue:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Interpreta il risultato. Per questo set di dati, il coefficiente di correlazione è 0,988. Questo numero ti dice due cose sui dati. Guarda il segno del numero e la dimensione del numero.
                • Poiché il coefficiente di correlazione è positivo, si può affermare che esiste una correlazione positiva tra i dati x e i dati y. Ciò significa che se i valori x aumentano, ti aspetti che anche i valori y aumentino.
                • Poiché il coefficiente di correlazione è molto vicino a +1, i dati x ey sono strettamente correlati. Se dovessi rappresentare graficamente questi punti, vedresti che sono un'ottima approssimazione a una linea retta.

Metodo 2 di 4: utilizzo di calcolatori di correlazione online

  1. Cerca online i calcolatori di correlazione. La misurazione della correlazione è un calcolo abbastanza standard per gli statistici. Il calcolo può diventare molto noioso per set di dati di grandi dimensioni se eseguito a mano. Pertanto, molte fonti hanno reso disponibili online calcoli di correlazione comuni. Utilizza qualsiasi motore di ricerca e inserisci il termine di ricerca "calcolatore di correlazione".
  2. Immettere i dati. Leggere attentamente le istruzioni sul sito Web in modo da poter inserire i dati correttamente. È importante che le coppie di dati siano mantenute in ordine o si otterrà un risultato di correlazione errato. Diversi siti Web utilizzano formati diversi per immettere i dati.
    • Ad esempio, sul sito web http://ncalculators.com/statistics/correlation-coefficient-calculator.htm troverai una casella orizzontale per l'immissione dei valori x e una seconda casella orizzontale per l'immissione dei valori y. Inserisci i termini, separati solo da virgole. Pertanto, il set di dati x calcolato in precedenza in questo articolo deve essere immesso come 1,2,4,5. Il set di dati y viene immesso come 1,3,5,7.
    • In un altro sito, http://www.alcula.com/calculators/statistics/correlation-coefficient/, è possibile inserire i dati orizzontalmente o verticalmente, purché si mantengano i punti dati in ordine.
  3. Calcola i risultati. Questi siti di calcolo sono popolari perché dopo aver inserito i dati in genere è sufficiente fare clic sul pulsante "Calcola": il risultato verrà visualizzato automaticamente.

Metodo 3 di 4: utilizzo di una calcolatrice grafica

  1. Inserisci i tuoi dati. Sulla calcolatrice grafica, abilita la funzione statistica e poi seleziona il comando "Modifica".
    • Ogni calcolatrice ha comandi da tastiera leggermente diversi. Questo articolo fornisce le istruzioni specifiche per la Texas Instruments TI-86.
    • Per accedere alla funzione Stat, premere [2nd] -Stat (sopra il tasto "+") e quindi premere F2-Edit.
  2. Elimina tutti i vecchi dati memorizzati. La maggior parte dei calcolatori manterrà i dati statistici fino a quando non verranno cancellati. Per assicurarti di non confondere i vecchi dati con i nuovi dati, dovresti prima cancellare tutte le informazioni salvate in precedenza.
    • Utilizzare i tasti freccia per spostare il cursore per evidenziare la categoria "xStat". Quindi premere "Cancella" e "Invio". Questo dovrebbe cancellare tutti i valori nella colonna xStat.
    • Utilizzare i tasti freccia per evidenziare la categoria "yStat". Premere "Cancella" e "Invio" per cancellare anche i dati per quella colonna.
  3. Immettere i valori dei dati. Utilizzare i tasti freccia per spostare il cursore sul primo spazio sotto l'intestazione xStat. Digita il tuo primo valore di dati e poi premi Invio. Dovresti vedere lo spazio nella parte inferiore dello schermo "xStat (1) = __", dove il tuo valore riempie lo spazio vuoto. Quando si preme Invio, i dati riempiranno la tabella, il cursore si sposterà alla riga successiva e la riga in fondo allo schermo dovrebbe ora leggere "xStat (2) = __".
    • Continua a inserire tutti i valori x.
    • Dopo aver immesso i valori x, utilizzare i tasti freccia per spostarsi sulla colonna yStat e immettere i valori y.
    • Quando tutti i dati sono stati inseriti, premere Exit per cancellare lo schermo e uscire dal menu Stat.
  4. Calcola le statistiche di regressione lineare. Il coefficiente di correlazione è una misura di quanto i dati si avvicinano a una linea retta. Una calcolatrice grafica con funzioni statistiche può calcolare molto rapidamente la migliore linea di adattamento e il coefficiente di correlazione.
    • Accedere alla funzione Stat e quindi premere il pulsante Calc. Sulla TI-86, questo è [2nd] [Stat] [F1].
    • Scegli i calcoli di regressione lineare. Sulla TI-86, questo è [F3], etichettato "LinR". Il display grafico mostrerà quindi la riga "LinR _" con un cursore lampeggiante.
    • Ora devi inserire i nomi delle due variabili che vuoi calcolare. Questi sono xStat e yStat.
      • Sulla TI-86, selezionare l'elenco dei nomi ("Names") premendo [2nd] [List] [F3].
      • La riga inferiore dello schermo dovrebbe ora mostrare le variabili disponibili. Scegli [xStat] (questo è probabilmente il pulsante F1 o F2), quindi inserisci una virgola e quindi [yStat].
      • Premere Invio per calcolare i dati
  5. Interpreta i risultati. Quando si preme Invio, la calcolatrice calcolerà immediatamente le seguenti informazioni per i dati inseriti:
    • y=un+bX{ displaystyle y = a + bx}Comprendi il concetto di correlazione. La correlazione si riferisce alla relazione statistica tra due quantità. Il coefficiente di correlazione è un singolo numero che è possibile calcolare per due set di punti dati. Il numero è sempre compreso tra -1 e +1 e indica quanto sono vicini i due set di dati.
      • Ad esempio, se misurassi l'altezza e l'età dei bambini fino a 12 anni circa, ti aspetteresti di trovare una forte correlazione positiva. Man mano che i bambini invecchiano, tendono a diventare più alti.
      • Un esempio di correlazione negativa è confrontare il tempo che qualcuno trascorre a praticare il golf con il punteggio di quella persona. Man mano che la pratica progredisce, il punteggio dovrebbe diminuire.
      • In definitiva, ti aspetteresti poca correlazione, positiva o negativa, tra il numero di scarpe di una persona, ad esempio, ei voti degli esami.
    • Calcola la media. La media aritmetica, o "media", di un insieme di dati viene calcolata sommando tutti i valori dei dati e quindi dividendo per il numero di valori nell'insieme. Per determinare il coefficiente di correlazione per i dati, è necessario calcolare la media di ciascun set di dati.
      • La media di una variabile è indicata dalla variabile con una linea orizzontale sopra di essa. Questo è spesso indicato come "x-bar" o "y-bar" per i set di dati di x e y. In alternativa, la media può essere indicata con la lettera greca minuscola μ (mu). Ad esempio, per indicare la media dei punti dati di x, potresti usare μX o μ (x).
      • Ad esempio, se hai un insieme di x (1,2,5,6,9,10), la media di questi dati viene calcolata come segue:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Conosci l'importanza della deviazione standard. Nelle statistiche, la deviazione standard misura la variazione, mostrando la dispersione dei numeri dalla media. Un gruppo di numeri con una deviazione standard bassa è abbastanza vicino l'uno all'altro. Un gruppo di numeri con una deviazione standard elevata è più sparpagliato.
          • Come simbolo, la deviazione standard è espressa utilizzando la lettera minuscola s o la lettera greca σ (sigma). Pertanto, la deviazione standard dei dati x viene scritta come SX o σX.
        • Riconosci la notazione della somma. L'operatore di somma è uno degli operatori più comuni in matematica e indica una somma di valori. È rappresentato dalla lettera maiuscola greca, sigma o ∑.
          • Ad esempio, se hai una raccolta di punti dati x (1,2,5,6,9,10), ∑x significa:
            • 1+2+5+6+9+10 = 33

Suggerimenti

  • Il coefficiente di correlazione viene talvolta definito "coefficiente di correlazione momento-prodotto di Pearson" in onore di Karl Pearson, il suo sviluppatore.
  • In generale, un coefficiente di correlazione maggiore di 0,8 (positivo o negativo) rappresenta una forte correlazione; un coefficiente di correlazione inferiore a 0,5 (positivo o negativo di nuovo) rappresenta un coefficiente di correlazione debole.

Avvertenze

  • La correlazione mostra che due set di dati sono collegati in qualche modo. Tuttavia, fai attenzione a non interpretarlo come una relazione causale. Ad esempio, se confronti le dimensioni delle scarpe delle persone e la loro altezza, probabilmente troverai una forte correlazione positiva. Le persone più grandi generalmente hanno piedi più grandi. Tuttavia, questo non significa che diventare alti ti farà crescere i piedi o che i piedi grandi ti faranno crescere. Succedono insieme e basta.