Calcola la covarianza

Autore: Judy Howell
Data Della Creazione: 2 Luglio 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Media, varianza e covarianza di variabili casuali
Video: Media, varianza e covarianza di variabili casuali

Contenuto

La covarianza è un calcolo statistico per rendere più trasparente la relazione tra due set di dati. Ad esempio, supponiamo che gli antropologi studino l'altezza e il peso di una popolazione all'interno di una particolare cultura. Per ogni persona nello studio, altezza e peso possono essere visualizzati con una coppia di dati (x, y). Questi valori possono essere utilizzati in una formula standard per calcolare la relazione di covarianza. Questo articolo spiega innanzitutto i calcoli per determinare la covarianza di un set di dati. Successivamente, verranno discussi altri due modi automatizzati per determinare il risultato.

Al passo

Metodo 1 di 4: calcolare manualmente la covarianza utilizzando la formula standard

  1. Impara la formula di covarianza standard e le sue parti. La formula standard per il calcolo della covarianza è Σ(XioXavg)(yioyavg)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Costruisci la tua tabella dati. Prima di iniziare, è utile raccogliere i tuoi dati. Crea una tabella composta da cinque colonne. Devi dichiarare ogni colonna come segue:
    • X{ displaystyle x}Calcola la media dei punti dati x. Questo set di dati di esempio contiene 9 numeri. Per trovare la media, sommali e dividi la somma per 9. Questo dà il risultato 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Quando dividi questo per 9, ottieni la media 4.89. Questo è il valore che utilizzerai come x (avg) per i prossimi calcoli.
    • Calcola la media dei punti dati y. Questa colonna y deve anche essere composta da 9 punti dati che coincidono con i punti dati x. Determina la media di questi. Per questo set di dati campione, diventa 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Dividi questo totale per 9 per ottenere una media di 5,44. Utilizzerai 5.44 come valore di y (avg) per i calcoli imminenti.
    • Calcola i valori (XioXavg){ displaystyle (x_ {i} -x _ { text {avg}})}Calcola i valori (yioyavg){ displaystyle (y_ {i} -y _ { text {avg}})}Calcola i prodotti per ogni riga di dati. Riempi le righe dell'ultima colonna moltiplicando i numeri calcolati nelle due colonne precedenti di (XioXavg){ displaystyle (x_ {i} -x _ { text {avg}})}Trova la somma dei valori nell'ultima colonna. È qui che entra in gioco il simbolo Σ. Dopo aver eseguito tutti i calcoli fino ad ora, somma i risultati. Per questo set di dati di esempio, dovresti ora avere nove valori nell'ultima colonna. Aggiungi questi nove numeri insieme. Presta molta attenzione al fatto che un numero sia positivo o negativo.
      • La somma di questo set di dati di esempio dovrebbe arrivare a -64,57. Scrivi questo totale nello spazio in fondo alla colonna. Questo è il valore del numeratore della formula di covarianza standard.
    • Calcola il denominatore della formula di covarianza. Il numeratore della formula di covarianza standard è il valore appena calcolato. Il denominatore è rappresentato da (n-1) ed è uno in meno rispetto al numero di coppie di dati nel set di dati.
      • In questo problema di esempio, ci sono nove coppie di dati, quindi n è 9. Pertanto, il valore di (n-1) è uguale a 8.
    • Dividi il numeratore per il denominatore. L'ultimo passaggio nel calcolo della covarianza è dividere il numeratore, Σ(XioXavg)(yioyavg){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Nota quali sono i calcoli ripetitivi. La covarianza è un calcolo che devi fare a mano alcune volte in modo da capire il significato del risultato. Tuttavia, se si intende utilizzare regolarmente la covarianza per interpretare i dati, è necessario un modo più rapido e automatizzato per ottenere i risultati. A questo punto potresti aver notato che con il nostro set di dati relativamente piccolo di sole nove coppie di dati, i calcoli consistevano in due medie, diciotto sottrazioni separate, nove moltiplicazioni, un'addizione e infine un'altra divisione. Sono 31 calcoli relativamente piccoli per trovare la soluzione. Lungo il percorso si corre il rischio di perdere segni negativi o di copiare i risultati in modo errato, in modo che la risposta non sia più corretta.
    • Crea un foglio di lavoro per calcolare la covarianza. Se hai familiarità con Excel (o un altro programma di calcolo), puoi facilmente creare una tabella per determinare la covarianza. Etichetta le intestazioni delle cinque colonne come hai fatto per i calcoli a mano: x, y, (x (i) -x (avg)), (y (i) -y (avg)) e Product.
      • Per semplificare la denominazione, chiamare la terza colonna qualcosa come "differenza x" e la quarta colonna "differenza y", purché si ricordi il significato dei dati.
      • Se la tabella inizia nell'angolo in alto a sinistra del foglio di lavoro, la cella A1 verrà etichettata con x, mentre le altre etichette continueranno fino alla cella E1.
    • Immettere i punti dati. Immettere i valori dei dati nelle due colonne x e y. Ricorda che l'ordine dei punti dati è importante, quindi devi abbinare ogni y con il valore corrispondente di x.
      • I valori x iniziano nella cella A2 e continuano fino al numero di punti dati necessari.
      • I valori y iniziano nella cella B2 e continuano fino al numero di punti dati necessari.
    • Determina le medie dei valori xey. Excel calcola le medie per te molto rapidamente. Nella prima cella vuota sotto ogni colonna di dati, digita la formula = MEDIA (A2: A ___). Riempi lo spazio vuoto con il numero della cella che corrisponde all'ultimo punto dati.
      • Ad esempio, se si dispone di 100 punti dati, le celle da A2 a A101 vengono riempite, quindi nella cella si digita = MEDIA (A2: A101).
      • Per i dati y, digita la formula = MEDIA (B2: B101).
      • Ricorda che una formula in Excel inizia con un segno "=".
    • Digita la formula per la colonna (x (i) -x (avg)). Nella cella C2, inserisci la formula per calcolare la prima sottrazione. Questa formula diventa: = A2 -___. Riempi lo spazio vuoto con l'indirizzo della cella contenente la media dei dati x.
      • Ad esempio, dei 100 punti dati, la media sarà nella cella A103, quindi la formula diventa: = A2-A103.
    • Ripeti la formula per i punti dati (y (i) -y (avg)). Seguendo lo stesso esempio, entra nella cella D2. La formula diventa: = B2-B103.
    • Digita la formula per la colonna "Prodotto". Nella quinta colonna, digita nella cella E2 la formula per calcolare il prodotto delle due celle precedenti. Questo diventa quindi: = C2 * D2.
    • Copia le formule per riempire la tabella. Fino ad ora, hai programmato solo i primi punti dati nella riga 2. Usando il mouse, contrassegna le celle C2, D2 ed E2. Posiziona il cursore sulla piccola casella nell'angolo in basso a destra finché non viene visualizzato un segno più. Fare clic e tenere premuto il pulsante del mouse e trascinare il mouse verso il basso per espandere la selezione e riempire l'intera tabella dei dati. Questo passaggio copierà automaticamente le tre formule dalle celle C2, D2 ed E2 all'intera tabella. La tabella dovrebbe essere compilata automaticamente con tutti i calcoli.
    • Programma la somma dell'ultima colonna. È necessaria la somma degli articoli nella colonna "Prodotto". Nella cella vuota immediatamente sotto l'ultimo punto dati in quella colonna, digita la formula: = SUM (E2: E ___). Riempi lo spazio vuoto con l'indirizzo della cella dell'ultimo punto dati.
      • Nell'esempio con 100 punti dati, questa formula va nella cella E103. Digitare: = SUM (E2: E102).
    • Determina la covarianza. Puoi anche fare in modo che Excel esegua il calcolo finale per te. L'ultimo calcolo nella cella E103 nel nostro esempio rappresenta il numeratore della formula di covarianza. Proprio sotto quella cella, digita la formula: = E103 / ___. Riempi lo spazio vuoto con il numero di punti dati che hai. Nel nostro esempio, questo è 100. Il risultato è la covarianza dei tuoi dati.

Metodo 3 di 4: utilizzo di calcolatori di covarianza online

  1. Cerca online calcolatori di covarianza. Varie scuole, aziende o altre fonti hanno siti web che calcolano i valori di covarianza molto facilmente per te. Utilizza il termine di ricerca "calcolatore di covarianza" in un motore di ricerca.
  2. Inserisci i tuoi dati. Leggere attentamente le istruzioni sul sito Web per assicurarsi di inserire correttamente le informazioni. È importante che le tue coppie di dati siano mantenute in ordine, altrimenti il ​​risultato generato sarà una covarianza errata. I siti web hanno diversi stili di immissione dei dati.
    • Ad esempio, sul sito web http://ncalculators.com/statistics/covariance-calculator.htm, c'è una casella orizzontale per inserire i valori x e una seconda casella orizzontale per inserire i valori y. Devi inserire i tuoi dati separati da virgole. Pertanto, il set di dati x calcolato in precedenza in questo articolo deve essere inserito come 1,3,2,5,8,7,12,2,4. I dati y sono 8,6,9,4,3,3,2,7,7.
    • Su un altro sito, https://www.thecalculator.co/math/Covariance-Calculator-705.html, ti verrà chiesto di inserire i dati x nella prima casella. I dati vengono inseriti verticalmente, con un elemento per riga. Pertanto, la voce su questo sito ha il seguente aspetto:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Calcola i tuoi risultati. La cosa interessante di questi calcoli online è che dopo aver inserito i dati, di solito è sufficiente fare clic sul pulsante "Calcola" e i risultati verranno visualizzati automaticamente. La maggior parte dei siti ti fornirà i calcoli intermedi di x (avg), y (avg) e n.

Metodo 4 di 4: interpretazione dei risultati della covarianza

  1. Cerca una relazione positiva o negativa. La covarianza è un singolo numero statistico che indica la relazione tra un set di dati e un altro. Nell'esempio citato nell'introduzione vengono misurati l'altezza e il peso. Ti aspetteresti che con la crescita delle persone, aumenti anche il loro peso, portando a una visione positiva della covarianza. Un altro esempio: supponiamo che vengano raccolti dati che indicano il numero di ore in cui qualcuno pratica il golf e il punteggio ottenuto. In questo caso ti aspetti una covarianza negativa, il che significa che all'aumentare del numero di ore di allenamento, il punteggio del golf diminuirà. (Nel golf, un punteggio più basso è migliore).
    • Considera il set di dati campione calcolato sopra. La covarianza risultante è -8,07. Il segno meno significa che all'aumentare dei valori x, i valori y tendono a diminuire. Puoi vedere che questo è vero osservando alcuni dei valori. Ad esempio, i valori x di 1 e 2 corrispondono ai valori y di 7, 8 e 9. I valori x di 8 e 12 sono collegati rispettivamente ai valori y di 3 e 2 .
  2. Interpreta l'entità della covarianza. Se il numero del punteggio di covarianza è elevato, un numero positivo o un numero negativo elevato, è possibile interpretarlo come due elementi di dati fortemente connessi, in modo positivo o negativo.
    • La covarianza -8,07 del set di dati campione è piuttosto ampia. Nota che i dati vanno da 1 a 12. Quindi 8 è un numero abbastanza grande. Ciò indica una relazione abbastanza forte tra i set di dati x e y.
  3. Comprendi la mancanza di una relazione. Se il risultato è una covarianza uguale o molto vicina a 0, puoi concludere che i punti dati non sono correlati. Cioè, un aumento di un valore può, ma non deve comportare un aumento dell'altro. I due termini sono collegati quasi casualmente.
    • Supponi di mettere in relazione le dimensioni delle scarpe con i voti degli esami. Poiché ci sono così tanti fattori che influenzano i voti degli esami di uno studente, ci si può aspettare un punteggio di covarianza vicino a 0. Ciò indica che non esiste quasi alcuna relazione tra i due valori.
  4. Visualizza graficamente la relazione. Per comprendere visivamente la covarianza, puoi tracciare i tuoi punti dati su un grafico x, y. Quando lo fai, dovresti vedere abbastanza facilmente che i punti, sebbene non esattamente in linea retta, tendono ad avvicinarsi a un ammasso in una linea diagonale da in alto a sinistra a in basso a destra. Questa è la descrizione di una covarianza negativa. Puoi anche vedere che il valore della covarianza è uguale a -8,07. Questo è un numero piuttosto elevato rispetto ai punti dati. Il numero elevato suggerisce che la covarianza è abbastanza forte, cosa che puoi dedurre dalla forma lineare dei punti dati.
    • Per riesaminarlo, leggi gli articoli sul disegno di punti in un sistema di coordinate su wikiHow.

Avvertenze

  • La covarianza ha un'applicazione limitata nelle statistiche. È spesso un passo avanti verso il calcolo dei coefficienti di correlazione o di altri concetti. Fai attenzione alle interpretazioni eccessivamente audaci basate su un punteggio di covarianza.