itholoinfo.com.com

Cum se calculează Covariance

Covariance este un calcul statistic care vă poate ajuta să înțelegeți modul în care două seturi de date sunt legate între ele. De exemplu, să presupunem că există antropologi care studiază înălțimile și greutățile populației unei locații date. Pentru fiecare persoană din studiu, înălțimea și greutatea pot fi reprezentate de o pereche de zaruri (x, y). Aceste valori pot fi utilizate cu o formulă standard pentru a calcula relația de covarianță. Acest articol va explica mai întâi calculele care duc la descoperirea covarianței unui set dat. Apoi se va ocupa de două modalități mai automatizate de a obține rezultatul.

pași

Metoda 1
Calculând covarianța manuală cu formula standard

Imaginea intitulată Calculate Covariance Pasul 1
1
Aflați formula standard de covarianță și ce părți sunt. Formula standard pentru calcularea covarianței este Σ(xeu-xmed)(yeu-ymed)/(n-1){ displaystyle Sigma (xi-x med)} (yi-y med)} / (n-1)}Σ{ displaystyle sigma}: Acest simbol reprezintă litera greacă "sigma". În funcțiile matematice, ea reprezintă suma seriei de valori care o însoțesc. În această formulă, semnul Σ indică faptul că veți calcula următoarele valori în numerotatorul fracției și le veți adăuga înainte de împărțirea de către numitor.
  • xeu{ displaystyle x_ {i}}: în acest caz, indicele "i" reprezintă un contor sau un indice. Aceasta indică faptul că veți efectua calculul fiecăreia dintre valorile x prezente în setul de date.
  • xmed{ displaystyle x med}: "med" indică faptul că x (med) reprezintă valoarea medie a tuturor punctelor la x. Această medie poate fi de asemenea scrisă ca un x cu o linie orizontală mică peste ea. În acest caz, variabila se numește "x bar", dar reprezintă totuși media setului de date.
  • yeu{ displaystyle y_ {i}}: din nou, indicele "i" reprezintă un contor sau un indice. Aceasta indică faptul că veți calcula fiecare dintre valorile y prezente în setul de date.
  • ymed{ displaystyle and med}: "med" indică faptul că y (med) reprezintă valoarea medie a tuturor punctelor în y. Acest mijloc poate fi de asemenea scris ca un y cu o linie orizontală deasupra lui. În acest caz, variabila se numește "y", dar reprezintă totuși media setului de date.
  • n{ displaystyle n}: Această variabilă reprezintă numărul de elemente prezente în setul de date. Reamintim că într-o problemă de covarianță, un singur element este compus atât din valoarea în x, cât și din valoarea y. Valoarea n este o pereche de seturi de date, nu un singur număr.
  • Imaginea intitulată Calculate Covariance Step 2
    2
    Pregătiți-vă tabelul de date. Înainte de a începe calculele, trebuie să vă colectați mai întâi datele. Faceți un tabel cu cinci coloane și dați fiecăruia următoarele nume:
    • x{ displaystyle x}: În această coloană, introduceți valorile punctelor de date în x.
    • y{ displaystyle și}: În această coloană, introduceți valorile punctelor de date în y. Aveți grijă să aliniați valorile la y cu valorile corespunzătoare la x. Într-o problemă de covarianță, ordinea punctelor de date și perechea între x și y sunt importante.
    • (xeu-xmed){ displaystyle (x_ {i-x-med}}}: Părăsiți mai întâi această coloană. După ce mediați punctele de date la x, acestea vor fi completate.
    • (yeu-ymed){ displaystyle (y_ {i} -y}}}}: Părăsiți mai întâi această coloană. După ce ați media valorile punctelor de date în y, acestea vor fi completate.
    • PrduT{ displaystyle Product}: Lăsați și această ultimă coloană necompletată. Veți completa acest lucru pe măsură ce avansați în rezoluție.
  • Imaginea intitulată Calculate Covariance Pasul 3
    3
    Calculați media punctelor de date la x. Acest set de date conține nouă numere. Pentru a calcula media dintre ele, scade-le și împărțiți-le cu 9. Prin urmare, veți obține 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Prin împărțirea acestei valori cu 9, media va fi de 4,89. Aceasta este valoarea care va fi folosită ca x (med) în următoarele calcule.
  • Imaginea intitulată Calculate Covariance Pasul 4
    4
    Calculați media punctelor de date în y. În mod similar, coloana y va consta din nouă puncte de date care se vor potrivi cu valorile la x. Calculați media acestor valori. În acest set de date, avem 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Împărțiți acest rezultat cu 9 pentru a obține o medie de 5,44 pentru a o utiliza ca y (med) în următoarele calcule.
  • Imaginea intitulată Calculate Covariance Step 5
    5
    Calculați valorile (xeu-xmed){ displaystyle (x_ {i-x-med}}}(xeu-xmed){ displaystyle (x_ {i-x-med}}}va fi egal cu 1-4.89, sau -3.89.
  • Repetați procesul cu fiecare punct de date. Deci, a doua linie va fi de 3-4.89, sau -1.89. A treia linie va fi de 2-4.89, sau -2.89. Continuați procesul cu toate punctele de date. În acest caz, cele nouă numere din coloană vor fi egale cu -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89 și -0,89 .
  • Imaginea intitulată Calculate Covariance Step 6
    6
    Calculați valorile (yeu-ymed){ displaystyle (y_ {i} -y}}}}
    Imaginea intitulată Calculate Covariance Step 7
    7
    Calculați produsele fiecărei linii. Veți completa rândurile coloanei finale prin înmulțirea numerelor calculate în coloanele anterioare de (xeu-xmed){ displaystyle (x_ {i-x-med}}}și (yeu-ymed){ displaystyle (y_ {i} -y}}}}(xeu-xmed){ displaystyle (x_ {i-x-med}}}calculată este egală cu -3,89, iar valoarea lui (yeu-ymed){ displaystyle (y_ {i} -y}}}}este egal cu 2,56. Produsul celor două valori este de -3,89 * 2,56 = -9,96.
  • În al doilea rând, trebuie să multiplicați cele două numere: -1.88 * 0.56 = -1.06.
  • Continuați să multiplicați rândul după rând până la sfârșitul setului de date. Când a terminat, cele nouă valorile din acea coloană sunt egale cu -9.96, -1.06, -10.29, -0.16, -7.59, -5.15, -24.46, -4.51 și -1,39.
  • Imaginea intitulată Calculate Covariance Step 8
    8
    Calculați suma valorilor din ultima coloană. Acesta este locul unde simbolul Σ intră în joc. După ce ați făcut toate calculele pe care le-ați făcut până acum, ar trebui să adăugați rezultatele. În ceea ce privește setul de date de probă, aveți nouă valori în coloana finală. Apoi, subjugați-i. Acordați o atenție deosebită dacă fiecare număr este pozitiv sau negativ.
    • Pentru acest set de date, suma va fi -64.57. Scrieți acest total în spațiul din partea de jos a coloanei. Acesta reprezintă valoarea de numerar din formula covarianță standard.
  • Imaginea intitulată Calculate Covariance Pasul 9
    9
    Calculați numitorul formulei de covarianță. Numerotatorul formulei standard este reprezentat de numărul pe care tocmai l-ați calculat. Numitorul, la rândul său, este reprezentat de (n-1), adică o valoare cu o unitate mai mică decât numărul de perechi din setul de date.
    • În acest exemplu, există nouă perechi de date, astfel încât n este egal cu 9. Astfel, valoarea lui (n-1) este egală cu 8.
  • Imaginea intitulată Calculate Covariance Step 10
    10
    Împărțiți numitorul cu numitorul. Ultimul pas în calcularea covarianței este împărțirea numărătorului, Σ(xeu-xmed)(yeu-ymed){ afișare stil Sigma (xi-x-med)} (y_i -y-med)}}(n-1){ displaystyle (n-1)}

    Metoda 2
    Folosind o foaie de lucru Excel pentru a calcula Covariance

    Imaginea intitulată Calculate Covariance Step 11
    1
    Respectați calculele repetitive. Covariance este un calcul care uneori trebuie făcut manual, astfel încât să înțelegeți ce înseamnă rezultatul. Cu toate acestea, dacă trebuie să utilizați valori covarianță în mod obișnuit pentru a interpreta datele, este important să se găsească o modalitate mai automatizat mai rapid pentru a obține rezultate. În acest moment, veți fi observat că pentru relativ mic set de date, cu nouă perechi, calcule incluse descoperiți două mijloace, face 18 single, înmulțiri scăderi nouă separat, o sumă și o divizie finală. Au existat 31 de calcule mici pentru a ajunge la o singură soluție. Pe parcurs, riscați să uitați semnalele negative sau să copiați rezultatele incorect, ruinând rezultatul.
  • Imaginea intitulată Calculate Covariance Step 12
    2
    Creați o foaie de calcul pentru calcularea covarianței. Dacă sunt confortabile folosind Excel (sau alt program de calcul tabelar capabil de a lucra cu calcule), este ușor de a crea o foaie de calcul, care servește pentru a calcula covarianța. Dă titlurile celor cinci coloane în conformitate cu ceea ce a fost făcut în calculele de mână: x, y, (x (i) -x (med)), (y (i) -y (med)) și de produse.
    • Pentru a simplifica etichetarea, vă puteți da coloana a treia un nume de genul „diferenta x“, iar al patrulea, ceva de genul „y diferenta“, deoarece acestea amintesc ce sunt aceste date.
    • Dacă porniți masa în colțul din stânga sus al foii de lucru, celula A1 va reprezenta eticheta x, însoțită de toate celelalte până când ajungeți la E1.
  • Imaginea intitulată Calculate Covariance Step 13
    3
    Introduceți punctele de date. Introduceți valorile datelor din cele două coloane etichetate x și y. Amintiți-vă că ordinea datelor contează, deci este important să asociați fiecare valoare cu y cu valoarea x corespunzătoare.
    • Valorile în x vor începe în celula A2 și vor continua în jos, conținând cât mai multe puncte de date după cum este necesar.
    • Valorile în y vor începe în celula B2 și vor continua în jos, conținând cât mai multe puncte de date după cum este necesar.
  • Imaginea intitulată Calculate Covariance Step 14
    4
    Calculați mediile valorilor la x și y. Excel poate calcula mediile foarte repede. În prima celulă de val sub fiecare coloană de date, introduceți formula = MED (A2: A ___). Completați martorul cu poziția celulară corespunzătoare ultimului punct de date.
    • De exemplu, dacă aveți 100 de puncte de date, acestea vor umple spațiul de la celula A2 la celula A101. În acest caz, veți scrie = MED (A2: A101).
    • Pentru valorile din y, introduceți formula = MED (B2: B101).
    • Rețineți că începeți formula în Excel cu semn =.


  • Imaginea intitulată Calculate Covariance Step 15
    5
    Introduceți formula pentru coloană (x (i) -x (med)). În celula C2, va trebui să introduceți formula pentru a calcula prima scădere. Va fi = A2 -___. Spațiul alb trebuie umplut cu poziția celulei care conține media valorilor la x.
    • Pentru exemplul celor 100 de puncte de date, media ar fi în celula A103, astfel încât formula să fie = A2-A103.
  • Imaginea intitulată Calculate Covariance Step 16
    6
    Repetați formula pentru punctele de date (y (i) -y (med)). Urmând același exemplu, va fi în celula D2. Această formulă va fi scrisă ca = B2-B103.
  • Imaginea intitulată Calculate Covariance Pasul 17
    7
    Introduceți formula pentru coloana "Produs". În coloana a cincea, în celula E2, va trebui să introduceți formula responsabilă pentru calcularea produsului celor două celule anterioare. Pentru a face acest lucru, tastați doar = C2 * D2.
  • Imaginea intitulată Calculate Covariance Pasul 18
    8
    Copiați formulele pentru a umple masa. Până acum, ați programat prima pereche de date pe rândul 2. Folosind un mouse, selectați celulele C2, D2 și E2. Apoi poziționați cursorul pe cutia mică din colțul din dreapta jos până când pe el apare un semn plus. Faceți clic pe butonul mouse-ului și țineți-l în jos prin glisarea cursorului în jos, extinderea celulei evidențiate până când se umple întregul tabel. Acest pas copiază automat cele trei formule prezente în celulele C2, D2 și E2 la întregul tabel. Apoi, veți vedea că este completat automat cu toate calculele.
  • Imaginea intitulată Calculate Covariance Step 19
    9
    Programați suma ultimei coloane. Este important să găsiți suma elementelor din coloana "Produs". În celula goală de sub ultimul punct de date din această coloană, introduceți formula = SUM (E2: E ___). Completați martorul cu poziția respectivei celule la ultimul punct de date.
    • În exemplul de 100 de puncte de date, această formulă va merge la celula E103. În acest caz, veți scrie = SUM (E2: E102).
  • Imaginea intitulată Calculate Covariance Step 20
    10
    Găsiți covarianță. De asemenea, aveți posibilitatea ca Excel să facă calculele finale. Ultima operație, în celula E103 din exemplul nostru, reprezintă numărătorul formulei de covarianță. Imediat sub ea, puteți introduce formula = E103 / ___. Completați spațiul gol cu ​​valoarea punctelor de date existente. În exemplu, această valoare este egală cu 100. Rezultatul va reprezenta covarianța datelor dvs.
  • Metoda 3
    Utilizarea calculatoarelor de covarianță online

    Imaginea intitulată Calculate Covariance Pasul 21
    1
    Căutați calculatoare de covarianță pe internet. Mai multe școli, companii de programare sau alte instituții au creat pagini capabile să calculeze covarianța dintre valorile datelor. Pentru a le găsi, introduceți termenii "calculator de covarianță" într-un motor de căutare online.
  • Imaginea intitulată Calculate Covariance Step 22
    2
    Introduceți datele. Citiți cu atenție instrucțiunile din pagină pentru a introduce corect datele. Este important ca perechile să fie bine ordonate sau veți obține rezultate covariante incorecte. Paginile diferite au stiluri diferite pentru introducerea datelor.
    • De exemplu, pe pagina https://rcalculators.com/statistics/covariance-calculator.htm (în engleză), există o cutie orizontală pentru introducerea valorilor în x și o a doua cutie orizontală pentru introducerea valorilor în y. Trebuie să introduceți termeni separați doar prin virgulă. Astfel, setul de date din x care a fost calculat anterior ar fi introdus ca 1,3,2,5,8,7,12,2,4. În mod similar, setul de date în y ar fi introdus ca 8,6,9,4,3,3,2,7,7.
    • Pe o altă pagină, https://thecalculator.co/math/Covariance-Calculator-705.html (în engleză), trebuie să introduceți datele referitoare la axa x în prima casetă. Ele vor fi introduse vertical, cu un element pe linie. Deci, inserarea pe această pagină ar arăta astfel:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  • Imaginea intitulată Calculate Covariance Step 23
    3
    Calculați rezultatele. Avantajul acestor calculatoare online este că, odată ce introduceți datele, trebuie doar să faceți clic pe butonul "Calculați" și rezultatele vor apărea automat. Majoritatea paginilor afișează deja calculele intermediare ale variabilelor x (med), y (med) și n.
  • Metoda 4
    Interpretarea rezultatelor covarianței

    Imaginea intitulată Calculate Covariance Step 24
    1
    Căutați o relație pozitivă sau negativă. Covariance este o valoare statistică unică care reprezintă modul în care două seturi de date se raportează unul la celălalt. În exemplul menționat în introducere, se măsoară înălțimea și greutatea. Este de așteptat ca, pe măsură ce oamenii cresc, înălțimile lor să crească, ducând la o covarianță pozitivă. Într-un alt exemplu, presupuneți că valorile sunt colectate în raport cu numărul de ore în care cineva practică golful și scorul pe care această persoană îl poate cuceri. În acest caz, va exista o covarianță negativă, indicând faptul că, pe măsură ce crește numărul de ore, scorul de golf va scădea (în golf, cu atât scorul este mai mic, cu atât mai bine).
    • Rețineți setul de date calculat mai sus. Covarianța rezultată va fi -8,07. Semnul negativ indică aici că, pe măsură ce valorile la x cresc, valorile la y tind să scadă. De fapt, se poate confirma acest adevăr prin respectarea unor valori. De exemplu, valorile din x 1 și 2 corespund valorilor din y 7, 8 și 9. Valorile din x 8 și 12 vor fi asociate respectiv cu valori în y 3 și 2.
  • Imaginea intitulată Calculate Covariance Step 25
    2
    Interpretați amploarea covarianței. Dacă valoarea covarianței este ridicată, fie ea pozitivă sau negativă, o puteți interpreta ca indicând faptul că cele două elemente de date sunt puternic conectate pozitiv sau negativ.
    • În setul de date al exemplului, covarianța lui -8.07 este destul de mare. Rețineți că valorile datelor variază de la 1 la 12, astfel încât 8 este un număr considerabil ridicat. Aceasta indică o conexiune puternică între seturile de date din x și y.
  • Imaginea intitulată Calculate Covariance Step 26
    3
    Înțelegeți o posibilă lipsă de relație. Dacă observați o covarianță egală sau foarte apropiată de 0, puteți concluziona că punctele de date pot fi independente. Astfel, creșterea unei valori poate sau nu poate duce la o creștere a celeilalte. Cei doi termeni sunt legați aproape în mod aleatoriu.
    • De exemplu, să presupunem că comparați dimensiunile încălțămintei cu notele colegiului. Deoarece există mai mulți factori care afectează clasele colegiilor, este firesc să se aștepte la o covarianță apropiată de 0. Aceasta ar indica faptul că nu există nici o legătură practică între cele două valori.
  • Imaginea intitulată Calculate Covariance Step 27
    4
    Vizualizați grafic relația. Pentru a înțelege vizual covarianța, puteți introduce punctele de date în planul cartezian. Apoi va fi ușor de văzut că punctele, cu toate că nu urmează exact o linie dreaptă, tind să formeze un grup care să se apropie de o linie diagonală merge din stânga sus în colțul din dreapta jos. Aceasta este descrierea unei covarianțe negative. De asemenea, rețineți că valoarea covarianței finale este -8.07, un număr relativ mare în comparație cu punctele de date. Valoarea ridicată sugerează că covarianța este puternic, care poate fi văzută de aspectul liniar de puncte de date.
  • sfaturi

    Surse și cotatii

    Aflați mai multe ... (17)
    Distribuiți pe rețelele sociale:

    înrudit
    » » Cum se calculează Covariance
    © 2021 itholoinfo.com.com