1
Determinați rezultatele așteptat de cercetare. De obicei, atunci când oamenii de știință efectuează un experiment și observă rezultatele, au o idee timpurie despre modul în care rezultatele
normal sau
specific va fi. Această predicție se bazează pe rezultatele cercetărilor anterioare, date statistice fiabile, literatură științifică și / sau alte surse. Pentru cercetarea dvs., determinați rezultatele așteptate și exprimați-le în cifre.
- Exemplu: Să presupunem că studiile anterioare au arătat cine, la nivel național, biletele de viteză sunt aplicate mai des mașinilor roșii decât mașinilor albastre. Să presupunem că media națională arată o preferință de 2: 1 pentru mașinile roșii. Am analizat amenzile aplicate în orașul nostru pentru a afla dacă poliția locală arată de asemenea această tendință. Dacă luăm un grup aleatoriu de 150 de bilete de viteză, aplicat pentru mașinile roșii și albastre în orașul nostru, va trebui să așteptăm acest total 100 fie pentru mașini roșii sau 50 pentru autoturismele albastre, dacă patrulele locale urmează tendința națională de a aplica amenzi.
2
Determinați rezultatele observate de cercetare. Acum că ați determinat valorile așteptate, puteți efectua căutarea și puteți găsi valorile reale (sau "observate"). Din nou, exprimați aceste rezultate sub formă de numere. Dacă manipulăm o condiție experimentală și rezultatele observate sunt
diferit din aceste rezultate așteptate, pot apărea două posibilități: faptele s-au întâmplat din întâmplare sau manipularea variabilelor experimentale
cauzate diferența. Obiectivul de a găsi o valoare p este, în principiu determina dacă rezultatele observate diferă de rezultatele așteptate, astfel încât „nul“ - ipoteza că nu există nici o relație între (i) variabila (e) găsit (e) și rezultatele observate - este puțin probabil să fie respinsă.
- Exemplu: Să presupunem că, în orașul nostru, am selectat aleatoriu 150 de amenzi aplicate mașinilor roșii și albastre. Am găsit asta 90 amenzile au fost aplicate la roșu și 60pentru mașini albastre. Aceste valori au fost diferite de rezultatele noastre așteptate 100 și 50, respectiv. Manipularea noastră experimentală (în acest caz, schimbarea sursei datelor noastre de la o acoperire națională la o acoperire regională) a provocat această schimbare a rezultatelor, sau patrularea locală părtinitor cât de mult sugerează media națională și astfel observăm doar o schimbare în schimbare? O valoare p ne va ajuta să răspundem la aceste întrebări.
3
Determinați gradul de libertate de cercetare. Acești factori sunt obținuți prin măsurarea variației implicate în sondaj, care este determinată de numărul de categorii pe care le evaluați. Ecuația pentru gradele de libertate este
Gradul de libertate = n-1, unde
n este numărul de categorii sau variabile care sunt analizate în căutarea dvs.
- Exemplu: Experimentul nostru are două categorii de rezultate: unul pentru mașini roșii și unul pentru mașini albastre. Astfel, în cercetarea noastră avem 2-1 = 1 grad de libertate. Dacă am fi făcut o comparație între mașinile roșii, albastre și verzi pe care le-am avea 2 grade de libertate și așa mai departe.
4
Comparați rezultatele așteptate în raport cu rezultatele observate cu Chi-pătrat. Chi-pătratul (scris "x
2") este o valoare numerică care măsoară diferența dintre valori
așteptat și
observate a unui sondaj. Ecuația pentru chi-square este:
x2 = Σ ((o-e)2/ e), unde "o" este valoarea observată și "e" este valoarea așteptată. Calculați rezultatele acestei ecuații pentru toate rezultatele posibile (vedeți mai jos).
- Rețineți că această ecuație include un operator Σ (Sigma). Cu alte cuvinte, trebuie să calculați ((| o-e | -, 05)2/ e) pentru fiecare rezultat posibil și apoi suma rezultatelor pentru a obține valoarea chi-pătrat. În exemplul nostru, avem două rezultate - mașinile care au primit amenda sunt roșii sau albastre. Astfel, ar trebui să calculam ((o-e)2/ e) de două ori - una pentru autovehicule roșii și una pentru mașini albastre.
- Exemplu: Să integram valorile așteptate și observate în ecuația x2 = Σ ((o-e)2/ e). Rețineți că, datorită operatorului sigma, trebuie să efectuăm ecuația ((-e)2/ e) de două ori - una pentru autovehicule roșii și una pentru mașini albastre. Ecuația noastră ar fi:
- x2 = ((90-100)2/ 100) + (60-50)2/ 50)
- x2 = ((-10)2/ 100) + (10)2/ 50)
- x2 = (100/100) + (100/50) = 1 + 2 = 3 .
5
Alegeți unul nivelul de semnificație. Acum, când cunoaștem gradul de libertate a cercetării și valoarea chi-pătratului, nu trebuie decât să facem un ultim lucru înainte de a găsi valoarea p - trebuie să definim nivelul de semnificație. Practic, nivelul de semnificație este o măsură a gradului de certitudine că dorim să avem rezultatele noastre - valori scăzute de semnificație corespunde unei probabilități reduse ca rezultatele experimentale au avut loc întâmplător și vice-versa. nivelurile de semnificație sunt exprimate ca zecimale (cum ar fi 0,01), care corespunde procentului șansa rezultatelor experimentale au apărut la întâmplare (în acest caz, 1%).
- Prin convenție, oamenii de știință stabilesc de obicei valoarea de semnificație pentru cautările lor să fie de 0,05 sau 5 procente. Aceasta înseamnă că rezultatele experimentale care ating acest nivel de semnificație au o șansă de maxim 5% de a fi rezultatul simplei șanse. Cu alte cuvinte, există o șansă de 95% ca rezultatele să fie cauzate de cercetători care manipulează datele experimentale, în loc să fie cauzate de întâmplări. Pentru majoritatea studiilor, faptul că este sigur 95% cu privire la corelația dintre două variabile este considerată o demonstrație "de succes" a unei corelații între cele două variabile.
- Exemplu: Pentru exemplul mașinii roșii și albastre, vom urma convenția științifică și vom defini nivelul nostru de semnificație în 0,05.
6
Utilizați o tabelă de distribuție chi-pătrat pentru a aproxima valoarea noastră p. Oamenii de știință și statisticienii folosesc tabele mari de valori pentru a calcula valoarea p din cercetarea lor. Aceste tabele sunt de obicei setate cu axa verticală din partea stângă a mesei pentru a se potrivi cu gradele de libertate și axa orizontală din partea de sus a mesei pentru a se potrivi cu valoarea p. Puteți folosi aceste tabele mai întâi pentru a descoperi gradul lor de libertate și apoi citiți linia care traversează masa de la stânga la dreapta până când găsiți prima valoare
superior la valoarea lui chi-pătrat. Observați valoarea p corespunzătoare în partea de sus a coloanei - valoarea lui p va fi cea dintre valoarea respectivă și următoarea valoare superioară (cea imediat din stânga acesteia).
- Tabelele de distribuire chi-pătrat pot fi obținute din diverse surse - le puteți găsi cu ușurință făcând o căutare pe internet sau în științe sau cărți statistice. Dacă nu aveți mese, descărcați gratuit un șablon gratuit online.
- Exemplu: Chi-pătratul nostru a fost 3. Deci, să folosim tabela de distribuție chi-pătrat, ilustrată mai sus, pentru a găsi o valoare p aproximativă. După cum știm că numai experimentul nostru are 1 gradul de libertate, vom începe la cel mai înalt nivel. Să analizăm linia, pornind de la stânga la dreapta, până când vom găsi o valoare mai mare decât 3 - valoarea chi-pătratului. Prima valoare găsită este 3,84. Privind în partea de sus a acestei coloane, vedem că valoarea p corespunzătoare este de 0,05. Aceasta înseamnă că valoarea noastră p este între 0,05 și 0,1 (cea mai mare valoare p din tabel).
7
Decideți dacă veți respinge sau accepta ipoteza dvs. nulă. Deoarece ați găsit o valoare aproximată p pentru căutarea dvs., puteți respinge sau nu ipoteza nulă (amintiți-vă că aceasta este ipoteza că variabilele experimentale pe care le-ați manipulat
nu a afectat rezultatele observate). Dacă valoarea p a căutării dvs. este mai mică decât valoarea semnificației, felicitări - ați reușit să dovediți că este foarte probabil o corelație între variabilele pe care le-ați manipulat și rezultatele pe care le-ați observat. Dacă valoarea lui p este mai mare decât valoarea semnificației, nu este posibil să se spună cu certitudine că rezultatele observate au fost obținute prin sansa pură sau prin manipularea cercetării sale.
- Exemplu: Valoarea noastră p este între 0,05 și 0,1. Asta înseamnă că el nu este cu siguranță mai mică de 0,05, așa că, din nefericire, nu putem respinge ipoteza nulă. Asta înseamnă că nu am atins pragul minim de 95%, astfel încât putem susține că patrulatul nostru din oraș folosește bilete de trafic pentru mașinile roșii și albastre la o rată semnificativ diferită de media națională.
- Cu alte cuvinte, există 5-10% șanse ca rezultatele nu au fost observate o reflectare a schimbării locale analizate (cercetarea a fost făcută cu indici de trafic nostru oras, nu traficul de nivel național), spre deosebire de , rezultatele au avut loc întâmplător. Pe măsură ce căutam o șansă de mai puțin de 5%, nu putem spune că avem certitudine că patrulând orașul nostru este mai puțin părtinitor față de mașinile roșii - există o mică șansă semnificativă din punct de vedere statistic că nu va exista nici o prejudecată.