

Som en allmän regel är signifikansnivån (eller alfa) ofta satt till 0,05, vilket betyder att sannolikheten för att av misstag observera skillnaderna i dina data bara är 5 %. En högre konfidensnivå (och därmed ett lägre p-värde) gör att resultaten är mer signifikanta. Om du vill att data ska vara mer tillförlitliga, ställ in p-värdet under 0,01. Lägre p-värden används ofta inom industrin vid felsökning av produkter. Det är väldigt viktigt att kunna ha stort förtroende för att varje del fungerar precis som den ska. För de flesta experiment mot en hypotes är en signifikansnivå på 0,05 acceptabel. 
Om du inte är säker på om din data ligger över eller under kontrollgruppen, använd ett tvådelat test. Låter dig testa för signifikans i båda riktningarna. Om du vet i vilken riktning din data tenderar att röra sig, använd ett ensidigt test. I exemplet som ges förväntar du dig att elevernas betyg förbättras; det är därför du använder ett ensidigt test. 
Forskare gör vanligtvis en liten pilotstudie för att informera om sin styrkaanalys och för att bestämma provstorleken som behövs för en större, mer omfattande studie. Om du inte har resurser för att göra en komplex pilotstudie, gör några uppskattningar av möjliga medelvärden baserat på att läsa litteraturen och de studier som andra individer kan ha gjort. Detta ger dig en bra utgångspunkt för provstorleken till att börja med. 

Till exempel, för att hitta medelbetyget för gruppen som läste materialet före lektionen, låt oss titta på några data. För enkelhetens skull använder vi en datamängd med 5 punkter: 90, 91, 85, 83 och 94. Lägg ihop alla data: 90 + 91 + 85 + 83 + 94 = 443. Dividera summan med antalet data, N = 5:443 / 5 = 88,6. Medelbetyget för denna grupp är 88,6. 
(90 – 88,6), (91–88,6), (85–88,6), (83–88,6) och (94–88,6). De beräknade siffrorna är nu 1,4, 2,4, -3,6, -5,6 och 5,4. 
I vårt exempel arbetar vi nu med 1.96 5.76, 12.96, 31.36 och 29.16. Att lägga ihop dessa rutor ger: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2. 
Subtrahera: N – 1 = 5 – 1 = 4 Del: 81,2/4 = 20,3 
I vårt exempel är standardavvikelsen för slutbetygen för elever som läst materialet före lektionen: s = √20,3 = 4,51. 

µ1 är genomsnittet för den första gruppen. µ2 är medelvärdet för den andra gruppen. sd är variansen mellan proverna. Använd det större medelvärdet som µ1, så att du inte har ett negativt värde för t. I vårt exempel, låt oss säga att urvalets medelvärde för grupp 2 (de som inte läste) var 80. t-poängen är då: t = (µ1 – µ2)/sd = (88,6 – 80)/3,29 = 2,61. 

med 8 d.f. och ett t-värde på 2,61 faller p-värdet för ett ensidigt test mellan 0,01 och 0,025. Eftersom vår inställda signifikansnivå är mindre än eller lika med 0,05 är vår data statistiskt signifikant. Med dessa data förkastar vi nollhypotesen och accepterar den alternativa hypotesen: Elever som läser materialet innan klass får bättre slutbetyg. 
Bedöm statistisk signifikans
Hypotestestning stöds av statistisk analys. Statistisk signifikans beräknas från ett p-värde, som indikerar sannolikheten för det observerade resultatet, givet att en viss sats (nollhypotesen) är uppfylld. Om detta p-värde är mindre än den angivna signifikansnivån (vanligtvis 0,05), så kan försöksledaren anta att nollhypotesen är falsk och acceptera den alternativa hypotesen. Med ett enkelt t-test kan du beräkna ett p-värde och jämföra signifikansen mellan två olika grupper av en datamängd.
Steg
Del 1 av 3: Konfigurera ditt experiment

1. Definiera din hypotes. Det första steget i att bedöma statistisk signifikans är att definiera frågan som ska besvaras och ställa din hypotes. Hypotesen är ett påstående om dina experimentella data och de skillnader som kan finnas i populationen. I varje experiment finns både en noll- och en alternativ hypotes. I allmänhet kommer du att jämföra två grupper för att se om de är lika eller olika.
- Nollhypotesen (H0) anger generellt att det inte finns någon skillnad mellan dina två uppsättningar data. Till exempel: elever som har läst materialet före lektionen får inte bättre slutbetyg.
- Den alternativa hypotesen (Ha) är motsatsen till nollhypotesen och är påståendet du försöker stödja med dina experimentella data. Till exempel: elever som har läst materialet innan klass uppnår bättre slutbetyg.

2. Ställ in signifikansnivån för att avgöra hur ovanlig din data måste vara innan den kan anses vara betydande. Signifikansnivån (även kallad alfa) är den tröskel du ställer in för att bestämma signifikans. Om p-värdet är mindre än eller lika med den inställda signifikansnivån kan uppgifterna anses vara statistiskt signifikanta.

3. Bestäm dig för att använda ett ensidigt eller tvåsidigt test. Ett av antagandena ett t-test gör är att data är normalfördelad. En normalfördelning av data bildar en klockkurva där de flesta testdata faller i mitten. t-testet är ett matematiskt test för att se om data faller utanför normalfördelningen (över eller under), i kurvans "svansar".

4. Bestäm provstorleken med en kraftanalys. Kraften i ett test är sannolikheten att det förväntade resultatet kommer att observeras, givet en specifik urvalsstorlek. Den gemensamma tröskeln för kraft (eller β) är 80 %. En effektanalys kan bli lite knepig utan några preliminära data eftersom du behöver lite information om de förväntade mellanvärdena mellan varje grupp och deras standardavvikelser. Använd en online-kraftanalysräknare för att bestämma den optimala provstorleken för dina data.
Del 2 av 3: Beräkna standardavvikelsen

1. Hitta formeln för standardavvikelsen. Standardavvikelsen är ett mått på spridningen av dina data. Den ger dig information om hur lika varje datapunkt i ditt prov är. Vid första anblicken kan ekvationen verka lite komplicerad, men följande steg kommer att leda dig genom beräkningen. Formeln är: s = √∑((xi – µ)/(N – 1)).
- s är standardavvikelsen.
- ∑ indikerar att du måste lägga ihop alla insamlade provvärden.
- Xi representerar varje enskilt värde av din data.
- µ är medelvärdet (eller mitten) av dina data för varje grupp.
- N är summan av provet.

2. Genomsnittet av testdata i varje grupp. För att beräkna standardavvikelsen måste du först medelvärde testdata i de enskilda grupperna. Medelvärdet betecknas med den grekiska bokstaven mu eller µ. För att göra detta lägger du ihop varje datastycke och dividerar det sedan med det totala antalet data.

3. Subtrahera varje måttenhet från medelvärdet. Nästa del av beräkningen inkluderar delen (xi – µ) av ekvationen. Du subtraherar varje data från det just beräknade genomsnittet. I vårt exempel får du fem subtraktioner.

4. Kvadra vart och ett av dessa tal och addera dem tillsammans. Vart och ett av de nya talen du just beräknat kommer nu att kvadreras. Detta steg skapar också negativa tecken. Om du har ett minustecken efter detta steg eller i slutet av din beräkning kan du ha glömt detta steg.

5. Dela detta med storleken på det totala urvalet, minus 1. Formeln dividerar med N-1, eftersom den korrigerar för det faktum att du inte har räknat en hel population ännu; du tar ett urval från populationen av alla elever för att göra en uppskattning.

6. Ta kvadratroten. När du har dividerat med antalet data minus ett, beräkna kvadratroten av detta sista tal. Detta är det sista steget i beräkningen av standardavvikelsen. Det finns statistiska program som kan göra denna beräkning åt dig, efter att ha angett rådata.
Del 3 av 3: Bestäm signifikansen

1. Beräkna skillnaden mellan dina två grupper av provet. Hittills har exemplet bara täckt en av urvalsgrupperna. Om du vill jämföra två grupper har du givetvis data från båda grupperna. Beräkna standardavvikelsen för den andra gruppen av testdata och använd den för att beräkna skillnaden mellan de två experimentella grupperna. Formeln för varians är sd = √((s1/N1) + (s2/N2)).
- sd är skillnaden mellan dina grupper.
- s1 är standardavvikelsen för grupp 1 och N1 är urvalsstorleken för grupp 1.
- s2 är standardavvikelsen för grupp 2 och N2 är urvalsstorleken för grupp 2.
- För vårt exempels skull, låt oss säga att data från grupp 2 (elever som inte hade läst före lektionen) hade en urvalsstorlek på 5 och en standardavvikelse på 5,81. Variansen är:
- sd = √((s1)/N1) + ((s2)/N2))
- sd = √(((4,51)/5) + ((5,81)/5)) = √((20,34/5) + (33,76/5)) = √(4,07 + 6,75) = √10,82 = 3,29.

2. Beräkna t-poängen för din data. Med en t-score kan du konvertera data till en form som du kan jämföra med andra data. Med t-poäng kan du utföra ett t-test, för att beräkna sannolikheten att två grupper skiljer sig signifikant från varandra. Formeln för en t-poäng är: t = (µ1 – µ2)/sd.

3. Bestäm graden av frihet för ditt prov. När man använder t-poängen bestäms frihetsgraderna med hjälp av urvalsstorleken. Lägg ihop antalet testdata från varje grupp och dividera sedan med två. I vårt exempel, graderna av frihet; d.f.) 8, eftersom det fanns fem data i den första gruppen och fem i den andra gruppen ((5 + 5) – 2 = 8).

4. Använd en t-tabell för att bedöma betydelsen. En tabell med t-poäng och antalet frihetsgrader finns i en vanlig statistikbok eller online. Titta på raden med frihetsgrader för dina data och hitta p-värdet som motsvarar ditt t-poäng.

5. Överväg en uppföljande studie. Många forskare gör en liten pilotstudie med några få mätningar för att förstå hur man lägger upp en större studie. En annan studie, med fler mätningar, kommer att bidra till att öka ditt förtroende för din slutsats.
Tips
- Statistik är ett omfattande och komplicerat område. Ta en gymnasie- eller högre utbildningsklass om statistisk slutledning för att bättre förstå statistisk signifikans.
Varningar
- Denna analys är specifik för ett t-test för att testa skillnaderna mellan två normalfördelade populationer. Du kan behöva ett annat statistiskt test beroende på hur komplex din datainsamling är.
"Bedöm statistisk signifikans"
Оцените, пожалуйста статью