Anonim

Teorien bak p- verdier og nullhypotesen kan virke komplisert med det første, men å forstå konseptene vil hjelpe deg med å navigere i statistikkens verden. Dessverre blir disse begrepene ofte misbrukt i populærvitenskap, så det ville være nyttig for alle å forstå det grunnleggende.

Se også artikkelen vår Slik sletter du annenhver rad i Excel

Å beregne p- verdien til en modell og bevise / motbevise nullhypotesen er overraskende enkelt med MS Excel. Det er to måter å gjøre det på, og vi vil dekke begge. La oss grave oss inn.

Null hypotese og p- verdi

Nullhypotesen er en uttalelse, også referert til som en standardstilling, som hevder at forholdet mellom de observerte fenomenene ikke eksisterer. Det kan også brukes på assosiasjoner mellom to observerte grupper. Under forskningen tester du denne hypotesen og prøver å motbevise den.

Si for eksempel at du vil observere om et bestemt kjepphestdiett har betydelige resultater. Nullhypotesen, i dette tilfellet, er at det ikke er noen signifikant forskjell i testenes vekt før og etter slanking. Den alternative hypotesen er at kostholdet gjorde en forskjell. Dette er hva forskere vil prøve å bevise.

P- verdien representerer sjansen for at det statistiske sammendraget vil være lik eller større enn den observerte verdien når nullhypotesen er sann for en viss statistisk modell. Selv om det ofte uttrykkes som et desimaltall, er det generelt bedre å uttrykke det som en prosentandel. For eksempel skal p- verdien på 0, 1 være representert som 10%.

En lav p- verdi betyr at bevisene mot nullhypotesen er sterke. Dette betyr videre at dataene dine er betydelige. På den annen side betyr en høy p- verdi at det ikke er noen sterke bevis mot hypotesen. For å bevise at kjepphest-dietten fungerer, må forskere finne en lav p- verdi.

Et statistisk signifikant resultat er det som med stor sannsynlighet ikke vil skje hvis nullhypotesen er sann. Betydningsnivået er angitt med den greske bokstaven alfa, og det må være større enn p- verdien for at resultatet skal være statistisk signifikant.

Mange forskere i et bredt spekter av felt bruker p- verdien for å få en bedre og dypere innsikt i dataene de jobber med. Noen av de fremtredende feltene inkluderer sosiologi, strafferett, psykologi, finans og økonomi.

Finne p- Verdien i Excel

Du kan finne p- verdien til et datasett i MS Excel via T-Test-funksjonen eller ved å bruke dataanalyseverktøyet. Først skal vi se på T-Test-funksjonen. Vi skal undersøke fem studenter som gikk på 30 dager. Vi sammenligner vekten deres før og etter dietten.

MERKNAD: I denne artikkelen bruker vi MS Excel 2010. Selv om det ikke er den nyeste, bør trinnene også gjelde for de nyere versjonene.

T-testfunksjon

Følg disse trinnene for å beregne p- verdien med T-Test-funksjonen.

  1. Lag og fyll ut tabellen. Bordet vårt ser slik ut:

  2. Klikk på hvilken som helst celle utenfor bordet ditt.
  3. Skriv inn: = T.Test (.
  4. Skriv inn det første argumentet etter den åpne braketten. I dette eksemplet er det kolonnen Before Diet. Området skal være B2: B6. Så langt ser funksjonen slik ut: T.Test (B2: B6.
  5. Deretter legger vi inn det andre argumentet. Kolonnen After Diet og resultatene er vårt andre argument, og området vi trenger er C2: C6. La oss legge den til formelen: T.Test (B2: B6, C2: C6.
  6. Skriv inn et komma etter det andre argumentet, og fordelingen med en-tailed distribusjon og to-tailed vises automatisk i en rullegardinmeny. La oss velge den første - en-tailed distribusjonen. Dobbeltklikk på den.
  7. Skriv inn et annet komma.
  8. Dobbeltklikk på alternativet Par i den neste rullegardinmenyen.
  9. Nå som du har alle elementene du trenger, lukker du braketten. Formelen for dette eksemplet ser slik ut: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Trykk enter. Cellen vil vise p- verdien umiddelbart. I vårt tilfelle er verdien 0, 133906 eller 13, 3906%.

Ved å være høyere enn 5% gir ikke denne p- verdien sterke bevis mot nullhypotesen. I vårt eksempel viste ikke forskningen at slanking hjalp testpersonene med å miste en betydelig mengde vekt. Dette betyr ikke nødvendigvis at nullhypotesen er riktig, bare at den ikke har blitt motbevist ennå.

Data Analyserute

Dataanalyseverktøyet lar deg gjøre mange kule ting, inkludert beregninger av p- verdi. For å gjøre ting enklere bruker vi den samme tabellen som i forrige metode.

Slik gjør du det.

  1. Siden vi allerede har vektforskjellene i D-kolonnen, vil vi hoppe over forskjellsberegningen. For fremtidige tabeller bruker du denne formelen: = ”Cell 1” - “Cell 2”.
  2. Deretter klikker du på kategorien Data i hovedmenyen.
  3. Velg dataanalyseverktøyet.
  4. Bla nedover i listen og klikk på alternativet t-Test: Paired Two Sample for Means.
  5. Klikk OK.
  6. Et popup-vindu vises. Det ser slik ut:

  7. Skriv inn det første området / argumentet. I vårt eksempel er det B2: B6.
  8. Skriv inn det andre området / argumentet. I dette tilfellet er det C2: C6.
  9. La standardverdien ligge i tekstboksen Alpha (den er 0, 05).
  10. Klikk på alternativknappen Output Range og velg hvor du vil ha resultatet. Hvis det er A8-cellen, skriver du inn: $ A $ 8.
  11. Klikk OK.
  12. Excel vil beregne p- verdien og flere andre parametere. Finalebordet kan se slik ut:

Som du kan se, er p- verdien for en hale den samme som i første tilfelle - 0.133905569. Siden den er over 0, 05, gjelder nullhypotesen for denne tabellen, og bevisene mot den er svake.

Ting å vite om p- Verdien

Her er noen nyttige tips angående beregninger av p- verdi i Excel.

  1. Hvis p- verdien er lik 0, 05 (5%), er dataene i tabellen din betydelige. Hvis det er mindre enn 0, 05 (5%), er dataene du har svært betydningsfulle.
  2. I tilfelle p- verdien er mer enn 0, 1 (10%), er dataene i tabellen din ubetydelige. Hvis den er i området 0, 05-0, 10, har du marginalt signifikante data.
  3. Du kan endre alfaverdien, selv om de vanligste alternativene er 0, 05 (5%) og 0, 10 (10%).
  4. Det å velge to-tailed testing kan være det bedre valget, avhengig av hypotesen din. I eksemplet over betyr en-tailed testing at vi undersøker om testpersonene gikk ned i vekt etter slanking, og det er akkurat det vi trengte å finne ut. Men en to-tailed test ville også undersøke om de fikk statistisk signifikante mengder vekt.
  5. P- verdien kan ikke identifisere variabler. Med andre ord, hvis den identifiserer en korrelasjon, kan den ikke identifisere årsakene bak.

P- Verdien Demystified

Hver statistiker som er verdt saltet sitt, må kjenne inn og på outs for nullhypotesetesting og hva p- verdien betyr. Denne kunnskapen vil også komme til nytte for forskere på mange andre felt.

Har du noen gang brukt Excel til å beregne p- verdien til en statistisk modell? Hvilken metode brukte du? Foretrekker du en annen måte å beregne det på? Gi oss beskjed i kommentarfeltet.

Hvordan beregne p-verdi i excel