1. UtdanningMatstatistikk Skaper et tillitsintervall for forskjellen mellom to virkemidler med kjente standardavvik
Statistics For Dummies, 2. utgave

Av Deborah J. Rumsey

Hvis du kjenner standardavvikene for to populasjonsprøver, kan du finne et konfidensintervall (CI) for forskjellen mellom deres middel, eller gjennomsnitt. Målet med mange statistiske undersøkelser og studier er å sammenligne to populasjoner, for eksempel menn versus kvinner, familier med lav inntekt og høyinntekt og republikanere kontra demokrater. Når karakteristikken som sammenlignes er numerisk (for eksempel høyde, vekt eller inntekt), er interessen gjenstand for forskjellen i middel (gjennomsnitt) for de to populasjonene.

For eksempel kan det være lurt å sammenligne forskjellen i gjennomsnittsalder for republikanere kontra demokratene, eller forskjellen i gjennomsnittlig inntekt for menn kontra kvinner. Du estimerer forskjellen mellom to populasjonsmidler,

image0.png

ved å ta en prøve fra hver populasjon (si prøve 1 og prøve 2) og bruke forskjellen til de to utvalgsmidlene

image1.png

pluss eller minus en feilmargin. Resultatet er et konfidensintervall for forskjellen mellom to populasjonsmidler,

image2.png

Hvis begge populasjonsstandardavvikene er kjent, er formelen for en CI for forskjellen mellom to populasjonsmidler (gjennomsnitt)

image3.png

er gjennomsnittet og størrelsen på den første prøven, og den første populasjonens standardavvik,

image4.png

er gitt (kjent);

image5.png

og n2 er gjennomsnittet og størrelsen på den andre prøven, og den andre befolkningens standardavvik,

image6.png

er gitt (kjent). Her er z * riktig verdi fra standard normalfordeling for ønsket konfidensnivå. (Se tabellen nedenfor for verdier av z * for visse konfidensnivåer.)

Gjør følgende for å beregne en CI for forskjellen mellom to populasjonsmidler med kjente standardavvik:

image7.png

Anta at du med 95% tillit vil estimere forskjellen mellom den gjennomsnittlige (gjennomsnittlige) lengden på kullene til to varianter av søt mais (slik at de kan vokse samme antall dager under de samme forholdene). Kall de to variantene Corn-e-stats og Stats-o-sweet. Anta ved tidligere undersøkelser at populasjonsstandardavvikene for Corn-e-stats og Stats-o-sweet er henholdsvis 0,35 inches og 0,45 inches.

image15.png

Fristelsen er å si: ”Vel, jeg visste at korn-e-stats korn var lengre fordi dets gjennomsnittsverdi var 8,5 tommer og Stat-o-søt var bare 7,5 tommer i gjennomsnitt. Hvorfor trenger jeg til og med et konfidensintervall? ”Alle disse to tallene forteller deg er noe med de 210 ørene til mais som ble tatt ut. Du må også faktorere i variasjon ved å bruke feilmarginen for å kunne si noe om hele kornpopulasjonene.

Legg merke til at du kan få en negativ verdi for

image19.png

Hvis du for eksempel hadde byttet de to kornsortene, ville du fått –1 for denne forskjellen. Du vil si at Stats-o-sweet i gjennomsnitt var en tomme kortere enn Corn-e-stats i utvalget (den samme konklusjonen uttalte annerledes).

Hvis du vil unngå negative verdier for forskjellen i utvalgsmidler, må du alltid gjøre at gruppen med større utvalg betyr den første gruppen - alle forskjellene dine vil være positive.

Men selv om gruppen med større utvalgsmiddel fungerer som den første gruppen, vil du noen ganger fortsatt få negative verdier i konfidensintervallet. Anta i eksemplet over at utvalgsverdien av Corn-e-stats var 7,6 tommer. Dermed er forskjellen i prøveinnretningen 0,1, og den øvre enden av konfidensintervallet er 0,1 + 0,1085 = 0,2085, mens den nedre ende er 0,1 - 0,1085 = –0,0085. Dette betyr at den sanne forskjellen er rimelig hvor som helst fra Corn-e-stats er så mye som 0,205 inches lenger til Stat-o-sweet er 0,0085 inches lenger. Det er for nær å si sikkert hvilken variasjon som er lengre i gjennomsnitt.