God Survey Research Design søger at reducere prøveudtagningsfejl
Hvad er et tillidsinterval?
Et konfidensinterval er den fejlmargin, en forsker ville opleve, hvis han eller hun kunne stille et bestemt spørgsmålet om spørgsmålet om hvert medlem af målpopulationen og modtage det samme svar, som medlemmerne af prøven gav i undersøgelsen.
For eksempel, hvis forskeren brugte et konfidensinterval på 4 og 60% af deltagerne i undersøgelsesprøven svarede "Ville anbefale til venner", kunne han være sikker på, at mellem 54% og 64% af medlemmerne af hele målpopulationen ville også sige "ville anbefale til venner" når du stillede det samme spørgsmål. Tillidsintervallet er i dette tilfælde +/- 4.
Hvad er et tillidsniveau?
Et tillidsniveau er et udtryk for, hvor sikker en forsker kan være af dataene fra en prøve. Tillidsniveauet udtrykkes som en procentdel og angiver, hvor ofte den procentdel af målpopulationen vil give et svar, der ligger inden for konfidensintervallet. Det mest almindelige konfidensniveau er 95%. Et beslægtet koncept kaldes statistisk betydning.
En forskers tillid til sandsynligheden for, at hans prøve er virkelig repræsentativ for målpopulationen, påvirkes af en række faktorer.
En forskers tillid til deres studieudformning og implementering - og en bevidsthed om dens begrænsninger - er i vid udstrækning baseret på tre vigtige variabler: Prøveformat, reaktionsfrekvens og befolkningsstørrelse. Forskere har længe aftalt, at disse variabler skal overvejes nøje under forskningsplanlægningsfasen.
- Eksempelstørrelse Generelt giver større prøver data, der virkelig afspejler målpopulationen. Et bredt konfidensinterval er tegn på mindre tillid til dataene, fordi der er en større fejlmargin . Et bredt konfidensinterval er som at afdække dine indsatser. Selvom der er et forhold mellem konfidensinterval og stikstørrelse, er det ikke et lineært forhold . En forsker kan ikke skære et konfidensniveau i halvt ved at fordoble prøvestørrelsen.
- Reaktionsfrekvens Nøjagtigheden af, hvilke prøvedata der afspejler målpopulationen, afhænger også af den procentdel af respondenterne, som gav et bestemt svar eller svarede på en bestemt måde . Jo større antallet af respondenter, der gav et bestemt svar, siger "Meget glad", jo mere sikker kan forskeren være af det svar. Der vil være en vis variabilitet i procentdelen i de midterste områder af den normale kurve. Det vil sige, hvis en forsker er 50% sikker på, at medlemmer af målpopulationerne vil reagere (inden for et konfidensinterval) som medlemmer af prøvepopulationen, er der sandsynligvis en vis variation fra det 50% niveau.
Det er godt at huske, at outliers (data, der ligger i den fjerne ende eller haler) af den normale kurve, er mere tilbøjelige til at forekomme i omtrent samme grad i befolkningen som de gør i en prøve - der er mindre variabilitet her , fordi der er lavere frekvens . (Overvej hvordan ballerne i en Galton Box har tendens til at stable sig i midten ved Pacific Science Center udstilling? Kun et par kugler hopper ud i halerne.) Derfor er det lettere at være sikker på hyppigheden af ekstreme svar .
- Befolkning Størrelse er ikke en vigtig faktor i stikprøve størrelse, medmindre en forsker arbejder med en befolkning, der er meget lille og kendt for ham eller hende (fx lille nok til at alle befolkningsgrupper kan identificeres af forskeren).
Creative Research Systems påpeger, at:
Matricen af sandsynlighed viser, at befolkningens størrelse er irrelevant, medmindre prøvenes størrelse overstiger et par procent af den samlede befolkning, du undersøger. Det betyder, at en stikprøve på 500 mennesker er lige så nyttig til at undersøge udtalelser fra en stat på 15.000.000, da det ville være en by på 100.000.
Generering af en repræsentativ prøve kan være en dyr og tidskrævende proces. Forskere står altid over for et kompromis mellem det konfidensniveau, de gerne vil opnå - eller graden af nøjagtighed, de har brug for at nå - og det tillidsniveau, de har råd til.
Eksempelstørrelse i kvalitative undersøgelser
Kvalitativ forskning er sonderende eller beskrivende karakter og fokuserer ikke på tal eller måling. Men bekymringer om prøveudtagningsfejl i kvalitative undersøgelser er stadig gyldige. Som en generel regel, hvis en prøve er repræsentativ for måluniverset, vil de temaer eller mønstre, der kommer ud af forskningen, afspejle den større befolkning, der er af interesse for forskeren. Hvis prøven er repræsentativ og består af en stor procentdel af målpopulationen, vil tilliden til nøjagtigheden af data afledt af denne prøve have tendens til at være høj.
Bestemmelse af stikprøvestørrelse i undersøgelser
Forskellige regler gælder for kvantitativ forskning og kvalitativ forskning, når det gælder bestemmelse af stikprøvestørrelse. For at være sikker på dataene fra kvalitativ undersøgelsesforskning skal en forsker generelt have en klar ide om, hvordan dataene skal bruges. Dataene kan danne grundlag for en beskrivende fortælling (som i en casestudie eller nogle etnografisk forskning), eller det kan på en udforskende måde tjene til at identificere relevante variabler, der senere kan testes for korrelationer i et kvantitativt studie.
Eksempelstørrelse i kvantitativ undersøgelse
Kvantitativ forskning involverer ofte sammenligninger mellem markedssegmenter eller undergrupper af et målmarked. Fordi kvantitativ forskning er taledrevet, kan det være ret nemt at bestemme en behagelig prøvestørrelse. For hver vigtig gruppe eller et segment i en undersøgelse ville en forsker håbe at undersøge 100 deltagere. Dette nummer er en anbefaling og ikke en absolut. En markedsforsker vil overveje en række relevante variabler til at bestemme størrelsen på en prøve i undersøgelser af undersøgelser.
Når man gennemfører undersøgelser af markedsundersøgelser, er målet at udlede fra stikprøven, hvad der sandsynligvis vil være sandt for måluniverset. En prøve indeholder data, der kan observeres eller kendes. Ud fra denne observerede eller kendte data kan en forsker estimere graden til hvilken en ukendt værdi eller parameter kan findes i en målpopulation.
Kvantitativ undersøgelse er baseret på begrebet en normal symmetrisk kurve, der i forskerens øjne repræsenterer måluniverset - den befolkning, som forskeren skal estimere i stedet for faktisk kende parametre. En repræsentativ prøve giver en forsker mulighed for at beregne - fra prøvedataene - et estimeret interval af værdier , der sandsynligvis vil inkludere den ukendte værdi eller parameter, der er af interesse. Dette estimerede værdighedsområde repræsenterer et område på den normale kurve og udtrykkes generelt som en decimal eller en procentdel.
Den normale kurve og sandsynlighed
En normal symmetrisk kurve er et visuelt udtryk for sandsynlighed. Lad os se på en simpel heuristisk: En aktivitet på et videnskabscenter gør det muligt for et stort antal bolde at falde mellem to akrylplader, en ad gangen. Hver bold falder gennem samme åbning øverst på skærmen og dråber derefter mellem nogen af de vertikale, parallelle skillelinjer, der adskiller stakken af bolde, når de kommer til hvile. Efter flere timer har kuglerne formet en normal kurve. Kurven ændrer sig lidt, da hver nyindført bold rammer massen af bolde, der ankom først. Men generelt er den symmetriske kurve tydelig, og den forekom naturligt uafhængig af enhver handling, som observatørerne eller personalet i Science Center har gjort. Den buede form, som kuglerne danner, afspejler sandsynligheden for, at de fleste bolde vil falde ind i midten og blive der. Færre bolde vil gøre det ind i kurvens yderste ender - nogle vil uundgåeligt, men de er få i antal.
Denne normale kurve svarer til konceptet for en prøve. Hver gang displayet tømmes ud og kuglerne igen får lov til at falde ind i Galton-boksen, vil konfigurationen af stablerne af bolde kun være en smule anderledes. Men over tid ændres kurvens form ikke meget, og mønsteret vil holde fast.