Statistika v praxi aneb úvod do výběrových šetření

statistika_v_praxi_logoZačátek měsíce května se opět ponese ve znamení aktuálního výzkumu poslechovosti RadioProjekt. Ačkoli je zatím za námi teprve první polovina měsíce, jistým způsobem se budeme věnovat výzkumům už nyní. Často objevují hlasy, že průzkumy nemohou být pravdivé, protože se agentury neptají všech posluchačů, proto přinášíme vám první díl volného seriálu přibližující problematiku tvorby průzkumů.

Cílem volného cyklu článků o problematice výběrových šetření není podrobně vysvětlit, jak se průzkumy a výběrové studie provádí, ale laicky vysvětlit některé aspekty. Rádi bychom vám alespoň nastínili některé okolnosti s průzkumy spojené. Doufáme, že vám aspoň částečně osvětlíme, jak je možné, že stačí vybírat jen vzorek z celé populace. První úvodní díl vás seznámí se samotnými základy předmětu výběrových šetření a přineseme i něco málo z historie. Máte-li jakékoli dotazy, samozřejmě je velmi rádi zodpovíme. Děkujeme za případné návrhy a připomínky.

První počátky výběrových šetření sčítali počty vojáků

Jedna z prvních zmínek o výběrových metodách se objevuje v evropské knize „The Histories“ okolo roku 440 před naším letopočtem. Autor Herodotus popisuje metody, které používal perský král, aby odhadnul počty vojáků během řecké invaze. Tyto odhady prováděl tak, že vybrané jednotky vojáků dostaly rozkazy, aby se držely co nejblíže u sebe. Prostor, v němž se nacházeli, byl následně oplocen. Celkový počet jednotek byl vynásoben počtem vojáků v jedné vybrané skupině a tím král získal odhad počtu vojáků.

SOUSISEJÍCÍ: KOMPLETNÍ VÝSLEDKY A ANALÝZY K RADIOPROJEKTU

Je jasné, že nebyly uskutečněny žádné přesné odhady ani přípravy na vlastní výběr. Přesto se jedná o jistou podobnost s aktuální situací. Historikové věří, že číslo 1,7 milionu bylo značně nadhodnoceno, jedním z důvodů je fakt, že v té době neexistovaly přesné a jednotné velikosti populací a armád v té době.

Toto místo je, zdá se, vhodné pro Xerxa k pozorování a sčítání jeho vojska (…) Jaký byl přesný počet žoldnéřů z každého státu, nemohu říci přesně (…) ale bylo shledáno, že celkový počet vojáků lze stanovit na jeden milion a sedm set tisíc mužů. Vše probíhalo následovně. Bylo přivezeno deset tisíc těl na určité místo a muži museli stát tak blízko u sebe, jak jen to bylo možné. Následně kolem nich namalovali kruh a mohli odejít,“ uvádí Herodotus.

statistika_v_praxi_zdroj

A citace z překladu knihy „The Histories od Herodotus, Book VII„, kterou napsal George Rawlingson, pokračuje: „Na místě kruhu byl vztyčen plot zhruba do výše pasu jednoho muže. Do tohoto prostoru byli následně přiváženi další a další muži, dokud touto procedurou neprošla celá armáda. Když bylo sčítání dokončeno, byly vypracovány počty pro několik národů.“

Troška z moderní historie

Mnoho ze dnešních specifických výběrových návrhů a odhadů se vyvinulo až v průběhu 20. století. Počátkem minulého století se vedly debaty, jak správně vést výběrová šetření. Základní metody prostého náhodné výběru vznikaly v prvních dvou dekádách století. Výběry prvků s nestejnými pravděpodobnostmi se začali matematikové zabývat dokonce až na přelomu 40. a 50. let minulého století.

statistika_v_praxi_banner_003

Co výběrová šetření vlastně jsou?

Jak už název napovídá, při výběrových šetření zvolíme nějakou část z celkové populace (nemusí se jednat přímo o lidskou populaci, ale obecně soubor všech pozorovaných jednotek, jak se dozvíte dále) a na základě vzorku odhadne informaci platnou pro celou zkoumanou populaci. Případy, které vás jako čtenáře mediálního internetového magazínu zajisté nejvíce zajímají situace, kdy se zkoumá názor části populace, jenž je následně generalizován pro celou Českou republiku.

V praxi se ovšem podobným způsobem zkoumají i další oblasti. Například množství lišejníku coby potrava pro soby na Aljašce se studuje ve vybrané oblasti a následně se určí výskyt v celém regionu. Ve zdravotnictví se obdobným způsobem zkoumá rozšíření vzácných nemocí. Nejinak je tomu při hledání nalezišť ropy, před zahájením těžby se vyvrtá pár zkušebních vrtů.

S výše nastíněným logicky souvisí několik otázek. Jak nejlépe zvolit výběr a jak udělat vlastní pozorování zkoumané populace? A co dělat ve chvíli, kdy máme data? Jak odhadnout charakteristiky vztahující se na celou populaci? Výzkumný pracovník tak musí zvážit, jak velký mít vzorek (příliš rozsáhlý může vést k neúměrným nákladům). Základním faktem, který je třeba mít na paměti, že dotazníky nesmí obsahovat návodné otázky (tedy nebádající respondenta k určité odpovědi).

statistika_v_praxi_banner_001

Základní idea výběru a odhadu

Návrh výběrového šetření musí být velmi dobře proveden, každému sledovanému subjektu z dané populace je dána pravděpodobnost, s níž bude do výzkumu zahrnut (ta musí například odpovídat podílu vysokoškolsky vzdělaným lidem v celé republice). Dbát se musí tedy velký zřetel na reprezentativní vzorek.

V našem případě se zaobíráme pouze jednotkami, jejichž celková populace je konečná. Na první pohled by se mohlo zdát, že získat seznam jednotek (tedy lidí v průzkumech) je velmi jednoduchý. Například telefonní seznamy ovšem neinformují o lidech bez pevných linek, který je aktuálně drtivá většina. Toto hledisko tak skýtá další velký problém.

Jakých chyb se můžeme dopustit?

Základní metoda výběru předpokládá, že zkoumanou veličinu získáme od jednotky bez zatížení chybou a jediná chyba, která vzniká, se nazývá výběrová. Ta nastává proto, že ve vzorku nejsou zahrnuty všechny jednotky populace, proto se konstruují dodatečné statistické nástroje jako intervaly spolehlivosti a jiné. V praxi je ovšem situace zcela jiná a nastat mohou právě i „nevýběrové“ chyby. Někteří lidé zahrnutí do výběru například nebudou doma, pokud jim někdo volá, nebo mohou odmítnout se projektu účastnit. Právě takovéto přístupy ovšem nemusí být typické pro danou skupinu, což může vést k tomu, že zkoumaný vzorek nebude reprezentativní.

statistika_v_praxi_banner_002

Problém s lidmi neochotnými lidmi se samozřejmě předpokládá a ve studii je mu přiřazena nízká váha relevance. Na druhou stranu nesmíme situace zcela ignorovat. Dalším možným řešením je provést dodatečné úsilí, tím je na mysli rozumné použití pomocné nebo dodatečné informace, jež je známá jak od lidí odpovídajících, tak i těch, kteří neodpověděli. Nejlepší radou je samozřejmě mít podíl neodpovídajících co nejnižší.

Zdroj: Thompson, Steven K., Sampling (Second Edition), Pensylvania State University: A Wiley-Interscience Publications, 2002.

Výhledově připravujeme druhý díl tohoto volného cyklu, v němž už vás budeme seznamovat s jistými metodami a aspekty problematiky spojené s výběrovými šetřeními.

Autor článku:

Napsat komentář

Pro přidání komentáře musíte .