Invia.cz
Eurovíkendy
Kanárské ostrovy
Dominikánská republika
Madeira
Last minute
Vydělávejte peníze s INVIA.CZ
Testování statistických hypotéz umožňuje posoudit, zda experimentálně získaná data vyhovují předpokladu, který jsme před provedením testování učinili. Můžeme například posuzovat, zda platí předpoklad, že určitý lék je účinnější než jiný; nebo například, zda platí, že úroveň matematických dovedností žáků 9. tříd je nezávislá na pohlaví a na regionu.
Obsah |
Jako statistickou hypotézu chápeme určitý předpoklad o rozdělení náhodných veličin. Jestliže se tyto předpoklady týkají hodnot parametrů rozdělení náhodné veličiny, pak hovoříme o parametrických hypotézách. V opačném případě se jedná o hypotézy neparametrické.
Jsou-li hypotézou specifikovány všechny parametry rozdělení sledované veličiny, tzn. rozdělení je určeno jednoznačně, pak říkáme, že hypotéza je jednoduchá. Pokud není některý parametr rozdělení specifikován jednoznačně, např. je vymezen intervalem, pak hovoříme o složené hypotéze.
Při testování statistických hypotéz vždy porovnáváme dvě hypotézy. Jedna hypotéza, tzv. nulová (testovaná), je hypotéza, kterou testujeme. Značíme ji obvykle H0. Druhou hypotézou je tzv. alternativní hypotéza, kterou obvykle značíme H1.
Posuzování nulové hypotézy H0 je založeno na následující úvaze:
Výsledkem testu je rozhodnutí o nulové hypotéze. Přijetí hypotézy H0 znamená, že ji považujeme za možnou. Zamítnutí hypotézy H0 je ekvivalentní přijetí hypotézy H1. Testování hypotéz je tedy proces, při němž se na základě náhodného výběru rozhodneme pro testovanou nebo alternativní hypotézu.
Samotný postup testování hypotéz označujeme jako statistický test (test významnosti).
Testujeme-li neznámý parametr Θ pak testovanou (nulovou) hypotézu zapisujeme jako

Alternativní hypotézu pak formulujeme jedním z následujících způsobů




První formulaci alternativní hypotézy H1 používáme pouze v případě, kdy rozhodujeme mezi dvěma hodnotami Θ0 a Θ1. Další dva případy se používají tehdy, chceme-li dokázat, že odchylka od Θ je pouze v jednom směru. Alternativní hypotéza formulovaná posledním vztahem pouze popírá testovanou hypotézu H0.
K otestování nulové hypotézy H0 proti alternativní hypotéze H1 použijeme statistiku T, kterou označujeme jako testovací kritérium. Testovací kritérium je funkce náhodného výběru, která má vztah k nulové hypotéze, a jejíž rozdělení za předpokladu platnosti nulové hypotézy známe. Obor možných hodnot testovacího kritéria rozdělíme na dva neslučitelné obory. Jedním z nich je obor přijetí testované hypotézy
a druhým je kritický obor
. Pokud výběrová hodnota testovacího kritéria padne do oboru přijetí testované hypotézy, pak přijímáme nulovou hypotézu. Padne-li tato hodnota do kritického oboru, nulovou hypotézu zamítáme.
Kritický obor oddělují od oboru přijetí tzv. kritické hodnoty, což jsou kvantily rozdělení testovacího kritéria při platnosti H0.
Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami se pro rozhodování o nulové hypotéze používá též p-hodnota, zejména při použití statistického software. Význam p-hodnoty objasní následující postup.
, v němž jsou všechny takové hodnoty testovacího kritéria T, jež svědčí pro platnost H0 více než nebo stejně jako číslo t
, v němž jsou všechny takové hodnoty testovacího kritéria T, jež svědčí proti platnosti H0 více než číslo t
.P-hodnota tedy znamená, zjednodušeně řečeno, jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti H0, pokud by H0 opravdu platila. Čím menší p-hodnota, tím nepravděpodobnějšího výsledku (za předpokladu platnosti H0) bylo dosaženo.
Výhoda p-hodnoty je v tom, že její výpočet nezávisí na konkrétní volbě α. Není tak nutné znát kritické hodnoty pro různé volby α, p-hodnota obsahuje dostatečnou informaci sama o sobě.
Uvedený postup může také vést k chybnému zamítnutí testované hypotézy (tzv. chyba I. druhu) nebo k chybnému přijetí testované hypotézy (tzv. chyba II. druhu).
Pravděpodobnost chyby I. druhu je označována jako hladina významnosti testu.

Pravděpodobnost, že hodnota testovacího kritéria padne do oboru přijetí H0, jestliže platí H1, tzn. pravděpodobnost chyby II. druhu, je

Doplněk k β se nazývá síla testu (hovoříme také o silofunkci)

Při volbě testovacího postupu je naším cílem, aby chyby byly co nejmenší. Lze dokázat, že za daných podmínek vede snižování α k růstu β a naopak.
Při testování obvykle postupujeme tak, že nejdříve formulujeme nulovou a alternativní hypotézu. Poté volíme hladinu významnosti α (obvykle se volí α = 0,05 nebo α = 0,01). Nalezneme vhodné testovací kritérium a jeho pravděpodobnostní rozdělení při platnosti H0. Dále vymezíme kritický obor s ohledem na formulaci hypotézy H1. Vypočteme testovací kritérium T a určíme kritické hodnoty testovacího kritéria. Jestliže
, pak hypotézu H0 zamítáme a říkáme, že s pravděpodobností 1 − α platí hypotéza H1. Pokud
, pak hypotézu H1 považujeme za neprokázanou. V takové případě neprovádíme úsudek o platnosti H0, nechceme-li se zabývat sílou testu.