Jan Dohnal
(čt 14:30)
Jako pozorovanou veličinu pro svou semestrální práci jsem si vybral data Zdravotního Ústavu Kolín (pobočka Praha - Dittrichova ul.). Přesněji řečeno množství vykázaných výkonových bodů (hodnocených vyšetření) různým pojišťovnám. Očekával jsem, že naměřená data budou odpovídat rovnoměrnému rozdělení. Tuto hypotézu jsem chtěl ověřit χ2 testem dobré shody.
Data jsou uváděna v počtech bodů (každé vyšetření má řádově sta bodů) na pojišťovnu a měsíc.
období | pojišťovna | |
VZP (111) | OZP (207) | |
01/2005 | 1991819 | 342590 |
02/2005 | 1620269 | 322590 |
03/2005 | 1924960 | 366136 |
04/2005 | 2438867 | 466302 |
05/2005 | 1823340 | 338429 |
06/2005 | 2236411 | 411005 |
07/2005 | 1545631 | 320741 |
08/2005 | 1667797 | 300518 |
09/2005 | 2200211 | 432759 |
10/2005 | 2186744 | 467559 |
11/2005 | 2281666 | 471911 |
12/2005 | 1757539 | 363633 |
celkem (n): | 23675254 | 4604173 |
Pro použití χ2 testu dobré schody potřebujeme spočítat teoretické četnosti za jednotlivé měsíce. Ty zjistíme z pravděpodobnosti v jednotlivých měsících (rovnoměrné rozdělení):
období | pi |
01/2005 | 0.084931506849315 |
02/2005 | 0.076712328767123 |
03/2005 | 0.084931506849315 |
04/2005 | 0.082191780821918 |
05/2005 | 0.084931506849315 |
06/2005 | 0.082191780821918 |
07/2005 | 0.084931506849315 |
08/2005 | 0.084931506849315 |
09/2005 | 0.082191780821918 |
10/2005 | 0.084931506849315 |
11/2005 | 0.082191780821918 |
12/2005 | 0.084931506849315 |
Teoretické četnosti pak zjistíme vynásobením pravděpodobnosti s celkovým počtem výskytů.
období | pojišťovna | |
VZP (111) | OZP (207) | |
01/2005 | 2010775 | 391039 |
02/2005 | 1816184 | 353197 |
03/2005 | 2010775 | 391039 |
04/2005 | 1945911 | 378425 |
05/2005 | 2010775 | 391039 |
06/2005 | 1945911 | 378425 |
07/2005 | 2010775 | 391039 |
08/2005 | 2010775 | 391039 |
09/2005 | 1945911 | 378425 |
10/2005 | 2010775 | 391039 |
11/2005 | 1945911 | 378425 |
12/2005 | 2010775 | 391039 |
Nyní již můžeme použít χ2 test dobré shody:
období | pojišťovna | |
VZP (111) | OZP (207) | |
01/2005 | 179 | 6003 |
02/2005 | 21134 | 2652 |
03/2005 | 3662 | 1586 |
04/2005 | 124880 | 20407 |
05/2005 | 17472 | 7078 |
06/2005 | 43368 | 2805 |
07/2005 | 107600 | 12638 |
08/2005 | 58502 | 20955 |
09/2005 | 33233 | 7801 |
10/2005 | 15400 | 14974 |
11/2005 | 57932 | 23095 |
12/2005 | 31892 | 1921 |
celkem: | 515253 | 121913 |
,kde o je počet odhadnutých parametrů, v našem případě je o = 0 a k je počet kategorií, tedy pro náš případ k = 12. Sumu na pravé straně vypočteme z předchozí tabulky a kvantil na levé straně získáme z tabulek. Budeme uvažovat hladinu pravděpodobnosti 95%. Po dosazení:
Podle χ2 testu dobré shody můžeme na hladině významnosti 95% zamítnout původní hypotézu, tedy že počet vykázaných bodů během roku má rovnoměrné rozdělení. Náš původní předpoklad, se ovšem nepotvrdil. V datech je viditelný nárůst vyšetření během dubna, kdy probíhá většina viróz a menších zdravotních potíží. Oproti tomu během léta počet vyšetření rapidně klesá (nejspíše vlivem prázdnin). Tím jsme dokázali, že období kdy se lidé nechávají vyšetřit je spíše sezónní.