Jan Dohnal
(čt 14:30)

semestrální práce - M6F

zadání

Jako pozorovanou veličinu pro svou semestrální práci jsem si vybral data Zdravotního Ústavu Kolín (pobočka Praha - Dittrichova ul.). Přesněji řečeno množství vykázaných výkonových bodů (hodnocených vyšetření) různým pojišťovnám. Očekával jsem, že naměřená data budou odpovídat rovnoměrnému rozdělení. Tuto hypotézu jsem chtěl ověřit χ2 testem dobré shody.

data

Data jsou uváděna v počtech bodů (každé vyšetření má řádově sta bodů) na pojišťovnu a měsíc.

obdobípojišťovna
VZP (111)OZP (207)
01/20051991819342590
02/20051620269322590
03/20051924960366136
04/20052438867466302
05/20051823340338429
06/20052236411411005
07/20051545631320741
08/20051667797300518
09/20052200211432759
10/20052186744467559
11/20052281666471911
12/20051757539363633
celkem (n):236752544604173

řešení

Pro použití χ2 testu dobré schody potřebujeme spočítat teoretické četnosti za jednotlivé měsíce. Ty zjistíme z pravděpodobnosti v jednotlivých měsících (rovnoměrné rozdělení):

pi = počet dní v měsíci / počet dní v roce

obdobípi
01/20050.084931506849315
02/20050.076712328767123
03/20050.084931506849315
04/20050.082191780821918
05/20050.084931506849315
06/20050.082191780821918
07/20050.084931506849315
08/20050.084931506849315
09/20050.082191780821918
10/20050.084931506849315
11/20050.082191780821918
12/20050.084931506849315

Teoretické četnosti pak zjistíme vynásobením pravděpodobnosti s celkovým počtem výskytů.

obdobípojišťovna
VZP (111)OZP (207)
01/20052010775391039
02/20051816184353197
03/20052010775391039
04/20051945911378425
05/20052010775391039
06/20051945911378425
07/20052010775391039
08/20052010775391039
09/20051945911378425
10/20052010775391039
11/20051945911378425
12/20052010775391039

Nyní již můžeme použít χ2 ­ test dobré shody:

obdobípojišťovna
VZP (111)OZP (207)
01/20051796003
02/2005211342652
03/200536621586
04/200512488020407
05/2005174727078
06/2005433682805
07/200510760012638
08/20055850220955
09/2005332337801
10/20051540014974
11/20055793223095
12/2005318921921
celkem:515253121913

,kde o je počet odhadnutých parametrů, v našem případě je o = 0 a k je počet kategorií, tedy pro náš případ k = 12. Sumu na pravé straně vypočteme z předchozí tabulky a kvantil na levé straně získáme z tabulek. Budeme uvažovat hladinu pravděpodobnosti 95%. Po dosazení:


VZP: 515253.26129718 < 19.675 - hypotéza neplatí

OZP: 121913.33779887 < 19.675 - hypotéza neplatí

závěr

Podle χ2 ­ testu dobré shody můžeme na hladině významnosti 95% zamítnout původní hypotézu, tedy že počet vykázaných bodů během roku má rovnoměrné rozdělení. Náš původní předpoklad, se ovšem nepotvrdil. V datech je viditelný nárůst vyšetření během dubna, kdy probíhá většina viróz a menších zdravotních potíží. Oproti tomu během léta počet vyšetření rapidně klesá (nejspíše vlivem prázdnin). Tím jsme dokázali, že období kdy se lidé nechávají vyšetřit je spíše sezónní.

zdroje

ZÚ Kolín, pobočka Praha (4 laboratoře = AIDS, Imunologie, Parazitologie, Mykologie)