Waarnemingen normaal verdeeld? exploratief




Дата канвертавання24.04.2016
Памер44.7 Kb.




Waarnemingen normaal verdeeld?

exploratief Q-Q plot

confirmatief toets (Shapiro-Wilk)
exploratief

normale Q-Q plot hoe

waarom

andere Q-Q plots bijv. exp. verdeeld?


confirmatief

toets voor aanpassing



vaste verdeling

multinomiale verdeling

Pearson's 2

N(, 2) en 2 onbekend: Shapiro-Wilk

Exponentiële verdeling onbekend: Gini

Data-driven toetsen

normale Q-Q plot hoe?






realisaties

X1, . . . , Xn

-1.4

0.5


1.7

8.7


6.9

-0.9


-8.2

-1.9


6.2

5.9


X(1) < . . . < X(n)

-8.2

1.7


-1.9

5.9


-1.4

6.2


-0.9

6.9


0.5

8.7







-1.34

0.11


-0.91

0.35


-0.61

0.61


-0.35

0.91


-0.11

1.34



(
Excel NORMSINV)



schattingen

Achtergrond normale Q-Q plot



  1. X1, . . . , Xn o.o. N(0, 1)

dan: (X1), . . . , (Xn) o.o. Un(0, 1)


  1. U1, . . . , Un o.o. Un(0, 1)

U(1) < . . . < U(n), dan E{U(i)} =







  1. X1, . . . , Xn o.o. N(, 2)


rechte lijn r.c. , afsnijding

schatter, schatting, parameter


Q-Q plot andere verdeling

X(i) tegen

Un(0, 1) F-1(y) = y

exp(1) F-1(y) = -ln(1 – y)
X ~ lognormaal (, 2)  ln(X) ~ N(, 2)

dus onderzoek ln(X) op normaliteit!


let op: als X ~ lognormaal (, 2) dan en 2 verwachting en variantie van ln(X)!!
Normale Q-Q plot:

afsnijding y-as: schatter van

r.c.: schatter van

Bij andere verdelingen i.h.a. niet!!

Vb. Uniforme Q-Q plot punten rond de lijn y = 5x – 2. Dit betekent: ~ Un(0, 1) en dus en , terwijl afsnijding = – 2 .
Dikke staarten: Dunne staarten:
Confirmatieve fase: toetsen voor aanpassing
X1, …, Xn o.o. verdelingsfunctie F

H0: F = F0 H1: FF0
N1 N2 . . . . . . Nk
A1 A2 . . . . . . Ak
pi = P(XAi) en E(Ni) = npi als X verdelingsfunctie F0
groot  Ni lijkt niet erg op npiFF0
P(2x)  P(x) als n groot
Onbetrouwbaarheid   kies de kritieke waarde c zodat P(c) =

Model

(N1, . . . , Nk) ~ multinomiaal verdeeld




X vdf. F0 dan P(XAi) = pi
H0: (1, . . . , k) = (p1, . . . , pk)

H1: (1, . . . , k)  (p1, . . . , pk)
Vb. omzetcijfers 3583, 75
"uniform"?

42 waarnemingen:

9, 9, 5, 3, 5, 4, 0, 7, 4, 8, 1, 8, 4, 4, 2, 2, 7, 8, 8, 2, 7, 6, 5, 6, 6, 2, 3, 8, 9, 8, 5, 1, 2, 5, 2, 6, 7, 2, 7, 5, 0, 9
5 klassen: {0, 1}, {2, 3}, {4, 5}, {6, 7}, {8, 9}

 = 0.05


  1. (N1, . . . , N5) ~ multinomiaal (42, 1, . . . , 5) verdeeld met N1: aantal waarnemingen in {0, 1}, . . . , N5: aantal waarnemingen in {8, 9}

  2. H0: (1, . . . , 5) = (1/5, . . . , 1/5)

H1: (1, . . . , 5)  (1/5, . . . , 1/5)



  1. de toetsingsgrootheid heeft onder H0 bij benadering een chi-kwadraat verdeling met 4 vrijheidsgraden.

  2. waarde 2:



  1. kritieke waarde: 9.49

kritiek gebied: [9.49, )

  1. verwerp H0 niet, want 3 < 9.49

  2. statistisch gezien is er niet voldoende reden om de uniformiteit van de "guldens" in de omzetcijfers tegen te spreken.

toetsen op normaliteit NIET met Pearson's 2!!

Totaal aantal gewonde brandweerlieden per jaar

275 197 229 187 165 129 150 134 128 106

Toets van Shapiro Wilk  = 0.05


  1. X1, …, X10 o.o. s.v.-en met verdelingsf. F

  2. H0: FN met N de klasse van alle normale verdelingen; H1: FN

  3. W = met ai uit de tabel van de Shapiro-Wilk toets

  4. Shapiro-Wilk verdeling

  5. ordenen: 106 128 129 134 150 165 187 197 229 275


0.5739 × (275-106) = 96.9891

0.3291 × (229-128) = 33.2391

0.2141 × (197-129) = 14.5588

0.1224 × (187-134) = 6.4872

0.0399 × (165-150) = 0.5985



151.8727




  1. kritieke waarde 0.842; kritiek gebied [0, 0.842)

  2. verwerp H0 niet, want 0.9306 > 0.842

  3. statistisch gezien is er niet voldoende reden om de normaliteit van de waarnemingen te weerspreken.

Gini


25 waarnemingen (geordend): 0.0281, 0.0348, 0.0448 etc. = 0.05

  1. X1, …, X25 o.o. s.v.-en met vdf. F

  2. H0: FE met E de klasse van alle exponentiële verdelingen; H1: FE

  3. toetsingsgrootheid

  4. Gini verdeling

  5. 0.555

  6. Kritieke waarden:

, ;

kritiek gebied:



  1. Verwerp H0 niet, want 0.385 < 0.555 < 0.615

  2. Statistisch gezien is er geen reden om exponentialiteit te ontkennen.

Data driven toetsen voor normaliteit en exponentialiteit.

“vertalen naar uniforme verdeling”

Neyman’s toetsen

keuze “dimensie”
Transformaties


  • interpreteerbaarheid


1

op X

Y liter per 100 km
groei ln

  • asymmetrie

midden

vergelijken verschillende data sets



  • varianties stabiliseren bij verschillende steekproeven

  • specifiek patroon in residuen verwijderen

Machtstransformaties





effect p > 1 groot uit elkaar

klein in elkaar



p < 1 groot in elkaar

klein uit elkaar


База данных защищена авторским правом ©shkola.of.by 2016
звярнуцца да адміністрацыі

    Галоўная старонка